Programa do Curso

Introdução ao Apache Kylin

  • Visão geral de OLAP e sua importância na análise de big data
  • Evolução do Apache Kylin e sua arquitetura
  • Principais características e capacidades do Kylin 50

Configurando o Apache Kylin

  • Pré-requisitos de instalação e configuração do ambiente
  • Configurando o Kylin com Hadoop, Spark e Kafka
  • Entendendo a interface web e as ferramentas de linha de comando do Kylin

Modelagem de Dados no Kylin

  • Projeto de esquemas estrela e floco de neve para cubos OLAP
  • Definindo dimensões e medidas
  • Criando e gerenciando modelos de dados na interface web do Kylin

Criação e Gerenciamento de Cubos

  • Processo de criação de cubos e gerenciamento de trabalhos
  • Construções incrementais e estratégias de auto-mesclagem
  • Monitorando a saúde e o desempenho dos cubos

Análise em Tempo Real com Kylin

  • Integração do Kafka como fonte de dados em tempo real
  • Configurando cubos em tempo real e modelos de fusão
  • Atingindo análises de baixa latência com dados em fluxo

Consultas e Análise

  • Executando consultas SQL usando a interface de consulta do Kylin
  • Conectando ferramentas BI (por exemplo, Tableau, Power BI) ao Kylin
  • Realizando análises multidimensionais e drill-downs

Otimização de Desempenho

  • Melhores práticas para design e agregação de cubos
  • Gestão e ajuste de recursos para escalabilidade
  • Solucionando problemas comuns de desempenho

Tópicos Avançados

  • Segurança e controle de acesso no Kylin
  • Extendendo o Kylin com plugins personalizados e integrações
  • Explorando as APIs REST do Kylin para automação

Resumo e Próximos Passos

Requisitos

  • Compreensão de Hadoop e ecossistemas de big data
  • Familiaridade com SQL e conceitos de armazenamento de dados
  • Noções básicas de plataformas de dados em fluxo como o Kafka

Público-alvo

  • Engenheiros de big data que buscam implementar soluções de análise em tempo real
  • Analistas de dados com objetivo de aproveitar as capacidades OLAP em conjuntos de dados grandes
  • Arquitetos de data warehouse interessados em modernizar sua infraestrutura
 14 Horas

Declaração de Clientes (5)

Próximas Formações Provisórias

Categorias Relacionadas