Dados mostram o
futuro das empresas: aprenda a guiá-las
com Databricks.

Aprenda Databricks e entenda como usar a plataforma para otimizar processos de gestão de dados e gerar insights com ajuda da AI.

Dados mostram o
futuro das empresas: aprenda a guiá-las
com Databricks.

Aprenda Databricks e entenda como usar a plataforma para otimizar processos de gestão de dados e gerar insights com ajuda da AI.

Dados mostram o futuro das empresas: aprenda a guiá-las com Databricks.

Aprenda Databricks e entenda como usar a plataforma para otimizar processos de gestão de dados e gerar insights com ajuda da AI.

O que você ganha?

Curso 100%
online e ao vivo

Certificado de
participação

Exercícios
práticos

O que você ganha?

Curso 100%
online e ao vivo

Certificado de
participação

Exercícios
práticos

Selo Garantia de 7 dias

Compre com confiança! Se você não estiver completamente satisfeito com o curso em até 7 dias, devolvemos seu dinheiro sem burocracia. Estamos comprometidos com sua satisfação.

Selo Garantia de 7 dias

Compre com confiança! Se você não estiver completamente satisfeito com o curso em até 7 dias, devolvemos seu dinheiro sem burocracia. Estamos comprometidos com sua satisfação.

Selo Garantia de 7 dias

Compre com confiança! Se você não estiver completamente satisfeito com o curso em até 7 dias, devolvemos seu dinheiro sem burocracia. Estamos comprometidos com sua satisfação.

Este treinamento
é para mim?

Este treinamento é destinado a pessoas que têm interesse na carreira de engenheiro de dados e querem um diferencial no currículo ou que são cientistas de dados e querem aprender a trabalhar com ferramentas de Big Data. 

Ao final do treinamento, você será capaz de:

Compreender o Databricks

Ter uma visão clara sobre o que é o Databricks, suas principais diferenças em relação a outras ferramentas de processamento de dados e as responsabilidades de um Engenheiro de Dados.

Arquitetura de Dados

Distinguir entre estruturas de dados relacionais e não relacionais, entender a função de Data Lakes e Data Warehouses, e conhecer os componentes essenciais do ambiente Databricks, como Cluster, Workspace, Notebooks e Jobs.

Gestão de Custos e Preços

Saber como funcionam os modelos de preços do Databricks e desenvolver habilidades para otimizar os custos em ambientes de Data Lake, além de adotar as melhores práticas para monitorar e gerenciar despesas.

Utilização de Funcionalidades

Explorar Notebooks no Databricks, realizar análises e visualizações de dados, integrar serviços de armazenamento como Azure Blob e AWS S3, e colaborar de forma eficaz com as equipes por meio das funcionalidades de compartilhamento.

Compartilhamento e Integração de Dados

Compreender o Delta Sharing e suas vantagens, como funciona o compartilhamento em tempo real de dados entre organizações, e conhecer os conceitos de ACLs (Access Control Lists), linhagem de dados e recursos como Repos e Workflows.

Integrar e conectar Fontes de Dados

Conectar-se a bancos de dados e sistemas de armazenamento, configurar fontes de dados de diferentes tipos e integrar o Databricks com ferramentas de BI, como Power BI e Tableau.

Propostas de Ingestão de Dados

Implementar estratégias de ingestão de dados, incluindo Change Data Capture (CDC) com Spark, streaming de dados e processamento de dados em batch.

O que você irá aprender

  • O que é o Databricks?
  • Papéis e responsabilidades de um Engenheiro de Dados
  • Comparação com outras ferramentas de processamento de dados
  • Estruturas de Dados: Relacional vs. Não Relacional
  • Data Lakes e Data Warehouses
  • Diferença entre Spark e Databricks
  • Componentes principais: Cluster, Workspace, Notebooks e Jobs
  • Modelos de preços do Databricks (consumo, capacidade reservada, etc.)  
  • Como otimizar custos em ambientes de Data Lake  
  • Melhores práticas para monitorar e gerenciar os custos  
  • Explorando Notebooks e sua interface  
  • Análise e visualização de dados com Databricks  
  • Integração com serviços de armazenamento (Azure Blob, AWS S3, etc.)  
  • Recursos de colaboração e compartilhamento entre equipes  
  • Definição e benefícios do Delta Sharing  
  • Como funciona o compartilhamento em tempo real de dados entre organizações  
  • Catalog – O que são ACLs (Access Control Lists)  
  • Catalog – Linhagem de dados  
  • Repos  
  • Delta Live Tables  
  • Workflow  
  • Volume  
  • Conexão com bancos de dados e sistemas de armazenamento  
  • Configuração de fontes de dados, como bases relacionais e NoSQL  
  • Integração com ferramentas de BI (Power BI, Tableau, etc.)  
  • Delta Sharing  
  • CDC com Spark 
  • Streaming de dados  
  • Dados em Batch  

Databricks Fundamental

Databricks em ação – principais conceitos e funcionalidades

Databricks Avançado

Databricks avançado – Otimização e Performance na ferramenta