Delta Lake: Storage Engine Escalável para Construção de um Data Lakehouse

26/08/2021 51 min Temporada 1 Episodio 15
Delta Lake: Storage Engine Escalável para Construção de um Data Lakehouse

Ouvir "Delta Lake: Storage Engine Escalável para Construção de um Data Lakehouse"

Sinopse do Episódio

O Delta Lake é uma engine de armazenamento otimizado para construção de projetos de Big Data e Analytics especialmente desenhado para o Apache Spark.A engine foi criada para armazenar grandes quantidades de dados (Data Lake) e também organizar dados em formas de tabelas (Data Warehouse), dessa forma a consulta dentro desse formato de arquivo pode ser indexada de forma eficiente.Além disso, diversos recursos foram adicionados como - transações acid, viagem no tempo (time travel), auditoria, operações de dml (insert, update, delete e merge) e outros recursos valiosos para operações em grandes massas de dados. Luan Moreno = https://www.linkedin.com/in/luanmoreno/

Mais episódios do podcast Engenharia de Dados [Cast]