Ouvir "Episódio 012: Big Data"
Sinopse do Episódio
Agradecimento especial aos nossos Parceiros
Esse episódio não seria possível sem o apoio especial dos nossos parças do Data Bootcamp, o maior bootcamp de Data Science do Brasil! Aprenda a organizar, extrair e interpretar os dados da sua empresa com as tecnologias mais avançadas usadas no mercado. Confira as datas dos próximos cursos em https://databootcamp.com.br/calendar.
Os padrinhos desse episódio
Esse episódio não teve padrinhos. Se você quiser apadrinhar episódios do Pizza manda um e-mail pra gente.
Tópicos abordados neste episódio
Quem são e o que fazem nossos convidados
Big Data além da hype
Diferenças entre Big Data e Análise de Dados tradicional
Ferramentas para trabalhar com big data
Escute agora
Pessoas nesse episódio
Leticia Portella
Twitter
Jessica Temporal
Twitter
Gustavo Coelho
Twitter
Diogo Munaro
Twitter
Renan Oliveira
Twitter
Apoie o pizza:
Nós também temos uma campanha de financiamento recorrente para ajudar a pagar a edição dos episódios. Se você gosta do nosso trabalho considere doar.
Apoiar o Pizza
Links
Coisas que mencionamos durante esse episódio:
#PerguntaProPizza
#PerguntaProPizza
Uma thread no twitter da Leticia Silva com vários cursos
Boas práticas para reproducibilidade de pesquisa (em ingles)
Google Datasets: tipo google scholar mas para datasets
O DJ Patil, em conjunto com mais dois autores, lançaram um livro (em inglês) sobre ética e data science link pro tweet e o link pro livro na loja da Amazon Brasileira
Big Data
Aprendizado de Máquina ou Machine Learning
BI (business intelligence)
Pentaho
Técnicas de ETL (Extract, Transform and Load)
Data Lake e Data warehouse
Open Source
Hadoop
Kafka
Hive
Parquet
Spark
Map Reduce
Pig
HDFS
Barramento
Data Locality
Pandas
DevOps
JVM ou Máquina Virtual Java
Série Temporal
Cross Validation ou Validação Cruzada
Reinforcement Learning ou Aprendizado por Reforço
K-fold
Overfitting ou Sobreajuste
Python
Scala
Serveless
Cluster
React
CRUD
Serenata de Amor
Kaggle
GitHub
T-Test ou teste de T de Student
Teste multivariado e Teste A/B
Brasil.io
Pérolas?! Temos muitas
Eu trabalho com big data desde antes de ser legal
big data é tudo que é grande o suficiente pra quebrar o excel
já vi o hadoop voar, mas nunca vi o kafka cair
eu já tive tantos nomes… ninguém me chama de diogo
Tentativa e erro?!
Edição
Esse episódio foi editado pelo Johnny. Valeu Johnny!
Escute:
Esse episódio não seria possível sem o apoio especial dos nossos parças do Data Bootcamp, o maior bootcamp de Data Science do Brasil! Aprenda a organizar, extrair e interpretar os dados da sua empresa com as tecnologias mais avançadas usadas no mercado. Confira as datas dos próximos cursos em https://databootcamp.com.br/calendar.
Os padrinhos desse episódio
Esse episódio não teve padrinhos. Se você quiser apadrinhar episódios do Pizza manda um e-mail pra gente.
Tópicos abordados neste episódio
Quem são e o que fazem nossos convidados
Big Data além da hype
Diferenças entre Big Data e Análise de Dados tradicional
Ferramentas para trabalhar com big data
Escute agora
Pessoas nesse episódio
Leticia Portella
Jessica Temporal
Gustavo Coelho
Diogo Munaro
Renan Oliveira
Apoie o pizza:
Nós também temos uma campanha de financiamento recorrente para ajudar a pagar a edição dos episódios. Se você gosta do nosso trabalho considere doar.
Apoiar o Pizza
Links
Coisas que mencionamos durante esse episódio:
#PerguntaProPizza
#PerguntaProPizza
Uma thread no twitter da Leticia Silva com vários cursos
Boas práticas para reproducibilidade de pesquisa (em ingles)
Google Datasets: tipo google scholar mas para datasets
O DJ Patil, em conjunto com mais dois autores, lançaram um livro (em inglês) sobre ética e data science link pro tweet e o link pro livro na loja da Amazon Brasileira
Big Data
Aprendizado de Máquina ou Machine Learning
BI (business intelligence)
Pentaho
Técnicas de ETL (Extract, Transform and Load)
Data Lake e Data warehouse
Open Source
Hadoop
Kafka
Hive
Parquet
Spark
Map Reduce
Pig
HDFS
Barramento
Data Locality
Pandas
DevOps
JVM ou Máquina Virtual Java
Série Temporal
Cross Validation ou Validação Cruzada
Reinforcement Learning ou Aprendizado por Reforço
K-fold
Overfitting ou Sobreajuste
Python
Scala
Serveless
Cluster
React
CRUD
Serenata de Amor
Kaggle
GitHub
T-Test ou teste de T de Student
Teste multivariado e Teste A/B
Brasil.io
Pérolas?! Temos muitas
Eu trabalho com big data desde antes de ser legal
big data é tudo que é grande o suficiente pra quebrar o excel
já vi o hadoop voar, mas nunca vi o kafka cair
eu já tive tantos nomes… ninguém me chama de diogo
Tentativa e erro?!
Edição
Esse episódio foi editado pelo Johnny. Valeu Johnny!
Escute:
Mais episódios do podcast Pizza de Dados
Episódio 051: Colonialismo de dados
27/09/2023
Episódio 050: Data Lake
04/09/2023
Episódio 049: Segmentação de audiência
19/08/2023
Episódio 048: IAs generativas
25/05/2023
PNE 004: PyCon US - Carla Florida
18/04/2023
PNE 003: PyCon US - Trist’n Joseph
16/04/2023
PNE 002: PyCon US - Marco Carranza
14/04/2023
PNE 001: PyCon US - Lorena Mesa
12/04/2023
Episódio 047: Modelos preditivos pra saúde
21/03/2023
Episódio 046: Gerenciando Produtos de Dados
27/01/2023
ZARZA We are Zarza, the prestigious firm behind major projects in information technology.