Ouvir "Episódio 009: Sobre Crawlers e Scrapers"
Sinopse do Episódio
O que são crawlers, spiders e scraping? Nesse incrível episódio nossos lindos convidados Valdir Stumm Junior e Elias Dorneles vão nos ensinar algumas coisas sobre esse mundo de coleta de dados! Esse é o primeiro episódio com dois convidados, será que vai dar certo? Agradecemos ao Data Bootcamp pelo apoio e patrocínio desse episódio!
Agradecimento especial aos nossos Parceiros
Esse episódio não seria possível sem o apoio especial dos nossos parças do Data Bootcamp, o maior bootcamp de Data Science do Brasil! Aprenda a organizar, extrair e interpretar os dados da sua empresa com as tecnologias mais avançadas usadas no mercado. Confira as datas dos próximos cursos no calendário.
Os padrinhos desse episódio
Esse episódio não teve padrinhos. Se você quiser apadrinhar episódios do Pizza manda um e-mail pra gente.
Tópicos abordados neste episódio
Quem são e o que fazem nossos convidados
Definição de Crawler (Rastejador)
Diferença entre crawling e scrapping (rastejar e raspar)
Frameworks de raspagem
Escute agora
Pessoas nesse episódio
Leticia Portella
Twitter
Jessica Temporal
Twitter
Gustavo Coelho
Twitter
Valdir Stumm Júnior
Twitter
Elias Dorneles
Email
Apoie o pizza:
Nós também temos uma campanha de financiamento recorrente para ajudar a pagar a edição dos episódios. Se você gosta do nosso trabalho considere doar.
Apoiar o Pizza
Links
Coisas que mencionamos durante esse episódio:
#PerguntaProPizza
Canal do Pizza no Youtube
Data Bootcamp
Visidata
Histogramas interativos
API da Marvel
IMDB
Crawler
API
HTML
JSON
OCR
Captcha
Bot do Google
Archive.org
SEO
Grafos
Requests
URLlib
BeautifulSoup
lxml
Scrapy
Apache Nutch
Expressões Regulares Regex
Parsing
XPath
CSS
Seletores CSS como Game
Seletores CSS
Tutorial “bão” de XPath
Como “pensar” em XPath
Middlewares do Selenium para Scrapy
Generators
parsel
Selenium
Headless
AJAX
Pérolas?! Temos muitas
Eu acho que o arrastão tem mais… pulsância!
A gente passou um passo na frente da língua inglesa
Tive meu momento de scrapear, crawlear
Acho que eu já incomodei todo mundo que tá aqui com isso
Tem essa bagunça completa que é a web
Atenção crianças essa foi uma explicação sobre o uso avançado de ferramentas
É muito abre-te sésamo tá ligado?
Achou que o pizza ia ser fácil?
Só agora que eu entendi veih
Edição
Esse episódio foi editado pelo Johnny. Valeu Johnny!
Escute:
Agradecimento especial aos nossos Parceiros
Esse episódio não seria possível sem o apoio especial dos nossos parças do Data Bootcamp, o maior bootcamp de Data Science do Brasil! Aprenda a organizar, extrair e interpretar os dados da sua empresa com as tecnologias mais avançadas usadas no mercado. Confira as datas dos próximos cursos no calendário.
Os padrinhos desse episódio
Esse episódio não teve padrinhos. Se você quiser apadrinhar episódios do Pizza manda um e-mail pra gente.
Tópicos abordados neste episódio
Quem são e o que fazem nossos convidados
Definição de Crawler (Rastejador)
Diferença entre crawling e scrapping (rastejar e raspar)
Frameworks de raspagem
Escute agora
Pessoas nesse episódio
Leticia Portella
Jessica Temporal
Gustavo Coelho
Valdir Stumm Júnior
Elias Dorneles
Apoie o pizza:
Nós também temos uma campanha de financiamento recorrente para ajudar a pagar a edição dos episódios. Se você gosta do nosso trabalho considere doar.
Apoiar o Pizza
Links
Coisas que mencionamos durante esse episódio:
#PerguntaProPizza
Canal do Pizza no Youtube
Data Bootcamp
Visidata
Histogramas interativos
API da Marvel
IMDB
Crawler
API
HTML
JSON
OCR
Captcha
Bot do Google
Archive.org
SEO
Grafos
Requests
URLlib
BeautifulSoup
lxml
Scrapy
Apache Nutch
Expressões Regulares Regex
Parsing
XPath
CSS
Seletores CSS como Game
Seletores CSS
Tutorial “bão” de XPath
Como “pensar” em XPath
Middlewares do Selenium para Scrapy
Generators
parsel
Selenium
Headless
AJAX
Pérolas?! Temos muitas
Eu acho que o arrastão tem mais… pulsância!
A gente passou um passo na frente da língua inglesa
Tive meu momento de scrapear, crawlear
Acho que eu já incomodei todo mundo que tá aqui com isso
Tem essa bagunça completa que é a web
Atenção crianças essa foi uma explicação sobre o uso avançado de ferramentas
É muito abre-te sésamo tá ligado?
Achou que o pizza ia ser fácil?
Só agora que eu entendi veih
Edição
Esse episódio foi editado pelo Johnny. Valeu Johnny!
Escute:
Mais episódios do podcast Pizza de Dados
Episódio 051: Colonialismo de dados
27/09/2023
Episódio 050: Data Lake
04/09/2023
Episódio 049: Segmentação de audiência
19/08/2023
Episódio 048: IAs generativas
25/05/2023
PNE 004: PyCon US - Carla Florida
18/04/2023
PNE 003: PyCon US - Trist’n Joseph
16/04/2023
PNE 002: PyCon US - Marco Carranza
14/04/2023
PNE 001: PyCon US - Lorena Mesa
12/04/2023
Episódio 047: Modelos preditivos pra saúde
21/03/2023
Episódio 046: Gerenciando Produtos de Dados
27/01/2023
ZARZA We are Zarza, the prestigious firm behind major projects in information technology.