Ouvir "#84- FineWeb, o melhor dataset pra pre-treinar LLMs."
Sinopse do Episódio
Fala galera, nesse episódio do podcast eu falo sobre o dataset FineWeb, o melhor dataset open source de pre-treinamento existente até hoje. No episódio eu explico como eles fizeram a curadoria do dataset e um pouco dos resultados.
Link pro grupo do whatsapp: https://chat.whatsapp.com/GNLhf8aCurbHQc9ayX5oCP
Link do blog da huggingface: https://huggingface.co/spaces/HuggingFaceFW/blogpost-fineweb-v1
Instagram do podcast: https://www.instagram.com/podcast.lifewithai
Linkedin do podcast: https://www.linkedin.com/company/life-with-ai
Link pro grupo do whatsapp: https://chat.whatsapp.com/GNLhf8aCurbHQc9ayX5oCP
Link do blog da huggingface: https://huggingface.co/spaces/HuggingFaceFW/blogpost-fineweb-v1
Instagram do podcast: https://www.instagram.com/podcast.lifewithai
Linkedin do podcast: https://www.linkedin.com/company/life-with-ai
Mais episódios do podcast Vida com IA
#128- Embeddings e vetores de alta dimensão.
04/09/2025
#127- Como eu uso vibe coding e Cursor.
28/08/2025
#126- Contratações milionárias na Meta.
21/08/2025
#125- GPT5.
14/08/2025
#123- Como a Alexa funciona?
31/07/2025