#77- Ring Attention e janelas de contexto de 1M, o RAG está morto?

07/03/2024 17 min

Ouvir "#77- Ring Attention e janelas de contexto de 1M, o RAG está morto?"

Descargar episodio Ver en sitio original

Sinopse do Episódio

Fala galera, nesse episódio eu explico como a gente consegue escalar a janela de contexto de um LLM pra mais de 1 milhão de tokens usando Ring Attention. Além disso eu discuto se a abordagem usando RAG está morta com esses avanços na janela de contexto.

Paper Lost in the Middle: https://arxiv.org/pdf/2307.03172.pdf
Gemini technical report: https://storage.googleapis.com/deepmind-media/gemini/gemini_v1_5_report.pdf
Paper Ring Attention: https://arxiv.org/pdf/2310.01889.pdf
Instagram do podcast: https://www.instagram.com/podcast.lifewithai
Linkedin do podcast: https://www.linkedin.com/company/life-with-ai

Mais episódios do podcast Vida com IA

#140- A corrida dos LLMs. 11/12/2025

#139- A história da DeepMind e Demis Hassabis com Fabrício Carraro. 04/12/2025

#138- Nano Banana Pro e a evolução dos modelos de imagem. 27/11/2025

#137- Dicas de prompt. 20/11/2025

#136- Reinforcement Learning. 13/11/2025

#135- IA e estudos, como se manter atualizado! 06/11/2025

#134- DeepSeek OCR é bom mesmo?? 30/10/2025

#133- A diferença dos benchmarks da literatura para os problemas da indústria. 23/10/2025

#132- História dos LLMs. 16/10/2025

#131- Qual a diferença entre um LLM, um workflow e um agente? 02/10/2025

Ver todos los episodios