Definition
Retrieval-Augmented Generation (RAG) är en teknik som kombinerar generativa modeller med informationssökningssystem. Den baserar resultaten på externa källor för att förbättra faktamässig noggrannhet.
Syfte
Syftet är att minska hallucinationer i generativ AI genom att utöka svaren med hämtade dokument. Det är särskilt användbart vid besvarande av frågor och kunskapsintensiva uppgifter.
Betydelse
- Förbättrar faktamässig noggrannhet i LLM-resultat.
- Möjliggör domänspecifik kunskapsintegration.
- Kräver pålitliga återvinningssystem.
- Relaterat till hybridsökning och QA med öppen domän.
Så fungerar det
- Användaren tillhandahåller en fråga eller uppmaning.
- Hämtningssystemet hämtar relevanta dokument.
- Dokumenten överförs till en generativ modell.
- Modellen genererar svar baserade på hämtat innehåll.
- Återkopplingsslingor förbättrar framtida prestanda.
Exempel (verkliga världen)
- OpenAI ChatGPT med plugin-program för surfning eller hämtning.
- Meta RAG-modell: forskning om retrieval-grounded LLMs.
- Perplexity AI: hämtningsförstärkt konversationssökning.
Referenser / Vidare läsning
- Lewis et al. ”Retrieval-Augmented Generation för kunskapsintensiv NLP.” NeurIPS 2020.
- Implementering av RAG för kramande ansikten.
- Stanford HAI-forskning om hämtningsmetoder.
- Vad är RAFT? RAG + Finjustering