RAG各个环节的原理

2025-09-26 2025-09-27 AIGC RAG 6

早期（Naive RAG）RAG在实操时，会出现各种各样的问题。如准确率低，可能出现幻觉，召回率低，导致信息不完整，过时或者冗余的信息导致检索结果不准确。

现在的RAG（Advanced RAG）在早期rag的基础上进行了改进，充分利用各个环节的优势，提高效率和质量。

检索前：增强数据粒度：修订和简化数据内容，确保正确性和可读性，删除不相关的信息和歧义，如使用Pypdf进行pdf处理，中文分词时使用jieba库或word2vec库进行分词，维护上下文连贯性。
优化索引结构：调整chunk大小以捕捉相关上下文，简历知识图谱（graph结构）

对于复杂问题，如果只使用rag会造成不准确，所以要配合agent来解决。如下图：

该图中，首先将问题（query）过一次LLM，用LLM将用户的复杂问题拆解成多个简单的小问题，然后由agents区解决这些问题，如从数据库中查找，从网上查找等，将查找到的数据进行reank，然后多路找回，再结合LLM生成答案。

一、RAG与微调

什么时候用微调：

什么时候用RAG:

RAG各个环节的原理

https://www.bytecanvas.top/archives/duusxEJQ

作者

禧语许

发布于

2025-09-26

更新于

2025-09-27

许可

AIGC RAG