RAG - 检索增强生成
概述
什么是 RAG
RAG(Retrieval-Augmented Generation) 即检索增强生成
,将信息检索与文本生成相结合,是一种结合向量检索与大语言模型生成能力的框架。核心理念是先检索,再生成。
RAG 不是模型本身,而是一种“让大模型拥有私有知识的能力架构”,属于生成式 AI 应用层最关键的落地路径之一。
核心价值
RAG 的核心价值在于解决了 LLM 的三大痛点
- 知识固化:预训练数据无法实时更新
- 幻觉问题:生成内容缺乏事实依据
- 领域局限:难以直接处理专业领域问题
标准流程结构
- 读取用户输入提示词
- 将问题转化为向量
- 在向量数据库中找相关文档
- 对数据进行截取,清洗等
- 基于原始提问 + 检索内容生成答案