Skip to content

RAG - 检索增强生成

概述

什么是 RAG

RAG(Retrieval-Augmented Generation) 即检索增强生成 ,将信息检索与文本生成相结合,是一种结合向量检索与大语言模型生成能力的框架。核心理念是先检索,再生成。

RAG 不是模型本身,而是一种“让大模型拥有私有知识的能力架构”,属于生成式 AI 应用层最关键的落地路径之一。

核心价值

RAG 的核心价值在于解决了 LLM 的三大痛点

  1. 知识固化:预训练数据无法实时更新
  2. 幻觉问题:生成内容缺乏事实依据
  3. 领域局限:难以直接处理专业领域问题

标准流程结构

  1. 读取用户输入提示词
  2. 将问题转化为向量
  3. 在向量数据库中找相关文档
  4. 对数据进行截取,清洗等
  5. 基于原始提问 + 检索内容生成答案

developed using VitePress.