检索增强生成(Retrieval-Augmented Generation, RAG) 定义 在生成式模型前引入检索模块,从外部知识库检索相关证据,并将其与用户查询一并输入生成模型,以提升事实性、时效性与可解释性。 流程 索引构建 → 检索 → 重排 → 生成 → 反馈与监控; 关键组件:文本向量化技术、向量索引与检索、重排器、生成模型与评估监控。 工程关注 召回率/精排质量、拒答机制、证据引用、去重与缓存、长上下文与 GGUF模型量化 的部署配合。