检索增强生成(Retrieval-Augmented Generation, RAG)

定义

  • 在生成式模型前引入检索模块,从外部知识库检索相关证据,并将其与用户查询一并输入生成模型,以提升事实性、时效性与可解释性。

流程

工程关注

  • 召回率/精排质量、拒答机制、证据引用、去重与缓存、长上下文与 GGUF模型量化 的部署配合。