Rag
RAG
检索增强生成模型
简介
RAG 技术意味着在生成数据前将检索到的高质量数据作为上下文提供给模型,以减少幻觉,获得更好的生成质量。在实践中,通常首先要将文档及相关数据以向量化或文档搜索的方式储存在数据库中,如:pgvector 等。在收到给定提示后,数据库会被调取以检索相关文档,然后这些文档会与提示结合在一起,为 LLM 提供更丰富的上下文。
相关限制:模型的上下文大小。
落地经验
- 快速冷启动(Vector KB):
- 场景:电商搭建售后机器人。
- 做法:导入产品手册、退换货政策PDF。 -收益:1-2周上线,解决80%常见语义匹配问题。
- 阶段二:精度调优(Hybrid Search): -场景:用户反馈搜不到特定型号参数。 -做法:引入关键词搜索与向量搜索结合。 -收益:确保专有名词的精确匹配。
- 阶段三:引入图谱(Knowledge Graph):
- 场景:处理兼容性咨询。
- 做法:构建小规模图谱,定义适配关系。
- 收益:利用图的逻辑推理能力,给出准确回答。
见:知识库(Knowledge Base)与知识图谱(Knowledge Graph)到底该怎么选? @tataqiuqiu