Rag

RAG

检索增强生成模型

简介

RAG 技术意味着在生成数据前将检索到的高质量数据作为上下文提供给模型,以减少幻觉,获得更好的生成质量。在实践中,通常首先要将文档及相关数据以向量化或文档搜索的方式储存在数据库中,如:pgvector 等。在收到给定提示后,数据库会被调取以检索相关文档,然后这些文档会与提示结合在一起,为 LLM 提供更丰富的上下文。

相关限制:模型的上下文大小。


Copyright © 2024 Lionad - CC-BY-NC-CD-4.0