重排模型:重排模型通过对初始检索结果进行更深入的相关性评估和排序确保最终展示给用户的结果更加符合其查询意图。这一过程通常由深度学习模型实现如Cohere模型。这些模型会考虑更多的特征如查询意图、词汇的多重语义、用户的历史行为和上下文信息等。
聊聊炙手可热的Rag:产生原因、基本原理与实施路径 经过第二阶段的优化答案生成的相关性和准确度都会大幅提升但是仍然会有较大概率出现答非所问的情况我们还需要对系统做更进一步的优化。 第阶段很好用即系统回答的准确率达到用户满意水平 下面风叔介绍一些更高级的Rag优化策略。
1知识分块与索引 虽然在第二阶段我们通过索引降噪、多级索引、HYDE等方 阿根廷电话号码列表 式大幅提升了知识库的准确度但是按固定字符切有时候会遇到句子含义联系比较紧密的片段被切分成了两条数据导致数据质量比较差。
这个情况下可以尝试训练专门的语义理解小模型然后使用实际语义进行句子拆分使拆分出来的知识片段语义更加完整。 另外一种方法是构建元数据增加内容摘要、时间戳、用户可能提出的问题等附加信息来丰富知识库而元数据不需要被向量化。
此外我们还可以添加诸如章节或小节的引用文本的关键信息、小节标题或关键词等作为元数据有助于改进知识检索的准确性。 还有一种更加有效的方式是建立知识图谱。嵌入模型虽然简单但是没法有效捕捉实体之间的复杂关系和层次结构所以导致传统RAG在面对复杂查询的时候特别吃力。