AI项目拆解:大厂RAG知识库智能问答系统
骞信布道者的
2025-04-01 16:42:29
今天给大家拆解一下基于 RAG 构建的电商知识库智能问答系统📖。
.
一、什么是 RAG❓
RAG 全称 Retrieval-Augmented Generation,翻译成中文是检索增强生成。检索指的是检索外部知识库,增强生成指的是将检索到的知识送给大语言模型以此来优化大模型的生成结果,使得大模型在生成更精确、更贴合上下文答案的同时,也能有效减少产生误导性信息的可能。
.
二、为什么需要 RAG❓
之所以需要 RAG,是因为大语言模型本身存在一些局限性。
1.时效性
模型的训练是基于截至某一时间点之前的数据集完成的。这意味着在该时间点之后发生的任何事件、新发现、新趋势或数据更新都不会反映在模型的知识库中。
2.覆盖性
虽然大模型的训练数据集非常庞大,但仍可能无法涵盖所有领域的知识或特定领域的深度信息。当我们问的问题的答案没有包含在大模型的训练数据集中时,这时候大模型在回答问题时便会出现幻觉,答案也就缺乏可信度。
.
三、RAG 的流程📍
✔️检索: 根据用户的查询内容,从外挂知识库获取相关信息。具体来说,就是将用户的查询通过嵌入模型转换成向量,以便与向量数据库中存储的知识相关的向量进行比对。通过相似性搜索,从向量数据库中找出最匹配的前 K 个数据。
✔️增强: 将用户的查询内容和检索到的相关知识一起嵌入到一个预设的提示词模板中。
✔️生成: 将经过检索增强的提示词内容输入到大语言模型(LLM)中,以此生成所需的输出。
0
阅读:0