RAG详解

xyyf

于 2025-06-13 21:54:46 发布

阅读量434

点赞数 4

CC 4.0 BY-SA版权

文章标签： ai

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/feng_ling_01/article/details/148619264

1.什么是RAG

RAG 是 Retrieval-Augmented Generation（检索增强生成）是一种结合信息检索与生成模型的技术框架，主要用于提升人工智能系统（尤其是大语言模型）在生成内容时的准确性和可靠性。

2.RAG解决什么难题？

幻觉问题：传统生成模型可能编造不实信息（如错误日期、虚构事实），RAG通过引入实时检索结果，减少错误。

知识滞后性：模型预训练数据可能过时，RAG可动态获取最新信息（如新闻、研究进展）。
例如：你问大模型你们单位几点上班，在没有上下文的前提下大模型不能给你正确答案。
那么我将公司的考情规则一起给大模型就可以给出答案了。但随着公司规模扩大，考勤规则字数越来越多，大模型的答案就越容易跑偏，所以我们希望大模型找到公司考勤规则中和我们问的问题最接近的一段，这就是RAG要解决的问题。

首先需要将大的考勤规则切段，使用Embedding模型将每段文字转化成向量。

3.什么是Embedding模型

Embedding模型是一种将离散数据（如文本、图像、用户行为等）映射为连续向量表示的技术框架，其核心目标是通过数学向量捕捉数据的语义、关系或特征。

Embedding模型的输入为一段文字而输出是固定长度的数组。使文字内容转化为多维坐标，将文字特征转化为数字。

例如：输入：金毛输出：[0.26,0.39,0.35.....,0.01]

以动物狗的二维坐标举例x坐标为体型y坐标为毛长(最高为1最低为0)：
如图

此时用户提问“和阿拉斯加最相近的狗是那种狗？” ai就会将阿拉斯加向量化，比如向量化成了(0.7,0.7)那么在坐标中最接近的狗就是(0.6,0.65)的金毛。

同样在RAG架构中，我们将录入的文档文件切割向量化成多个几百或几千维度的向量，再将用户输入的问题转换成向量找到举例最近的知识库向量数据返回。

4.RAG的缺陷

1.文章拆分策略难以支撑复杂的文档场景。

2.缺乏全局视角，例如：用户问上面那个狗的案例出现了几种狗，RAG就无法检索到任意一条文章。

博客等级

码龄3年

38
原创

487
点赞

291
收藏

353
粉丝

关注

私信

热门文章

分类专栏

Java后端 10篇
运维 1篇
Java后端进阶 6篇
Java基础 16篇

上一篇：: linux指令整合（centos系统持续更新中。。。）

下一篇：: Java实现word、pdf转html保留格式

最新评论

springboot出现org.apache.ibatis.binding.BindingException: Invalid bound statement (not found)原因总结
向KaiSarH学习: 我是第3个问题，现在已经解决，感谢
微服务入门学习笔记（黑马商城）
zhangpeng2003: 老师他用的idea是那个版本，感觉他的界面好清爽
springboot出现org.apache.ibatis.binding.BindingException: Invalid bound statement (not found)原因总结
一小白个: 用了最后两行代码解决了，但是我还是不明白为什么会报错，我已经在mybatis-config.xml中标明了xml文件，不是跟这两行代码效果是一样的吗
Java的集合Collection和Map
CSDN-Ada助手: 恭喜您写了第20篇博客，题目为“Java的集合Collection和Map”！这是一个非常有用和深入的主题，相信能够帮助很多人更好地理解Java集合框架。希望您能继续保持创作的热情和动力，分享更多有价值的内容给读者。下一步建议可以考虑深入探讨Java集合框架的底层实现原理，或者结合实际案例分析集合框架在项目中的应用。期待您更多精彩的作品！
HashMap底层原理
CSDN-Ada助手: 恭喜您写了第18篇博客，标题为“HashMap底层原理”，内容深入浅出，让读者受益匪浅。希望您能继续保持创作的热情和耐心，坚持分享知识和经验。下一步建议可以考虑结合实际案例或者应用场景，让读者更加直观地理解HashMap的使用方法和优势。期待您的下一篇作品！愿您在创作的道路上越走越远，不断进步！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。