第8章:LangChain检索增强生成RAG--1概述

一起学开源

已于 2025-02-24 16:36:29 修改

阅读量584

点赞数 9

CC 4.0 BY-SA版权

分类专栏：智能体开发 LangChain 文章标签： langchain java 人工智能智能体开发

于 2025-02-21 13:25:32 首次发布

奎哥（Hank）

本文链接：https://blog.csdn.net/hekuinumberone/article/details/145768615

本章主要介绍基于 LangChain4j 中的 RAG（Retrieval-Augmented Generation，检索增强生成）
概念及其实现方式。RAG 是一种通过检索相关知识来增强语言模型生成能力的技术，特别适用于需要结合特定领域知识或私有数据的场景

RAG（检索增强生成）| LangChain4j

1. RAG 是什么？

语言模型（LLM）的知识仅限于其训练数据。如果希望让 LLM 了解特定领域的知识或私有数据，可以采用以下方法：

使用 RAG（检索增强生成），本文将详细介绍。
使用你的数据对 LLM 进行微调（fine-tuning）。
结合使用 RAG 和微调。

RAG 的核心思想：在将提示（prompt）发送给语言模型之前，从你的数据中找到并注入相关信息片段。这样，LLM 将获得（希望是）相关的知识，并能够利用这些知识生成回答，从而降低“幻觉”（生成无关内容）的可能性。

2. RAG 的工作原理

RAG 的工作原理可以分为两个阶段：索引（Indexing）和检索（Retrieval）。

2.1 索引阶段（Indexing）

索引阶段的目标是预处理文档，以便在检索阶段能够高效地搜索相关信息。具体步骤可能因检索方法而异。对于向量搜索（vector search），通常包括以下步骤：

清洗文档。
为文档添加额外数据和元数据。
将文档分割成较小的片段（称为“分块”或 chunking）。
将这些片段嵌入为向量。
最后，将向量存储在嵌入存储（embedding store，也称为向量数据库）中。

索引阶段通常是离线进行的，用户

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

一起学开源 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。