Langchain 集成 Milvus

engchina

已于 2023-10-18 16:38:13 修改

阅读量3.9k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： LINUX 文章标签： langchain milvus ChatGPT

于 2023-07-27 00:18:03 首次发布

本文链接：https://blog.csdn.net/engchina/article/details/131950266

本文详细介绍了如何在Docker环境下部署Milvus单机版，安装可视化工具Attu，并通过Langchain库将Milvus集成到文本处理流程中，用于存储和检索深度学习生成的嵌入向量。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Langchain 集成 Milvus

1. 安装 Docker
2. 部署 Milvus
3. 安装 Attu
4. Langchain 集成 Milvus

1. 安装 Docker

refer: https://docs.docker.com/engine/install/centos/

Milvus 会以容器方式启动，所以先安装 Docker。(本示例使用的是 Alma Linux 9.2)

卸载旧版本，

sudo yum remove docker \
                  docker-client \
                  docker-client-latest \
                  docker-common \
                  docker-latest \
                  docker-latest-logrotate \
                  docker-logrotate \
                  docker-engine

设置存储库，

sudo yum install -y yum-utils
sudo yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo

安装 Docker 引擎，

sudo yum install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin

启动 Docker，

sudo systemctl start docker

通过运行 hello-world 映像来验证 Dock

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

engchina

关注关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
3
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

如何集成 Milvus 和 LangChain？

实战AI智能体

07-29

768

在 pipeline 的这个步骤中，Milvus 负责接收 embedding、原始文本和元数据，并将它们存储在一个集合（collection）中。随着集合中的文档数据越来越多，Milvus 会为所有存储的 embedding 创建索引，从而加快搜索的速度。Milvus 作为 VectorStore 提供两种类型的搜索，一种是默认的、按照未修改的顺序返回对象，另一种是使用最大边缘相关算法（MMR）排序的搜索。同样，如果在 collection 创建后向文档添加了任何新的元数据，这些新增的元数据都将被忽略。

RAG实操教程: langchain+Milvus向量数据库创建你的本地知识库

2401_85782938的博客

06-19

8595

本文主要是 Milvus 向量数据实战总结。LLM 痛点以及解决方案RAG 是什么，为什么选用RAG。langchain文档加载器，chat model文档拆分的注意点，chat model区别。chat 示例代码。

3 条评论您还未登录，请先登录后发表或查看评论

milvus安装及langchain调用

qq128252的博客

01-12

2811

Milvus 是一款全球领先的开源向量数据库，赋能 AI 应用和向量相似度搜索，加速非结构化数据检索。 Milvus专注于存储、索引及管理由深度神经网络和其他机器学习（ML）模型生成的海量嵌入向量，能够轻松应对万亿级别的向量索引任务。

提升语义搜索效率：LangChain 与 Milvus 的混合搜索实战

最新发布

静心编程，禅意生活。

06-16

1248

LangChain与Milvus的结合构建了一套高效的语义搜索系统。LangChain负责处理多模态数据（如文本、PDF等）的嵌入生成与任务编排，Milvus作为向量数据库提供大规模向量相似性检索能力。二者协同实现从非结构化数据到结构化检索的完整流程。在本文我们将从最常见的密集+稀疏情况开始，然后介绍各种通用的混合搜索使用方法。

LangChain + Milvus：从零搭建检索增强生成（RAG）系统

xxue345678的博客

01-08

1512

向量存储将文本块通过嵌入模型转化为高维向量，并存储在数据库中。后续的检索通过计算用户问题与存储向量的相似度，返回最相关的文本块。在本例中，我们使用。

解码 LangChain｜用 LangChain 和 Milvus 从零搭建 LLM 应用

ZILLIZ

07-19

2153

微调后，模型可以更准确地理解用户问题、将其进行分类，从而提高语义搜索结果的准确性和相关性，返回准确的结果。例如，大家可以使用 LangChain 的 Milvus 类，通过from_text方法存储文档的特征向量，然后调用similarity_search方法获取查询语句的相似向量（也就是在向量空间中找到距离最接近的文档向量），从而轻松实现语义搜索。LangChain 为 LLM 提供了标准化且易用的接口，Milvus 则提供出色的存储和检索能力，从而整体提升 ChatGPT 等应用的功能和效率。

【RAG实操教程】使用LangChain + Milvus向量数据库创建本地知识库

2401_85375151的博客

12-28

1872

使用 LangChain 和 Milvus 构建测试知识库

weixin_44872675的博客

02-26

1487

通过 LangChain 和 Milvus，测试工程师可以快速构建一个高效的测试知识库，支持测试资产的存储、检索和生成。本文提供了从环境搭建到代码实现的完整流程，以及提高系统落地实践效果的建议。结合 LangChain 的检索能力和 Milvus 的向量存储性能，这套方案将显著提升测试工作的效率与准确性。

用 LangChain 和 Milvus 从零搭建 LLM 应用

YiRan_Zhao的博客

02-20

1697

教你本地复现Deep Research：DeepSeek R1+ LangChain+Milvus

ZILLIZ

02-10

797

本文仅作基础复现逻辑演示，如果对升级版复现方案感兴趣，欢迎移步github抢先尝鲜：https://github.com/zilliztech/deep-searcher金融机构、律所、科研党的福音来了！不久前，OpenAI 新推出了一项名叫 Deep Research（深度研究）的功能，迅速风靡全球。我们可以将其理解为大模型+超级搜索+研究助理的三合一。在这项功能里，用户输入查询问题后，只需要...

在LangChain中使用Milvus + openai使用

qq_56352553的博客

10-06

1874

Milvus(opens in a new tab) 是一个存储、索引和管理由深度神经网络和其他机器学习（ML)模型生成的大规模嵌入向量的数据库。

LangChain + Milvus组合拳，从零搭建一个 LLM 应用

pythonhy的博客

11-19

1030

本文为解码 LangChain 系列，将深入探讨如何借助 LangChain 与 Milvus 的力量增强 LLM 应用，以及如何构建和优化 AIGC 应用的小秘籍！

Milvus 与 LangChain、LlamaIndex 的结合

03-28

1399

在 RAG 应用中，**Milvus（开源向量数据库）** 结合 **LangChain 和 LlamaIndex（数据索引框架）**，可以实现高效的 **语义搜索、知识库问答、AI 语义推荐系统**。本篇文章将介绍 **如何结合 Milvus、LangChain 和 LlamaIndex 构建智能搜索与问答系统**，并提供 **实战代码示例**，帮助开发者快速上手。

AI大模型企业应用实战：Prompt让LLM理解知识

2401_84204413的博客

06-25

2722

通过阿里云Milvus和LangChain快速构建LLM问答系统

2301_81940605的博客

06-05

1492

本文介绍如何通过整合阿里云Milvus、阿里云DashScope Embedding模型与阿里云PAI（EAS）模型服务，构建一个由LLM（大型语言模型）驱动的问题解答应用，并着重演示了如何搭建基于这些技术的RAG对话系统。

RAG实操教程: Langchain+Milvus 向量数据库创建你的本地知识库

2301_81888214的博客

11-04

1819

RAG实操教程: Langchain+Milvus 向量数据库创建你的本地知识库

langchain使用milvus

05-17

### 如何在 Langchain 中集成和使用 Milvus #### 1. **Langchain 和 Milvus 的基本概念** Langchain 是一个用于构建大语言模型应用的框架，而 Milvus 是一款专门设计用于向量数据库管理的工具。通过将两者结合，可以高效地存储、索引和检索高维向量数据[^1]。 --- #### 2. **安装必要的依赖** 为了使 Langchain 能够与 Milvus 正常交互，需要先安装 `langchain` 和 `pymilvus` 库。以下是命令： ```bash pip install langchain pymilvus ``` 如果计划使用 OpenAI 或其他嵌入模型，则还需要额外安装对应的 SDK，例如 `openai`。 --- #### 3. **连接到 Milvus 数据库** 在 Langchain 中，可以通过创建一个 `Milvus` 实例来完成与 Milvus 的连接。以下是一个简单的代码片段： ```python from langchain.vectorstores import Milvus from pymilvus import connections, utility # 连接至 Milvus 服务 connections.connect("default", host="localhost", port="19530") # 如果集合已存在则删除它（仅限测试环境） if utility.has_collection("my_collection"): utility.drop_collection("my_collection") # 初始化 Milvus 向量存储实例 vectorstore = Milvus( embedding_function=None, # 可选：指定嵌入函数 connection_args={"host": "localhost", "port": "19530"}, collection_name="my_collection" ) ``` 此部分展示了如何建立基础连接以及初始化一个新的集合[^2]。 --- #### 4. **定义 Schema 并加载数据** 在实际操作中，通常需要为文档字段定义模式（schema）。下面是一段示例代码，演示如何加载文本数据并将其转换为向量形式存入 Milvus： ```python from langchain.embeddings.openai import OpenAIEmbeddings # 使用 OpenAI Embedding Function embeddings = OpenAIEmbeddings() texts = ["这是一条测试记录.", "这是另一条不同的记录."] # 输入文本列表 # 将文本添加到 Milvus 集合中 ids = vectorstore.add_texts(texts=texts, embeddings=embeddings) print(f"成功插入 {len(ids)} 条记录.") ``` 这里利用了 OpenAI 提供的嵌入功能生成每段文字的特征表示，并最终保存到目标集合里[^3]。 --- #### 5. **执行相似性搜索** 一旦完成了数据导入工作之后，就可以开始尝试查询最接近给定条件的结果集啦！ ```python query_text = "寻找相关内容" search_results = vectorstore.similarity_search(query=query_text, k=2, search_params={}) for result in search_results: print(result.page_content) ``` 上述脚本实现了基于输入字符串进行最近邻查找的功能，其中参数 `k` 控制返回结果的数量[^4]。 --- ### 总结以上便是关于怎样借助 Langchain 工具包实现同 Milvus 协作的一个简要介绍。从初步搭建直至具体应用场景均有涉及，希望能够帮助您更好地理解整个流程。