langchain做向量化milvus
时间: 2025-05-24 21:02:29 浏览: 16
### 使用LangChain实现Milvus向量化的教程
#### 准备工作
为了使用 LangChain 实现 Milvus 的向量化操作,需先安装必要的 Python 库。这通常包括 `langchain` 和 `pymilvus`。
```bash
pip install langchain pymilvus
```
#### 创建连接并初始化集合
建立到 Milvus 数据库的连接,并定义用于存储嵌入向量的数据集结构[^2]:
```python
from pymilvus import connections, FieldSchema, CollectionSchema, DataType, Collection
connections.connect()
fields = [
FieldSchema(name="id", dtype=DataType.INT64, is_primary=True),
FieldSchema(name="embedding", dtype=DataType.FLOAT_VECTOR, dim=768)
]
schema = CollectionSchema(fields)
collection_name = "my_collection"
milvus_collection = Collection(name=collection_name, schema=schema)
```
#### 加载文档与生成嵌入
利用 LangChain 提供的功能加载目标文件,并通过预训练的语言模型将其转换成数值形式表示——即所谓的“嵌入”。这里假设已经选择了合适的 embedding model 来处理输入文本[^1]。
```python
from langchain.document_loaders import TextLoader
from langchain.embeddings.huggingface import HuggingFaceEmbeddings
loader = TextLoader('path/to/your/document.txt')
documents = loader.load()
embedder = HuggingFaceEmbeddings()
vectorized_docs = embedder.encode([doc.page_content for doc in documents])
```
#### 插入数据至Milvus
最后一步就是把上述获得的向量连同对应的 ID 一起存入之前创建好的 Milvus 集合中去完成整个过程[^3]。
```python
data_to_insert = [[i], vector.tolist()] for i, vector in enumerate(vectorized_docs)]
milvus_collection.insert(data_to_insert)
```
阅读全文
相关推荐


















