首页langchain做向量化milvus

langchain做向量化milvus

时间: 2025-05-24 21:02:29 浏览: 16

### 使用LangChain实现Milvus向量化的教程 #### 准备工作为了使用 LangChain 实现 Milvus 的向量化操作，需先安装必要的 Python 库。这通常包括 `langchain` 和 `pymilvus`。 ```bash pip install langchain pymilvus ``` #### 创建连接并初始化集合建立到 Milvus 数据库的连接，并定义用于存储嵌入向量的数据集结构[^2]： ```python from pymilvus import connections, FieldSchema, CollectionSchema, DataType, Collection connections.connect() fields = [ FieldSchema(name="id", dtype=DataType.INT64, is_primary=True), FieldSchema(name="embedding", dtype=DataType.FLOAT_VECTOR, dim=768) ] schema = CollectionSchema(fields) collection_name = "my_collection" milvus_collection = Collection(name=collection_name, schema=schema) ``` #### 加载文档与生成嵌入利用 LangChain 提供的功能加载目标文件，并通过预训练的语言模型将其转换成数值形式表示——即所谓的“嵌入”。这里假设已经选择了合适的 embedding model 来处理输入文本[^1]。 ```python from langchain.document_loaders import TextLoader from langchain.embeddings.huggingface import HuggingFaceEmbeddings loader = TextLoader('path/to/your/document.txt') documents = loader.load() embedder = HuggingFaceEmbeddings() vectorized_docs = embedder.encode([doc.page_content for doc in documents]) ``` #### 插入数据至Milvus 最后一步就是把上述获得的向量连同对应的 ID 一起存入之前创建好的 Milvus 集合中去完成整个过程[^3]。 ```python data_to_insert = [[i], vector.tolist()] for i, vector in enumerate(vectorized_docs)] milvus_collection.insert(data_to_insert) ```

阅读全文