LlamaIndex中使用本地LLM和Embedding

最新推荐文章于 2025-05-08 17:34:02 发布

Elwin Wong

最新推荐文章于 2025-05-08 17:34:02 发布

阅读量581

点赞数 3

CC 4.0 BY-SA版权

分类专栏：大模型文章标签：人工智能 LlamaIndex 大模型 LLM embedding

本文链接：https://blog.csdn.net/zhaoyuanh/article/details/145802197

LlamaIndex默认会调用OpenAI的text-davinci-002模型对应的API，用于获得大模型输出，这种方式在很多情况下对国内用户不太方便，如果本地有大模型可以部署，可以按照以下方式在LlamaIndex中使用本地的LLM和Embedding（这里LLM使用chatglm2-6b，Embedding使用m3e-base）：

import torch
from transformers import AutoModel, AutoTokenizer
from llama_index.llms import HuggingFaceLLM
from llama_index import VectorStoreIndex, ServiceContext
from llama_index import LangchainEmbedding, ServiceContext
from langchain.embeddings.huggingface import HuggingFaceEmbeddings
from llama_index import VectorStoreIndex, SimpleDirectoryReader
from llama_index import Prompt,