RAG 用到的模型

### RAG架构中使用的模型 RAG（检索增强生成）架构是一种结合了检索和生成的混合方法，旨在提升生成式AI应用中的响应质量。在RAG架构中，模型的选择至关重要，因为它直接影响到最终生成结果的质量[^1]。通常情况下，RAG架构会使用两种主要类型的模型：一种是用于创建查询嵌入（embeddings）的模型，另一种是用于生成最终响应的大型语言模型（LLM）。具体来说，查询会被传递给一个嵌入模型，该模型会生成查询的向量表示。这些向量随后被用来从知识库中检索相关信息[^1]。在生成最终响应阶段，检索到的信息会被整合到提示（prompt）中，并传递给选定的LLM进行处理。目前支持的LLM包括Cloud Insta和Anthropic的Cloud Version Two等。此外，RAG架构的设计模式已经被简化，使得开发者能够更轻松地接入各种生成式AI组件。例如，通过RAG解决方案，可以与LangChain、Llama Index或Amazon Bedrock等功能集成[^2]。选择合适的RAG框架时，需要考虑多个因素，包括但不限于框架的功能、易用性以及与现有技术栈的兼容性。市场上存在多种RAG框架，如Haystack、FlashRAG和R2R等，每种框架都有其独特的优势和适用场景[^3]。以下是一个简单的代码示例，展示如何使用RAG架构中的模型： ```python from transformers import AutoTokenizer, AutoModel # 加载嵌入模型 embedding_model = AutoModel.from_pretrained("sentence-transformers/all-MiniLM-L6-v2") tokenizer = AutoTokenizer.from_pretrained("sentence-transformers/all-MiniLM-L6-v2") # 创建查询嵌入 def create_embedding(query): inputs = tokenizer(query, return_tensors="pt", truncation=True, padding=True) with torch.no_grad(): embeddings = embedding_model(**inputs).pooler_output return embeddings query = "What is the capital of France?" query_embedding = create_embedding(query) ``` ###

阅读全文

相关推荐

AI大模型RAG项目实战课

精品推荐-2024年RAG大模型面试实践全集（80份）.zip

大模型RAG进阶实战营

Java版本RAG大模型知识库项目详细介绍

推荐下rag里用到的嵌入模型和rerank模型，主要在中文环境

多模态大模型rag

多模态大模型rag搭建

多模态大模型RAG如何使用

RAG检索

dify rag

部署rag

rag demo

本地RAG

rag prompt

那有没有端到端的开源项目，支持ASR+大模型部署+RAG知识库

rag本地部署

huggingface中文RAG

模块化RAG

RAG deepseek ollama

springAi+rag

大家在看

高强螺栓连接评估软件BoltWorks

Pixhawk4飞控驱动.zip

基于python开发的工商企业名录查询软件v2.2.4下载

HFSS板子实物加工流程.pdf

嵌套双曲空间降维与双曲神经网络设计

最新推荐

2013年春季省开课程网络形考“经营管理实务”第三次作业.doc

cc65 Windows完整版发布：6502 C开发工具

【CLIP模型实战】：从数据预处理到代码实现的图文相似度计算完全指南

车载以太网doip协议格式

JavaScript中文帮助手册：初学者实用指南

深入理解MySQL存储引擎：InnoDB与MyISAM的终极对决

window中系统中断，cpu占用100%

C++Builder6.0缺失帮助文件的解决方案

【湖北专升本MySQL强化训练】：5大SQL语句编写技巧，迅速提升实战能力

HFSS如何设置网格化细化