大模型agent原理图解
时间: 2025-04-17 17:32:24 浏览: 26
### 大模型 Agent 工作原理图解
#### 1. 用户请求接收
大模型代理(Agent)首先接收到用户的请求或指令。这个过程通常发生在前端界面,用户可以通过自然语言输入具体的需求。
```python
user_input = "请帮我查询最近一周内公司销售数据的变化趋势"
```
#### 2. 请求预处理
在接收到用户输入之后,Agent 对其进行必要的预处理操作,比如去除停用词、分词以及语义分析等,以便更好地理解和解析用户意图[^2]。
#### 3. 构建 Few-Shot Prompt
为了指导大模型生成更符合预期的结果,Agent 设计特定结构化的 few-shot prompt 并将其发送给底层的大规模预训练模型。这种提示机制能够有效引导模型按照既定逻辑思考并采取行动。
```json
{
"thought": [
{"role": "system", "content": "你现在是一个数据分析专家"},
{"role": "user", "content": "请描述过去七天内的销售额变化情况"}
],
"action": ["获取数据库连接", "执行SQL查询"]
}
```
#### 4. 调用大模型 API
完成上述准备工作后,Agent 将构建好的提示信息传递给 LLM (Large Language Model),并通过 RESTful 或 gRPC 等接口形式发起远程调用请求[^4]。
#### 5. 结果过滤与终止条件设置
为了避免不必要的冗余输出,在向 LLM 发送请求的同时设置了 `Stop.Observation` 参数作为终止标志位,确保只获得所需的 Thoughts 和 Actions 部分而不包括 Observations。
#### 6. 后端逻辑执行
基于从 LLM 获取到的信息片段,Agent 开始依次执行相应的动作序列,如访问外部API、检索本地文件系统或是运行脚本程序来收集所需的数据资源。
#### 7. 数据整理与反馈呈现
最后一步则是将所有搜集来的零散资料汇总起来形成完整的答案,并经过适当格式化处理后再展示回给最终用户查看。
---
阅读全文
相关推荐











