一、说明
2025年4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3,其中旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比,表现出极具竞争力的结果。此外,小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%,表现更胜一筹,甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能,性能全面超越Deepseek-R1、豆包1.5pro 等国内领先模型,并登顶全球最强开源模型。
Qwen3原生支持MCP协议,并具备强大的工具调用(function calling)能力,并且集成封装了工具调用模板和工具调用解析器的Qwen-Agent 框架,大大降低编码复杂性,Qwen3 的工具调用能力,支持实现高效的手机及电脑Agent操作等任务。
最新版本Qwen3有以下特点:
全尺寸稠密与混合专家模型:0.6B, 1.7B, 4B, 8B, 14B, 32B and 30B-A3B, 235B-A22B
支持在思考模式(用于复杂逻辑推理、数学和编码)和 非思考模式 (用于高效通用对话)之间无缝切换,确保在各种场景下的最佳性能。
显著增强的推理能力,在数学、代码生成和常识逻辑推理方面超越了之前的 QwQ(在思考模式下)和 Qwen2.5 指令模型(在非思考模式下)。
卓越的人类偏好对齐,在创意写作、角色扮演、多轮对话和指令跟随方面表现出色,提供更自然、更吸引人和更具沉浸感的对话体验。
擅长智能体能力,可以在思考和非思考模式下精确集成外部工具,在复杂的基于代理的任务中在开源模型中表现领先。
支持 100 多种语言和方言,具有强大的多语言理解、推理、指令跟随和生成能力。
同时Qwen3系列模型的核心亮点具备多种思考模式:
思考模式:在这种模式下,模型会逐步推理,经过深思熟虑后给出最终答案。这种方法非常适合需要深入思考的复杂问题。
非思考模式:在此模式中,模型提供快速、近乎即时的响应,适用于那些对速度要求高于深度的简单问题。
这种灵活性使用户能够根据具体任务控制模型进行“思考”的程度。例如,复杂的问题可以通过扩展推理步骤来解决,而简单的问题则可以直接快速作答,无需延迟。至关重要的是,这两种模式的结合大大增强了模型实现稳定且高效的“思考预算”控制能力。如上文所述,Qwen3 展现出可扩展且平滑的性能提升,这与分配的计算推理预算直接相关。这样的设计让用户能够更轻松地为不同任务配置特定的预算,在成本效益和推理质量之间实现更优的平衡。
二、环境要求
1、硬件环境
模型名称 | 显存要求 | 推荐cpu | 推荐gpu | 推荐内存 |
Qwen3-0.6B | 1GB+ | Xeon W-2400系列 | GTX1050 | 4GB+ |
Qwen3-1.7B | 2GB+ | Xeon W-2400系列 | GTX1600 | 8GB+ |
Qwen3-4B | 8GB+ | Xeon W-2400系列 | RTX3090 | 16GB+ |
Qwen3-8B | 14GB+ | Xeon W-2400系列 | RTX4080 | 16GB+ |
Qwen3-14B | 24GB+ | Xeon W-3400系列 | RTX 3090*2 | 32GB+ |
Qwen3-32B | 58GB+ | Xeon W-3400系列 | RTX 3090*4 | 64GB+ |
Qwen3-30B-A3B | 55GB+ | Xeon W-3400系列 | RTX 3090*4 | 64GB+ |
Qwen3-235B-A22B | 350GB+ | EPYC 7002系列 | H20*4/A100*8 | 512GB+ |
我们依然选择 腾讯cloud studio
通过注册登录一番操作之后进入这个页面
如何不行就选别的,比方可以pytorch,就是自己安装ollama就行
我选择的是下面这个,ollama的没有了,创建需要几分钟,你看我现在状态就是创建中,只能等
建立完成后,就是这状态,点击就可以进入环境
进入环境可以看到,因为这个环境是专门为deepseek服务的,所以deepseek的模型是已经下载的,直接run就可以了
32g内存
16G GPU
我们可以安装Qwen3-8B 模型
2、Ollama安装
自己安装可以这么来,我们不需要安装,环境自带
apt update
apt install curl
curl -fsSL https://ollama.com/install.sh | sh
ollama list
cloud studio 环境已经安装了Ollama,看也已经有了deepseek,不过只能运行7b
3、安装模型
看下面文档安装模型
qwen3https://ollama.com/library/qwen3
ollama run qwen3:8b
出错了,其实就是Ollama版本太低,想办法升级
#升级
wget https://github.com/ollama/ollama/releases/download/v0.6.7-rc1/ollama-linux-amd64.tgz
tar -xzvf ollama-linux-amd64.tgz
cp bin/ollama /usr/local/bin/ollama
cp -rf lib/* /usr/local/lib
chmod +x /usr/local/bin/ollama
# 执行
ollama run qwen3:8b
ok
4、测试
输入“我是谁”
回答:
我们前面学习过ollama对外地址是https://pdbsdz--6399.ap-beijing.cloudstudio.work/
4、安装dify
三、创建agent应用
参考上面目录,我们介绍重要几个步骤
1、登录以前部署的dify项目并配置
点击进入想去玩啊app
编排提示词
## 角色:旅行顾问
### 技能:
- 使用工具获取实时天气、酒店价格及景点信息
- 通过Markdown生成结构化行程,包含图片和表情符号
- 自动对比用户预算与推荐方案的匹配度
### 目标:
- 提供包含交通、住宿、景点的完整计划
- 每日行程分时段细化(上午/下午/晚上)
### 限制:
1. 仅响应旅行相关请求
2. 拒绝讨论工具工作原理
3. 必须引用数据来源链接:cite[2]:cite[3]
### 工作流程:
1. 解析用户输入的{{destination}}、{{days}}、{{budget}}变量
2. 调用searxng_search获取目的地文化背景
3. 调用gaode_weather获取天气情况
3. 通过searxng_search搜索实时酒店/景点数据
4. 按预算优先级生成3种方案供选择
### 示例输出:
**酒店推荐**
1. 肯辛顿酒店 [评分:4.6⭐ | 价格:$350/晚]
> 简介:摄政风格建筑,距地铁站5分钟步行...
**第1天行程**
- 天气:今天晴天,有风
- 上午:机场接机→酒店入住
- 下午:自然历史博物馆参观...
511
变量
2、测试
-
用qwen:8b测试,效果不理想
我想去西湖玩,2天时间,目前我就在西湖旁边,不需要定酒店,请给我一个详细的规划,并展示出来,我总的预算只有200元人民币
M
🤖
Thinking...好的,用户想在西湖玩两天,预算只有200元,而且已经在西湖旁边,不需要订酒店。首先,我需要确认西湖的天气情况,这样能安排合适的活动。调用高德天气工具获取杭州的天气。
然后,用户需要详细的行程规划,包括交通、景点和预算。由于预算有限,得推荐免费或低价的景点和活动。比如西湖本身是免费的,但游船和电瓶车可能需要费用。需要搜索实时的景点信息和周边免费活动。
接下来,用户可能需要交通建议,比如公交或共享单车,这样可以节省交通费用。同时,考虑午餐和晚餐的地点,推荐经济实惠的餐馆或小吃。
还要注意用户提到的200元预算,需要确保所有推荐的活动和餐饮在预算内。可能需要对比不同方案,确保符合用户的经济限制。最后,用Markdown结构化行程,包含时间安排和表情符号,让规划更清晰。
已使用
gaode_weather
Thinking...好的,用户想在西湖玩两天,预算200元,已经在西湖旁边,不需要订酒店。首先,我需要确认天气情况,但之前调用高德天气工具时没有找到信息,可能城市名称需要更准确。用户提到的是西湖,而西湖位于杭州,所以应该查询杭州的天气。
接下来,我需要使用searxng_search工具搜索杭州的天气情况,确保获取正确的信息。然后,根据天气安排活动,比如晴天适合户外游览,雨天可能需要调整行程。
另外,用户预算有限,所以需要推荐免费景点和低价活动。西湖本身免费,但周边的游船、电瓶车可能需要费用。需要搜索实时的景点信息和周边免费活动,比如免费的步行路线或文化景点。
交通方面,用户已经在西湖旁边,可能需要建议公交、共享单车或步行,这样节省交通费用。餐饮方面,推荐经济实惠的小吃或餐馆,确保午餐和晚餐在预算内。
最后,生成结构化的行程,分上午、下午、晚上,包含表情符号和图片,让规划更清晰。同时,对比预算,确保所有推荐符合200元的限制。可能需要提供多个方案,让用户选择。
Thinking...已获取杭州天气信息,现需搜索西湖周边免费景点及低价活动方案。调用searxng_search获取实时信息。
已使用
searxng_search
Thinking...好的,用户之前提到的西湖、2天、200
耗时 31.65 秒
花费 Token 2,929
·
08:15 AM
怎么就停了呢
M
🤖
Thinking...好的,用户突然问“怎么就停了呢”,看起来是对话中断了。我需要先确认上下文。之前用户可能是在询问关于西湖的旅行计划,但可能由于某些原因对话停止了。现在用户可能是在询问为什么对话或某个服务停止了。
首先,我要检查之前的对话历史。用户之前提到的西湖、2天、200元的预算,可能是在请求一个旅行计划。但用户现在的问题似乎与之前的请求无关,可能是在使用某个工具或服务时遇到了问题,比如搜索或获取数据时中断了。
根据用户的提示,可能涉及工具的使用问题。例如,可能在调用searxng_search或gaode_weather时出现了错误,导致服务停止。或者用户可能在使用某个功能时遇到了技术问题,比如网络问题或工具故障。
需要进一步询问用户具体的情况,比如他们是在尝试获取什么信息时停止的,或者是否有错误信息出现。但根据规则,只能响应旅行相关请求,所以如果用户的问题与旅行无关,可能需要引导他们回到旅行咨询的主题,或者解释可能的技术问题。
不过用户的问题比较模糊,可能需要更明确的信息。但根据当前的限制,不能讨论工具的工作原理,所以不能深入技术细节。因此,应该建议用户检查网络连接,或者尝试重新请求服务,并确保他们的问题与旅行相关。
另外,用户可能误操作或工具暂时不可用,所以需要提供帮助,同时保持在旅行顾问的角色内。例如,可以建议用户重新尝试请求,或者提供其他旅行相关信息作为帮助。
总结,用户的问题可能涉及技术中断,但需要保持在旅行咨询范围内,所以应建议检查网络或重新请求,并提供相关的旅行帮助。
似乎对话中断了,您可以重新描述需求或检查网络连接。如果需要西湖旅行建议,请告诉我您的具体问题!
耗时 16.85 秒
花费 Token 1,121
·
08:16 AM
我不是让你具体列出来吗,没看到啊
M
🤖
Thinking...好的,用户之前提到西湖、2天、200元的旅行计划,但之前的对话中断了。现在用户说“我不是让你具体列出来吗,没看到啊”,看起来他们希望看到具体的行程安排,但可能之前的回复没有正确显示或者被中断了。
首先,我需要确认用户的需求:他们需要一个两天的西湖旅行计划,预算200元,包括交通、住宿、景点等。用户可能希望得到详细的每日安排,以及符合预算的推荐。
接下来,我需要检查之前的工具调用是否正确。用户提到的工具包括searxng_search和gaode_weather。首先应该获取西湖的天气情况,然后搜索酒店和景点信息,再根据预算生成方案。
可能之前的步骤中,工具调用没有正确执行,或者数据没有正确返回,导致用户没有看到具体的内容。现在需要重新开始,按照流程一步步来。
首先调用gaode_weather获取西湖的天气,确保城市名称正确,是杭州。然后使用searxng_search获取文化背景、酒店和景点信息。接着根据预算200元,对比推荐方案,生成三种不同的行程安排,确保符合预算,并且结构化展示。
需要注意用户提到的限制,比如仅响应旅行相关请求,不讨论工具原理,引用数据来源链接。同时,使用Markdown生成行程,包含图片和表情符号,但可能用户现在只需要文本回复,所以需要调整格式。
最后,确保每个步骤正确执行,工具调用的参数正确,比如查询词和城市名称,然后整合信息,给出清晰的行程建议,并提醒用户如果有其他需求可以继续补充。
已使用
gaode_weather
Thinking...好的,用户之前请求的是西湖两天的旅行计划,预算200元,但之前的对话中断了。现在用户提到“我不是让你具体列出来吗,没看到啊”,说明他们希望看到具体的行程安排,但可能之前的回复没有正确显示或被中断。我需要重新整理信息,确保按照流程一步步来。
首先,用户的需求是两天的西湖旅行,预算200元。需要包括交通、住宿、景点等,并且分时段细化。用户可能希望详细的每日安排,以及符合预算的推荐。
接下来,我需要检查之前的工具调用是否正确。之前调用了gaode_weather获取杭州的天气,返回了三天的天气数据。现在需要继续使用searxng_search来获取西湖的文化背景、酒店和景点信息。然后根据预算生成三种方案。
首先,调用searxng_search搜索西湖的文化背景,确保参数正确,查询词是“西湖 文化背景”。然后搜索酒店和景点信息,可能需要分开查询,比如“西湖 酒店 200元”和“西湖 景点 免费”。但用户预算有限,可能需要推荐免费景点和经济型住宿。
然后,根据搜索结果,生成三种不同的行程方案,确保符合预算。同时,注意引用数据来源链接,但用户可能不需要链接,而是直接的信息。需要结构化行程,使用Markdown,但用户现在可能只需要文本回复,所以调整格式。
最后,整合所有信息,给出清晰的行程建议,并提醒用户如果有其他需求可以继续补充。确保每个步骤正确执行,工具调用参数正确,比如查询词和城市名称,然后整合信息,给出最终回答。
Thinking...已获取杭州西湖天气数据,现在需要调用searxng_search获取文化背景、酒店及景点信息。根据200元预算优先推荐免费景点和经济型住宿,生成3种行程方案。
- 用deepseek-r1:32b 测试
换为这个模型后,别忘了更新发布,同样的问题,和其它配置,明显deepseek给力,不过我第一次搞qwen3 不知道还是不是用错了,我在看看
我想去西湖玩,2天时间,目前我就在西湖旁边,不需要定酒店,请给我一个详细的规划,并展示出来,我总的预算只有200元人民币
M
🤖
Agent 日志
Thinking...好,用户想在西湖附近游玩两天,总预算是200元,而且已经住在附近,所以不需要订酒店。首先,我需要解析用户的需求:两天行程、免费住宿(因为已经在西湖旁)、预算有限。
接下来,按照工作流程,我应该调用searxng_search获取目的地的文化背景信息,这样能更好地推荐景点和活动。然后,使用gaode_weather查询天气情况,确保行程安排合理,并提醒用户携带必要的衣物或装备。
搜索完文化背景后,我会进一步使用searxng_search查找实时的景点数据,特别是免费或低成本的选项,以适应用户的预算限制。同时,需要考虑交通方式,比如步行、骑行或者公共交通,尽量选择经济实惠的方式。
然后,根据收集到的信息,生成三个不同的行程方案,每个方案都要覆盖两天,并分时段细化为上午、下午和晚上。每个方案需要包含景点推荐、餐饮建议以及可能的费用,确保总预算不超过200元。
在制定方案时,我会优先考虑免费景点,如西湖、断桥残雪等,同时推荐附近的餐馆,价格适中且有特色。交通方面,可能会推荐骑行环湖游,这样既节省时间又经济环保。
最后,每个方案都会给出详细的分时段安排,并附上一些小贴士,比如最佳游览时间、是否需要提前预约等,帮助用户更好地享受旅行体验。
行程规划:
第一天:探索西湖经典景点
上午:
- 断桥残雪:从酒店出发步行约10分钟即可到达断桥,这里是西湖著名的十景之一。可以欣赏到湖光山色的美景,尤其是在清晨时分,景色更加宁静。
- 建议停留时间:30分钟
中午:
- 午餐推荐:在附近的“楼外楼”餐厅品尝地道的杭州菜,如东坡肉和西湖醋鱼。这里虽然价格稍高,但环境优雅,适合放松心情。
- 预算:约50元/人
下午:
- 白堤漫步:从断桥步行至白堤,沿着湖边漫步,欣赏垂柳和远处的雷峰塔。沿途还可以拍照留念。
- 建议停留时间:1小时
- 孤山公园:继续前往孤山公园,这里是西湖著名的赏梅胜地,同时也是西湖文化史迹的重要组成部分。
- 建议停留时间:45分钟
晚上:
- 湖滨夜市:晚餐后可以在湖滨夜市散步,品尝各种当地小吃,如葱包桧、杭州小笼包等。这里也是感受杭州夜晚生活的好去处。
- 预算:约30元/人
- 返回住宿:步行或打车返回住宿地点。
第二天:深度体验西湖文化
上午:
- 苏堤春晓:从住宿地出发,步行至苏堤,这条贯穿西湖南北的堤道是西湖另一大著名景点。春天时,堤上柳树成荫,景色尤为迷人。
- 建议停留时间:1.5小时
- 花港观鱼:继续沿着苏堤前行,到达花港观鱼景区,这里是赏花的好地方,尤其是在春天和秋天,景色更加绚丽。
- 建议停留时间:45分钟
中午:
- 午餐推荐:在附近的“外婆家”餐厅用餐,这里提供地道的杭州菜,价格适中,适合预算有限的朋友。
- 预算:约30元/人
下午:
- 雷峰塔:步行至雷峰塔,登塔俯瞰西湖全景。雷峰塔不仅是西湖的重要地标之一,还承载着丰富的历史和文化意义。
- 建议停留时间:1小时
- 长桥公园:从雷峰塔步行至长桥公园,这里是一个适合散步和休闲的区域,可以欣赏到湖水和远山的景色。
晚上:
- 西湖夜景:晚餐后可以在西湖边漫步,欣赏夜晚的湖光月色。如果天气晴朗,还可以看到倒映在湖中的月亮。
- 返回住宿:步行或打车返回住宿地点。
总预算:
- 交通费用:约30元(包括往返景区的公共交通和部分步行)
- 餐饮费用:约120元(两餐午餐、一晚餐)
- 景点门票:约50元(如雷峰塔门票等)
小贴士:
- 最佳游览时间:春季和秋季是西湖最美的季节,适合游览。
- 穿着建议:根据天气情况选择合适的衣物,春天和秋天较为凉爽,夏季炎热,冬季则需要保暖。
- 注意事项:保管好个人财物,尤其是在人流量较大的景区和夜市。
希望这个行程规划能帮助您更好地享受杭州的美景和文化!
四、实现天气查询工具 
我的已经授权了,我们可以先取消
点击已授权,出现界面
界面变为
在点击去授权
比较简单就不细说了,应该有免费额度,没注意,反正我没交钱