
开源模型-实际应用落地
文章平均质量分 94
在当今科技飞速发展的时代,人工智能、深度学习与自然语言处理技术正以前所未有的态势重塑着各个领域。本专栏将以实际案例为切入点,为你精心呈现一系列精彩文章。带你深入了解如何巧妙地将开源模型与业务进行深度整合。从基础理论到实际操作,逐步引导你掌握业界流行的开源模型的使用方式,让你轻松快速度过新手期。
开源技术探险家
非计算机专业出身人士,但于2009年毅然投身IT行业。迄今,拥有15年的开发经验以及10年的项目管理经验。曾先后参与金融、政企、互联网等多个行业领域的数十个项目。对分布式架构、微服务技术以及大数据领域的知识掌握娴熟。当前,致力于人工智能(AI)方向的深入探索,所负责的项目已顺利完成大语言模型和算法的备案工作。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
开源模型应用落地-qwen模型小试-Qwen3-Reranker 模型集成 vLLM 实战解析(一)
本文介绍了将Qwen3-Reranker模型集成至高效推理引擎vLLM的技术方案,旨在提升大模型在信息爆炸时代下的排序效率与应用落地能力。原创 2025-07-15 18:29:20 · 5531 阅读 · 6 评论 -
开源模型应用落地-qwen模型小试-Qwen3-Embedding 模型集成 vLLM 实战解析(二)
Qwen3-Embedding凭借卓越的多语言理解和文本表征能力,结合vLLM框架实现高效推理,推动语义检索和生成任务迈向新高度。原创 2025-07-16 19:30:00 · 4903 阅读 · 12 评论 -
开源模型应用落地-让AI更懂你的每一次交互-mem0-QDrant-Streamlit(一)
本文介绍了为解决大型语言模型缺乏持久记忆问题而设计的智能记忆层Mem0,并将指导如何使用Streamlit搭建其测试Web UI。原创 2025-06-19 22:15:00 · 18609 阅读 · 8 评论 -
开源模型应用落地-让AI更懂你的每一次交互-用Redis Stack与LangChain解锁大模型的长期记忆潜能(二)
结合 Redis Stack 与 LangChain 构建外部记忆系统,以提升大型语言模型的长期记忆与持续学习能力。原创 2025-06-24 12:09:08 · 18649 阅读 · 6 评论 -
开源模型应用落地-让AI更懂你的每一次交互-用LangChain、Streamlit与Redis构建AI模型的“不忘”人生(三)
在人工智能中,记忆是稀有而重要的能力,传统对话模型仅能记住最近的交互内容,但借助LangChain的ConversationSummaryBufferMemory、Redis内存数据库和Streamlit界面,构建一个具有长期记忆能力的AI对话系统。原创 2025-06-27 16:41:35 · 20372 阅读 · 14 评论 -
开源模型应用落地-让AI更懂你的每一次交互-Mem0集成Qdrant、Neo4j与Streamlit的创新实践(四)
在AI快速发展的背景下,Mem0结合Qdrant、Neo4j和Streamlit构建了一个具备长期记忆、个性化服务与实时推理能力的智能记忆助手,探索AI记忆系统的无限可能。原创 2025-07-03 15:14:10 · 12163 阅读 · 9 评论 -
开源模型应用落地-RAG优化小技巧-拆解复杂问题的多步推理引擎(三)
通过问题裂变引擎将复杂问题拆解为逻辑子问题、逐层推进形成“知识雪球”的智能问答系统,有效克服传统AI的知识碎片化难题,使复杂推理更精准深入。原创 2025-08-01 18:17:58 · 13758 阅读 · 4 评论 -
开源模型应用落地-RAG优化小技巧-ParentDocumentRetriever:解决RAG上下文割裂的分层检索方案(四)
ParentDocumentRetriever通过子文档检索与父文档关联的分层策略,兼顾语义匹配精度与上下文完整性,有效解决了RAG系统中文本分块粒度难以平衡的问题。原创 2025-08-05 12:25:59 · 5178 阅读 · 11 评论 -
开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B(一)
OpenAI Agents SDK 是一个基于 Python 的强大工具集,能够帮助开发者快速构建从简单任务到复杂决策的智能代理应用,显著提升程序的智能化水平 。原创 2025-06-03 20:30:00 · 20637 阅读 · 2 评论 -
开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-function_tool(二)
OpenAI Agents SDK 是一个基于 Python 的强大工具集,能够帮助开发者快速构建从简单任务到复杂决策的智能代理应用,显著提升程序的智能化水平 。原创 2025-06-04 18:30:08 · 20262 阅读 · 2 评论 -
开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-多个Tools(三)
OpenAI Agents SDK 是一个基于 Python 的强大工具集,能够帮助开发者快速构建从简单任务到复杂决策的智能代理应用,显著提升程序的智能化水平 。原创 2025-06-05 08:00:00 · 25166 阅读 · 12 评论 -
开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-多Agents联动(四)
OpenAI Agents SDK 通过简化多智能体协作系统的开发流程,显著提升了任务自动化效率与系统可扩展性。原创 2025-06-09 07:00:00 · 21055 阅读 · 4 评论 -
开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-探索input_guardrail 的创意应用(五)
本文介绍 OpenAI Agents 中用于保障交互安全的 input_guardrail 工具,探讨了其工作原理与实际应用,帮助开发者提升系统的安全性和用户体验。原创 2025-07-01 19:45:00 · 15295 阅读 · 8 评论 -
开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-探索output_guardrail的创意应用(六)
Output Guardrail作为关键安全机制,在生成内容后进行审核与过滤,确保其安全、合规并符合预期,从而提升AI系统的可信度和稳健性原创 2025-07-02 07:30:00 · 15110 阅读 · 9 评论 -
开源模型应用落地-OpenAI Agents SDK-集成MCP与Qwen3-8B模型的创新应用探索(七)
探讨OpenAI Agents集成MCP与Qwen3-8B模型的技术组合在智能应用中的实际场景与价值。原创 2025-07-07 15:37:12 · 10712 阅读 · 3 评论 -
开源模型应用落地-OpenAI Agents SDK-集成MCP【SSE机制】与Qwen3-8B模型的创新应用探索(八)
探讨OpenAI Agents集成MCP【SSE】与Qwen3-8B模型的技术组合在智能应用中的实际场景与价值。原创 2025-07-08 07:00:00 · 10770 阅读 · 10 评论 -
开源模型应用落地-OpenAI Agents SDK-集成多个MCP Servers与Qwen3-8B模型的创新应用探索(九)
本文探讨如何结合OpenAI Agents与多MCP服务器及Qwen3-8B模型,构建高效且功能丰富的AI解决方案,以提升AI代理对外部资源的理解与操作能力。原创 2025-07-09 10:27:15 · 10336 阅读 · 10 评论 -
开源模型应用落地-qwen模型小试-Qwen3-8B-快速体验(一)
阿里云推出国内首个集成“快思考”与“慢思考”能力的 Qwen3-8B 大语言模型,以80亿参数和 128K 上下文支持,重塑AI应用边界并助力开发者高效部署原创 2025-04-29 14:08:11 · 21535 阅读 · 9 评论 -
开源模型应用落地-qwen模型小试-Qwen3-8B-快速体验-pipeline方式(二)
阿里云推出国内首个集成“快思考”与“慢思考”能力的 Qwen3-8B 大语言模型,以80亿参数和 128K 上下文支持,重塑AI应用边界并助力开发者高效部署原创 2025-04-30 18:33:59 · 20449 阅读 · 9 评论 -
开源模型应用落地-qwen模型小试-Qwen3-8B-快速体验-批量推理(三)
使用Transformers的pipeline实现批量推理原创 2025-05-05 13:51:38 · 14299 阅读 · 8 评论 -
开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM(一)
解析Qwen3-8B与vLLM的技术协同逻辑,探讨其在复杂任务中的性能表现及落地价值。原创 2025-05-05 16:01:11 · 14304 阅读 · 10 评论 -
开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-Docker(二)
通过容器化技术整合高性能推理框架vLLM与Qwen3-8B模型,可实现资源高效利用、灵活部署及推理性能优化,为大模型本地化应用提供轻量化解决方案原创 2025-05-06 07:34:21 · 28775 阅读 · 10 评论 -
开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-结构化输出(三)
通过vLLM框架高效部署QWen3-8B模型,并优化提示词工程与输出控制,实现稳定的结构化JSON生成,从而提升推理效率并拓展大模型应用场景。原创 2025-05-06 07:35:24 · 28130 阅读 · 9 评论 -
开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-思考与非思考模式(四)
Qwen3通过“思考模式”与“非思考模式”的双模态架构,实现复杂推理与实时响应的灵活切换,为大语言模型在智能与效率间的平衡提供创新解法。原创 2025-05-07 08:30:00 · 27116 阅读 · 12 评论 -
开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-Tools助力(五)
在人工智能大模型迅速发展的今天,如何让模型更智能地与外部世界交互,成为提升其实际应用能力的关键。原创 2025-05-08 08:30:00 · 26449 阅读 · 13 评论 -
开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-MCP的完美融合(六)
Qwen3-8B接入MCP,实现动态地连接外部工具和服务,从而极大地增强了其处理复杂任务的能力。原创 2025-05-09 07:45:00 · 22921 阅读 · 7 评论 -
开源模型应用落地-qwen模型小试-Qwen3-8B-融合VLLM、MCP与Agent(七)
Qwen3凭借其智能体能力、MCP协议支持与高效部署特性,正加速在金融、制造、科研等多个企业场景中的落地应用,推动智能化转型与业务闭环构建。原创 2025-05-13 10:23:49 · 30716 阅读 · 12 评论 -
开源模型应用落地-全能音频新纪元-Kimi-Audio-7B-Instruct-重塑多模态交互边界
月之暗面开源的Kimi-Audio-7B-Instruct模型通过多任务融合架构与创新技术,实现了全场景音频交互的突破性进展原创 2025-04-28 18:36:53 · 16209 阅读 · 2 评论 -
开源模型应用落地-语音合成-MegaTTS3-零样本克隆与多语言生成的突破
MegaTTS3以0.45亿参数实现高质量中英双语语音合成与语音克隆,为语音合成领域带来全新可能性。原创 2025-04-24 21:00:00 · 15883 阅读 · 7 评论 -
开源模型应用落地-语音合成-Spark-TTS-零样本克隆与多语言生成的突破
Spark-TTS通过单流解耦技术解决因复杂的多阶段流程难以平衡效率与自然度的问题,实现了更高效的语音合成。原创 2025-04-23 20:00:00 · 13946 阅读 · 11 评论 -
开源模型应用落地-语音合成-Spark-TTS-长文本高效自然的中文语音合成体验(一)
本文详细介绍 Spark-TTS 在长文本处理方面的实际应用方法。原创 2025-06-10 07:00:00 · 20210 阅读 · 12 评论 -
开源模型应用落地-语音合成-Spark-TTS-非标准词处理技巧(二)
本文探讨了Spark-TTS如何通过文本归一化方法有效处理非标准词,以提升语音合成的质量与自然度。原创 2025-06-11 07:00:00 · 14000 阅读 · 2 评论 -
开源模型应用落地-shieldgemma-2-4b-it模型小试-多模态内容安全检测(一)
ShieldGemma-2-4B-IT 凭借多模态能力、低资源需求和高精度检测,成为兼顾性能与安全性的开源图像审核工具。原创 2025-03-19 20:00:00 · 30731 阅读 · 19 评论 -
开源模型应用落地-LangChain与MCP协议-重塑AI工具调用的未来格局(二)
集成LangChain将MCP工具无缝融入Agent工作流。原创 2025-04-09 08:30:00 · 24629 阅读 · 13 评论 -
开源模型应用落地-LangChain与MCP协议-集成GPT-4o构建下一代AI智能体的全栈实践(三)
LangChain集成MCP协议与GPT-4o模型,构建高效、安全且可扩展的下一代AI智能体的全栈技术路径。原创 2025-04-10 13:58:50 · 24794 阅读 · 8 评论 -
开源模型应用落地-模型上下文协议(MCP)-可视化工具-调式实战(四)
通过官方提供的可视化工具,高效调式MCP Server实现逻辑原创 2025-04-11 08:30:00 · 23596 阅读 · 13 评论 -
开源模型应用落地-模型上下文协议(MCP)-第三方MCP Server实战指南(五)
第三方MCP Server通过复用社区共享的能力,大幅降低了开发者集成外部工具的门槛原创 2025-04-14 22:00:00 · 21190 阅读 · 8 评论 -
开源模型应用落地-模型上下文协议(MCP)-Resource Template-资源模板的使用逻辑(六)
Resource Template 是 MCP 中支持动态生成定制化资源的核心机制,通过参数化设计实现按需上下文注入,广泛适用于自动化运维、云计算与AI交互场景。原创 2025-05-19 14:19:02 · 29154 阅读 · 5 评论 -
开源模型应用落地-模型上下文协议(MCP)-Prompt-提示词的使用逻辑(七)
通过 Model Context Protocol(MCP)中的 Prompt 提升与大型语言模型交互的效率和规范性。原创 2025-05-20 07:30:00 · 28608 阅读 · 14 评论 -
开源模型应用落地-模型上下文协议(MCP)-Context-深入解析message_handler机制与应用场景(八)
message_handler是MCP中实现服务端与客户端高效通信、实时反馈任务进度的核心组件。原创 2025-05-22 08:00:00 · 23702 阅读 · 2 评论