大靠山-CSDN博客

原创应用篇| MCP为智能体插上翅膀

随着OpenManus、owl等通用智能体火爆出圈，mcp协议逐渐被agent框架深度应用。

2025-06-27 20:47:08 696

原创聊聊VLM架构以及训练后的一些实验和思考

多模态大模型（Vision Large Models）主要是能感知多模态输入（目前主要是图片和视频）并产出语言输出（也有直接的多模态输出架构）。目前常见的VLM架构有两种，

2025-06-27 20:42:43 557

原创 MiniMax-M1技术报告关键技术点解读，当前世界上最长上下文窗口的大模型开源了!

MiniMax-M1是**世界首个开源的大规模混合注意力推理模型**，核心目标是解决大模型"推理时计算量爆炸"的问题。它基于团队之前的MiniMax-Text-01模型（4560亿参数，每token激活459亿参数），加入了**Lightning Attention（闪电注意力）**机制，能原生支持**100万token的输入上下文**（是DeepSeek R1的8倍），同时推理时的计算量（FLOPs）大幅降低——比如生成10万token时，比DeepSeek R1少用25%的计算资源。

2025-06-27 20:40:55 325

原创 5分钟了解GraphRAG和Mem0

Graph RAG是微软开发的一种基于图数据库的检索增强生成（Retrieval-Augmented Generation）技术，它将传统的向量检索与图数据库的语义关系相结合，提供更精准的信息检索和生成能力。

2025-06-27 20:39:53 459

原创 AI大模型应用场景大全

**1）*****\*快速查找流程：\****使用者输入需求描述（如"明天出差去重庆培训两天"），AI自动推荐最匹配的流程模板（如《出差申请单》），显示发起当前流程的需提供资料以及相关要求，提高员工找流程效率，降低员工发起流程的学习与沟通成本。

2025-06-26 21:28:08 776

原创开源RAG项目到底如何选型？

首先，我们参与比较的开源 RAG 项目包括 dify、maxkb、ragflow，当然其实还有 fastgpt、bisheng 等等之流，但本文主要集中在 dify、maxkb、ragflow 以及 langflow。

2025-06-26 21:26:17 432

原创 FaithfulRAG: 基于事实级别RAG的冲突建模 - 厦大&香港理工等

大型语言模型（LLMs）结合检索系统在处理知识密集型任务中展现了显著潜力。然而，这些模型往往在忠实度方面存在困难，生成的输出要么忽略检索到的上下文，要么不一致地将检索到的上下文与LLM的参数化知识混合。在知识冲突的情况下，这一问题尤为严重，即检索到的上下文与模型的参数化知识相冲突。虽然现有的忠实检索增强生成方法通过精心设计的提示或修改后的解码策略来强制遵循上下文，但我们的分析揭示了一个关键限制：它们通过强制抑制模型的参数化知识来实现忠实度，这破坏了模型的内部知识结构，

2025-06-26 21:25:40 753

原创论文速递|ACL 2025：利用双向动态交互和情感知识增强夸张和隐喻检测

夸张和隐喻作为常见的修辞手段，不仅丰富了语言表达，还在情感传递和语义理解中发挥关键作用。因此，准确检测和理解夸张与隐喻对提升情感分析系统、智能聊天机器人等自然语言处理（NLP）任务的性能具有重要意义。然而，由于其语义模糊性和表达多样性，识别夸张和隐喻一直是NLP研究中的挑战性问题。

2025-06-26 21:24:56 556

原创用 Dify 搭了一个智能客服，创造你的第一个“数字员工”

今天，我就带你从零开始，实战搭建一个最小可用的 AI 智能体，看它怎么帮我每天省下 1 个小时。

2025-06-25 20:32:57 772

原创 Harmon：协调视觉表征，统一多模态理解和生成（模型已开源）

吴思泽，南洋理工大学MMLab@NTU四年级博士生，导师是Chen Change Loy，研究方向为基于多模态模型的视觉理解和生成、开放世界的检测分割等，在ICCV/CVPR/ICLR等顶级学术会议上发表过多篇论文。

2025-06-25 20:32:06 829

原创成本降50%、准确率提升40%，美国头部地产AI 公司用Agent弯道超车

在中国，买一套房，除了要有钱，还要看居住证、看社保、看户籍地；要关注当地限购政策，关注交易税，关注银行贷款、资金审核、税率变化……各种乱七八糟的文件与政策看得人头晕眼花？

2025-06-25 20:30:52 617

原创如何构建和调优高可用性的Agent？浅谈阿里云服务领域Agent构建的方法论

随着整个AI业界的发展，我逐渐发现无论是集团内外，还是各行各业，都有越来越多人开始关注、学习Agent，并且开始实践、开发、部署Agent。因此，无论是从Agent的概念，还是具体落地方法论上，也出现了越来越多的争议和讨论，当然，这种思维模式和落地实践上的百花齐放，也是非常有利于促进Agent这个新兴技术的持续发展的。

2025-06-25 20:30:16 607

原创人工智能产业链全景图谱

人工智能(AI)产业通常划分为**基础层、技术层、应用层**三级架构。这种分层结构体现了从底层资源支撑到核心能力开发，再到场景落地的完整产业链逻辑。『制造前沿』本文详细分析**人工智能产业链全景图**，从底层芯片到场景落地，一文看懂产业格局。

2025-06-24 21:41:32 1065

原创成本暴降88%！通义实验室、北大发布ZeroSearch，无需搜索即可激活LLM检索能力

本文作者来自通义实验室和北京大学，第一作者是北京大学智能学院博士生孙浩，主要研究方向是RAG和Agent，在 NeurIPS、ACL、EMNLP 等国际顶级会议上发表多篇论文，师从张岩教授。该工作在阿里巴巴通义实验室RAG团队实习期间完成

2025-06-24 21:40:00 868

原创 70%大小，100%准确！完美压缩LLM性能0损失，推理速度最高飙升39倍

人人都想有一个自己的DeepSeek，但并不是人人都有「一打」96GB显存的H20。虽然量化可以极大地降低模型对于显存的需求，但它本质上是一种有损压缩技术。

2025-06-24 21:38:39 842

原创这思路逆天了！注意力机制+CLIP霸榜顶会，直接带飞发文之路！

今天分享一个多模态研究的核心方向：**注意力机制+CLIP**。这种结合可以通过动态对齐、上下文感知和并行计算，显著提升多模态任务的性能。在多模态爆火的当下，算是热点赛道。

2025-06-24 21:36:35 1005

原创基于知识图谱与大语言模型的中药方剂智能生成TCM-KLLaMA

构建涵盖症状、舌象和脉象等信息的中医症状知识图谱，并通过提出的 SMKI 机制增强模型生成能力。

2025-06-23 21:33:01 926

原创国内 AI 大模型

国内AI大模型相关股是指那些在人工智能领域拥有核心技术和产品的上市公司。🤖

2025-06-23 21:31:49 979

原创不到 1GB 显存跑通 VLM？Hugging Face 再次定义小模型新范式 | SmolVLM 技术详解

大模型拼参数，小模型卷效率。在大多 Vision-Language Model（VLM）疯狂扩容的同时，Hugging Face 联合 Stanford 推出了让人眼前一亮的**SmolVLM**系列小模型。

2025-06-23 21:31:14 961

原创自己动手「空间智能」-一张图「智能体」实战～

今天将之前规划的一张图「智能体」相关的内容整理完成了，2025年完全可以说是Agent快速发展的一年，巨头们纷纷发布了自己的Agent产品，而对于我们自己来说是如何更新自己的技术理解以及技术栈，从而实现解决方案以及产品的「智能体」化升级，本期内容则以大家最熟悉的一张图为例，讲解一张图「智能体」的构建方法和背后的技术，便于大家理解，至此知识星球中前期规划的自己动手「空间智能」的内容都完成了（当然后续还会有根据技术趋势持续的内容规划和更新），如下是相关的内容：

2025-06-23 21:30:03 1000

原创只改2行代码，RAG效率暴涨30%！多种任务适用，可扩展至百亿级数据规模应用

只需修改两行代码，RAG向量检索效率暴涨**30%**！

2025-06-22 10:45:00 1614

原创 RAGFlow v0.19图文混排：详细拆解+预处理增强案例

RAGFlow在5/26 正式更新了v0.19版本，其中有两点值得关注。首当其冲的是在 Agent 模块（也就是工作流）新增了代码执行组件，这个被吐槽了很久了 RAGFlow工作流编排功能，终于可以处理更加复杂的任务了。

2025-06-21 20:11:47 1045

原创 Qwen3 Embedding模型架构、训练方法、数据策略

Embedding和reranker模型的核心思想是通过任务感知的方式**评估相关性**。给定一个查询和一个文档，模型根据由指令定义的相似性标准评估它们的相关性。训练数据通常组织为，其中表示与查询相关的正文档，表示不相关的负文档。通过在多样化的文本对上训练模型，可以增强其在包括检索、语义文本相似性、分类和聚类等下游任务中的适用性。下面来详细的看下Qwen3 Embedding模型架构、训练方法、数据策略。

2025-06-21 20:10:18 709

原创大模型行业真香！只有想不到的专业，没有不能转的“门外汉”

其实薪资情况代表着背后的行业，有前景的行业注定能赚钱，日薄西山或是平平无奇的行业也能赚钱，但上限就在那，不可能赚得了大钱。

2025-06-20 22:56:37 584

原创都在劝退？大模型前景如何？

近期，关于大模型的就业前景引起了不少讨论，一方面，它代表了技术的最前沿，吸引了无数科技工作者的目光；另一方面，在现实就业中存在着一定的挑战。无论是在保研过程中，还是进入职场后，选择大模型相关的研究或岗位，都需要深刻认识行业的现状与未来发展。

2025-06-20 22:54:42 651

原创 AI Agent落地实践：21个头部企业案例研究

AI Agent是指具有自主性或半自主性的智能实体**，能够利用人工智能技术在数字或物理环境中**感知、决策、采取行动并实现目标**。与Copilot、聊天机器人等相比，AI Agent能够自主规划和行动，实现用户预设的目标。

2025-06-19 20:35:49 1002

原创少说‘Wait’，多做题：NoWait重塑大模型推理路径

现代大模型（如DeepSeek-R1）在复杂推理时，总爱插入``标签和“**Wait**”、“**Hmm**”等自我反思词（如人类纠结时的喃喃自语），像人一样“自言自语”（“Wait... Let me double check…”）。然而，**这些词触发冗余验证循环**，导致推理轨迹臃肿（例如一道数学题生成7000+ token），拖慢速度且徒增算力消耗。

2025-06-19 20:34:18 993

原创基于RAG架构的数字人智能客服应用实践

数字金融作为2023年中央金融工作会议提出的“五篇大文章”之一，其目标在于促进金融机构运用数字技术提升重点领域金融服务质效、提高“数实融合”水平，以及建设数字金融服务生态，以推动我国金融领域的高质量发展。基于此背景，交银金融科技有限公司(以下简称“交银金科”)聚焦智慧交易链平台的“蕴通易信”场景，融合多种人工智能技术，积极探索基于检索增强生成(RAG)架构的数字人智能客服应用。实践表明，基于RAG架构的数字人智能客服凭借全天候在线、准确高效、个性化服务及低成本运营等特性，不仅显著提升了用户满意度与忠诚度，还

2025-06-19 20:33:37 983

空空如也

空空如也