自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1069)
  • 收藏
  • 关注

原创 应用篇| MCP为智能体插上翅膀

随着OpenManus、owl等通用智能体火爆出圈,mcp协议逐渐被agent框架深度应用。

2025-06-27 20:47:08 696

原创 聊聊VLM架构以及训练后的一些实验和思考

多模态大模型(Vision Large Models)主要是能感知多模态输入(目前主要是图片和视频)并产出语言输出(也有直接的多模态输出架构)。目前常见的VLM架构有两种,

2025-06-27 20:42:43 557

原创 MiniMax-M1技术报告关键技术点解读,当前世界上最长上下文窗口的大模型开源了!

MiniMax-M1是**世界首个开源的大规模混合注意力推理模型**,核心目标是解决大模型"推理时计算量爆炸"的问题。它基于团队之前的MiniMax-Text-01模型(4560亿参数,每token激活459亿参数),加入了**Lightning Attention(闪电注意力)**机制,能原生支持**100万token的输入上下文**(是DeepSeek R1的8倍),同时推理时的计算量(FLOPs)大幅降低——比如生成10万token时,比DeepSeek R1少用25%的计算资源。

2025-06-27 20:40:55 325

原创 5分钟了解GraphRAG和Mem0

Graph RAG是微软开发的一种基于图数据库的检索增强生成(Retrieval-Augmented Generation)技术,它将传统的向量检索与图数据库的语义关系相结合,提供更精准的信息检索和生成能力。

2025-06-27 20:39:53 459

原创 AI大模型应用场景大全

**1)*****\*快速查找流程:\****使用者输入需求描述(如"明天出差去重庆培训两天"),AI自动推荐最匹配的流程模板(如《出差申请单》),显示发起当前流程的需提供资料以及相关要求,提高员工找流程效率,降低员工发起流程的学习与沟通成本。

2025-06-26 21:28:08 776

原创 开源RAG项目到底如何选型?

首先,我们参与比较的开源 RAG 项目包括 dify、maxkb、ragflow,当然其实还有 fastgpt、bisheng 等等之流,但本文主要集中在 dify、maxkb、ragflow 以及 langflow。

2025-06-26 21:26:17 432

原创 FaithfulRAG: 基于事实级别RAG的冲突建模 - 厦大&香港理工等

大型语言模型(LLMs)结合检索系统在处理知识密集型任务中展现了显著潜力。然而,这些模型往往在忠实度方面存在困难,生成的输出要么忽略检索到的上下文,要么不一致地将检索到的上下文与LLM的参数化知识混合。在知识冲突的情况下,这一问题尤为严重,即检索到的上下文与模型的参数化知识相冲突。虽然现有的忠实检索增强生成方法通过精心设计的提示或修改后的解码策略来强制遵循上下文,但我们的分析揭示了一个关键限制:它们通过强制抑制模型的参数化知识来实现忠实度,这破坏了模型的内部知识结构,

2025-06-26 21:25:40 753

原创 论文速递|ACL 2025:利用双向动态交互和情感知识增强夸张和隐喻检测

夸张和隐喻作为常见的修辞手段,不仅丰富了语言表达,还在情感传递和语义理解中发挥关键作用。因此,准确检测和理解夸张与隐喻对提升情感分析系统、智能聊天机器人等自然语言处理(NLP)任务的性能具有重要意义。然而,由于其语义模糊性和表达多样性,识别夸张和隐喻一直是NLP研究中的挑战性问题。

2025-06-26 21:24:56 556

原创 用 Dify 搭了一个智能客服,创造你的第一个“数字员工”

今天,我就带你从零开始,实战搭建一个最小可用的 AI 智能体,看它怎么帮我每天省下 1 个小时。

2025-06-25 20:32:57 772

原创 Harmon:协调视觉表征,统一多模态理解和生成(模型已开源)

吴思泽,南洋理工大学MMLab@NTU四年级博士生,导师是Chen Change Loy,研究方向为基于多模态模型的视觉理解和生成、开放世界的检测分割等,在ICCV/CVPR/ICLR等顶级学术会议上发表过多篇论文。

2025-06-25 20:32:06 829

原创 成本降50%、准确率提升40%,美国头部地产AI 公司用Agent弯道超车

在中国,买一套房,除了要有钱,还要看居住证、看社保、看户籍地;要关注当地限购政策,关注交易税,关注银行贷款、资金审核、税率变化……各种乱七八糟的文件与政策看得人头晕眼花?

2025-06-25 20:30:52 617

原创 如何构建和调优高可用性的Agent?浅谈阿里云服务领域Agent构建的方法论

随着整个AI业界的发展,我逐渐发现无论是集团内外,还是各行各业,都有越来越多人开始关注、学习Agent,并且开始实践、开发、部署Agent。因此,无论是从Agent的概念,还是具体落地方法论上,也出现了越来越多的争议和讨论,当然,这种思维模式和落地实践上的百花齐放,也是非常有利于促进Agent这个新兴技术的持续发展的。

2025-06-25 20:30:16 607

原创 人工智能产业链全景图谱

人工智能(AI)产业通常划分为**基础层、技术层、应用层**三级架构。这种分层结构体现了从底层资源支撑到核心能力开发,再到场景落地的完整产业链逻辑。『制造前沿』本文详细分析**人工智能产业链全景图**,从底层芯片到场景落地,一文看懂产业格局。

2025-06-24 21:41:32 1065

原创 成本暴降88%!通义实验室、北大发布ZeroSearch,无需搜索即可激活LLM检索能力

本文作者来自通义实验室和北京大学,第一作者是北京大学智能学院博士生孙浩,主要研究方向是RAG和Agent,在 NeurIPS、ACL、EMNLP 等国际顶级会议上发表多篇论文,师从张岩教授。该工作在阿里巴巴通义实验室RAG团队实习期间完成

2025-06-24 21:40:00 868

原创 70%大小,100%准确!完美压缩LLM性能0损失,推理速度最高飙升39倍

人人都想有一个自己的DeepSeek,但并不是人人都有「一打」96GB显存的H20。虽然量化可以极大地降低模型对于显存的需求,但它本质上是一种有损压缩技术。

2025-06-24 21:38:39 842

原创 这思路逆天了!注意力机制+CLIP霸榜顶会,直接带飞发文之路!

今天分享一个多模态研究的核心方向:**注意力机制+CLIP**。这种结合可以通过动态对齐、上下文感知和并行计算,显著提升多模态任务的性能。在多模态爆火的当下,算是热点赛道。

2025-06-24 21:36:35 1005

原创 基于知识图谱与大语言模型的中药方剂智能生成TCM-KLLaMA

构建涵盖症状、舌象和脉象等信息的中医症状知识图谱,并通过提出的 SMKI 机制增强模型生成能力。

2025-06-23 21:33:01 926

原创 国内 AI 大模型

国内AI大模型相关股是指那些在人工智能领域拥有核心技术和产品的上市公司。🤖

2025-06-23 21:31:49 979

原创 不到 1GB 显存跑通 VLM?Hugging Face 再次定义小模型新范式 | SmolVLM 技术详解

大模型拼参数,小模型卷效率。在大多 Vision-Language Model(VLM)疯狂扩容的同时,Hugging Face 联合 Stanford 推出了让人眼前一亮的**SmolVLM**系列小模型。

2025-06-23 21:31:14 961

原创 自己动手「空间智能」-一张图「智能体」实战~

今天将之前规划的 一张图「智能体」相关的内容整理完成了,2025年完全可以说是Agent快速发展的一年,巨头们纷纷发布了自己的Agent产品,而对于我们自己来说是如何更新自己的技术理解以及技术栈,从而实现解决方案以及产品的「智能体」化升级,本期内容则以大家最熟悉的一张图为例,讲解一张图「智能体」的构建方法和背后的技术,便于大家理解,至此知识星球中前期规划的自己动手「空间智能」的内容都完成了(当然后续还会有根据技术趋势持续的内容规划和更新),如下是相关的内容:

2025-06-23 21:30:03 1000

原创 只改2行代码,RAG效率暴涨30%!多种任务适用,可扩展至百亿级数据规模应用

只需修改两行代码,RAG向量检索效率暴涨**30%**!

2025-06-22 10:45:00 1614

原创 RAGFlow v0.19图文混排:详细拆解+预处理增强案例

RAGFlow在5/26 正式更新了v0.19版本,其中有两点值得关注。首当其冲的是在 Agent 模块(也就是工作流)新增了代码执行组件,这个被吐槽了很久了 RAGFlow工作流编排功能,终于可以处理更加复杂的任务了。

2025-06-21 20:11:47 1045

原创 Qwen3 Embedding模型架构、训练方法、数据策略

Embedding和reranker模型的核心思想是通过任务感知的方式**评估相关性**。给定一个查询和一个文档,模型根据由指令定义的相似性标准评估它们的相关性。训练数据通常组织为,其中表示与查询相关的正文档,表示不相关的负文档。通过在多样化的文本对上训练模型,可以增强其在包括检索、语义文本相似性、分类和聚类等下游任务中的适用性。下面来详细的看下Qwen3 Embedding模型架构、训练方法、数据策略。

2025-06-21 20:10:18 709

原创 大模型行业真香!只有想不到的专业,没有不能转的“门外汉”

其实薪资情况代表着背后的行业,有前景的行业注定能赚钱,日薄西山或是平平无奇的行业也能赚钱,但上限就在那,不可能赚得了大钱。

2025-06-20 22:56:37 584

原创 都在劝退?大模型前景如何?

近期,关于大模型的就业前景引起了不少讨论,一方面,它代表了技术的最前沿,吸引了无数科技工作者的目光;另一方面,在现实就业中存在着一定的挑战。无论是在保研过程中,还是进入职场后,选择大模型相关的研究或岗位,都需要深刻认识行业的现状与未来发展。

2025-06-20 22:54:42 651

原创 AI Agent落地实践:21个头部企业案例研究

AI Agent是指具有自主性或半自主性的智能实体**,能够利用人工智能技术在数字或物理环境中**感知、决策、采取行动并实现目标**。与Copilot、聊天机器人等相比,AI Agent能够自主规划和行动,实现用户预设的目标。

2025-06-19 20:35:49 1002

原创 少说‘Wait’,多做题:NoWait重塑大模型推理路径

现代大模型(如DeepSeek-R1)在复杂推理时,总爱插入``标签和“**Wait**”、“**Hmm**”等自我反思词(如人类纠结时的喃喃自语),像人一样“自言自语”(“Wait... Let me double check…”)。然而,**这些词触发冗余验证循环**,导致推理轨迹臃肿(例如一道数学题生成7000+ token),拖慢速度且徒增算力消耗。

2025-06-19 20:34:18 993

原创 基于RAG架构的数字人智能客服应用实践

数字金融作为2023年中央金融工作会议提出的“五篇大文章”之一,其目标在于促进金融机构运用数字技术提升重点领域金融服务质效、提高“数实融合”水平,以及建设数字金融服务生态,以推动我国金融领域的高质量发展。基于此背景,交银金融科技有限公司(以下简称“交银金科”)聚焦智慧交易链平台的“蕴通易信”场景,融合多种人工智能技术,积极探索基于检索增强生成(RAG)架构的数字人智能客服应用。实践表明,基于RAG架构的数字人智能客服凭借全天候在线、准确高效、个性化服务及低成本运营等特性,不仅显著提升了用户满意度与忠诚度,还

2025-06-19 20:33:37 983

原创 16家银行AI Agent建设进展:“场景+智能体”成为下一战场

自2022年底ChatGPT爆火以来,在过去2年多的时间里,银行业大模型建设如火如荼,头部银行构建从算力、模型、数据到平台的企业级大模型应用支撑体系,并已在知识助手、代码助手、智能客服等内部流程赋能型场景实现降本增效、优化体验。

2025-06-19 20:32:59 349

原创 最值得报考的8个专业,就业率达到95%以上,25届学生和家长要清楚!

根据教育部最近两年批复的情况来看,国家正在大规模增设各类专业,目前全国已经有超过800个普通本科专业,但是很多专业实则都是换汤不换药。

2025-06-18 20:12:54 1097

原创 字节Seed开源BAGEL: 更聪明的统一生成理解模型

我们开源了BAGEL——新的统一多模态基础模型,支持文本、图像、视频的端到端理解与生成,在标准基准测试中显著超越现有开源模型,并展现一系列复杂推理能力,包括自由图像操控、未来帧预测、3D空间操作、世界导航等。我们观察到,统一模型在增加参数与训练量的过程中,处理不同任务的智能逐渐涌现,从基础的图文理解和文生图,到多样化的editing,再到复杂的manipulation 详细的评测,模型的智能程度不断提升。

2025-06-18 20:12:02 806

原创 传统RAG只会翻书不会用?RAG+让Reasoning能力上一个新高度!

为什么传统知识库不够聪明?想象你让模型解一道数学题:它从知识库翻出了公式,却因不会套用公式而算错答案——这就是当前检索增强生成(RAG)技术的致命伤!

2025-06-18 20:10:57 853

原创 颠覆认知!大模型自检自改新范式,彻底告别人工标注

一句话概括,这篇论文教大模型左右互搏,自己出题自己改,改不好还要挨板子,堪称精神分裂式学习法。

2025-06-18 20:09:41 868

原创 谷歌具身智能VLA大模型 —— Gemini Robotics : 将人工智能带入到物理世界

真正实用的机器人需要能够理解周围的物理世界,并以可靠且安全的方式与之交互。也就是说,基于物理实体的AI智能体必须具备鲁棒的人类级具身推理能力,即包含在物理具身世界中操作和运行所需的基础概念的世界知识体系。

2025-06-17 21:08:39 987

原创 大模型三大步 -- 上下文检索RAG

上下文检索**(Contextual Search)是一种嵌入上下文环境中的智能信息检索方法。它允许用户通过提问扩展法不断选择和修正与提问有关的上下文属性值,而系统则通过来自文档和用户反馈的上下文信息不断拓展和修正,最终形成与检索词相关的最佳匹配,将所需资源响应集呈现给用户‌。

2025-06-17 21:06:15 613

原创 一文讲清楚大模型中8个关键词及原理:LLM、Transformer、GPT、Bert、预训练、微调、深度学习、Token

你是不是脑子里浮现的是 OpenAI、ChatGPT、DeepSeek?还有各式各样能跳个舞、可以翻个跟头的机器人?再深入点的,还能说出训练与推理。

2025-06-17 21:02:48 514

原创 基于Memory Bank的Cursor长会话记忆内存库理论研究与实践

在处理复杂任务时,通常需要我们和Cursor进行多轮对话,而随着对话轮次的增多,Cursor对于核心任务和工作重点的记忆丢失的越多,归根到底,是由于**大模型缺乏长期记忆机制**。

2025-06-16 21:40:46 1018

原创 Anthropic:这样构建Agent,性能提升90%!

今天,咱们来复盘一下Anthropic最新分享的关于多智能体系统构建的常委呢,他们几乎毫无保留地分享了如何从0到1构建一个强大的多智能体(Multi-Agent)DeepResearch系统,就是Claude现在内置的那个Research功能。

2025-06-16 21:36:55 615

原创 这一篇带你入门大模型微调

分解成两个低维度(矩阵运算 m * r * r * n =m* n),上图中数据 x 都要给原来的模型和分解后的模型(的 r 矩阵,也就是 Lora 矩阵) 训练,用的时候要合并

2025-06-16 21:35:47 598

原创 一手测评|RAG总卡死?大模型给Embedding API 时延背了太多锅了

自今年年初DeepSeek爆火,紧随其后MCP降低应用开发难度,**构建企业级知识库,早就从可选项变成了必选项。**

2025-06-15 10:45:00 514

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除