- 博客(127228)
- 资源 (6)
- 收藏
- 关注
原创 Anthropic 团队内部实战:如何用 Claude Code 重构研发效率全流程
研究团队通过 Claude Code,基于最新的研究论文与理论设计,快速复现对齐算法的核心逻辑,同时生成超参数调优、效果验证的辅助脚本,大幅缩短从理论研究到实验验证的周期,让研究人员可以聚焦于算法设计本身,而非繁琐的代码实现。新人快速上手与培养:针对新入职的工程师,Claude Code 是最佳的上手工具——新人可通过 Claude Code 快速了解团队的技术栈、代码架构、研发流程与内部规范,针对不熟悉的模块与接口,可随时查询设计思路与使用方法,大幅缩短新人的上手周期,降低 mentor 的带教负担。
2026-03-14 00:41:04
689
1
原创 编程之外:IT软技能完全指南
学生们在我们开始讨论范围定义时常常翻白眼。“我们不能直接开始编码吗?”他们问道。但多年的教学经验表明:那些花时间把范围定义得非常清晰的团队,最终能够庆祝成功,而不是为了修正根本的误解而熬夜。定义范围意味着三件事:你正在构建的东西(目标)、你正在交付的东西(实际内容),以及你绝对不做的事情(边界)。最后这部分?至关重要,而且常常被忽略。捕捉需求项目管理不仅仅是一系列工具和技术——它是一种思考复杂工作的方式,这种方式能帮助你持续交付成果。
2026-01-22 03:57:30
259
原创 【FreeManus】AI Agent 架构师的30项必备修炼 / 光子AI - Photon.ai
《AI Agent架构师的30项必备修炼》为AI Agent开发者提供系统化的成长路径,涵盖从基础理论到前沿技术的完整知识体系。全书分为基础筑基、核心架构、工程落地和前沿进阶四大模块,包含30项核心技能修炼,如ReAct架构设计、多Agent协作系统、具身智能实现等。通过理论讲解与代码实践相结合(如马尔可夫决策过程、极简ReAct Agent实现等),帮助读者掌握AI Agent系统设计的关键技术。该书适合不同阶段的开发者:入门者可系统学习基础理论,进阶者聚焦架构设计,企业架构师侧重工程落地,研究者探索前沿
2026-01-12 01:33:30
664
原创 【光子AI 2026 企业级 Agent 架构指南】别再把 Skill 当 Tool:Agent Skills × MCP 企业级落地全指南(最新定义澄清 + 场景大全 + 选型决策树+安全工程清单)
摘要: 2026年企业级AI架构迎来两大核心标准——Agent Skills与MCP(Model Context Protocol),分别解决流程标准化与系统集成难题。Agent Skills通过“文件夹化能力包”(SOP+脚本+模板)固化专家流程,确保输出一致性;MCP则以类USB-C的协议统一外部系统接入,降低集成成本。两者差异显著:Skills专注程序性知识(如财报生成),MCP侧重动态连接(如跨平台数据调用)。实际场景中,复杂需求(如智能客服)需组合使用——MCP为骨架提供连接能力,Skills为大
2026-01-08 00:48:55
1873
原创 【光子 AI】在实际业务中做好 AI Agent的关键是什么?
在实际业务中实现高效AI Agent的关键在于工程化与业务化的系统融合,而非单纯追求模型规模或概念创新。核心要点包括:精准定义业务级问题,确保任务可拆解、可判定;强化上下文工程与确定性工具调用;建立完善的评价体系与失败路径设计;重构组织流程以适应Agent运作;优先开发窄领域Agent再扩展为网络。最终目标是实现问题真实、边界清晰、结果可控、价值可量化的AI Agent解决方案。
2025-12-24 11:09:37
253
6
原创 【光子 AI 】整理 AI 人工智能发展历史上里程碑事件的关键论文清单和下载地址
本文整理了人工智能发展史上15篇具有里程碑意义的关键论文,涵盖1943年至2020年间的重要突破。清单按时间顺序排列,每篇论文包含:发表年份、标题、主要作者、历史意义说明以及可直接下载的PDF链接。这些论文代表了AI发展的关键节点,从早期的神经网络理论奠基(McCulloch&Pitts,1943)、感知机模型(Rosenblatt,1958)、反向传播算法(Rumelhart等,1986),到深度学习的复兴(Hinton等,2006)、AlexNet突破(2012),以及近年来的Transform
2025-12-18 13:05:02
924
原创 在 MultiAgent 系统中,多个 Agent 之间是怎样协作通信和共享上下文的?给出详细的实现原理和框架案例深度解析(例如 LangChain)
多Agent系统中的协作通信与上下文共享机制解析 摘要: 多Agent系统的协作通信主要通过三种架构模式实现:1)集中式协调(Orchestrator模式),2)点对点消息传递,3)黑板/共享内存机制。上下文共享则采用消息链式传递、结构化共享状态对象或外部记忆存储三种方式。以LangGraph为例,它采用有状态图(StateGraph)模型,每个Agent作为节点对共享状态进行读写,通过节点连接定义协作路径,实现高效上下文共享。典型实现包含定义State类型、构建Agent节点、设置条件边等步骤,兼顾灵活性
2025-12-10 23:42:07
1243
1
原创 【Java 面试宝典】30 道 AI 大模型与Agent 算法工程研发与后端工程开发技术面试题宝典(精选面试题和面试必过的答案完整详细解析)
考察点:生成范式、模型家族。自回归 LM:建模 p(x₁,…,x_T) = ∏ p(x_t | x_<t)逐 token 预测下一个词,典型如 GPT。Encoder 将源序列编码成隐表示Decoder 条件生成目标序列:p(y | x)区别:自回归 LM:单序列建模,适合续写、对话、补全。Seq2Seq:明确「输入→输出」映射,适合翻译、摘要等有「源-目标」对。现代很多任务通过「指令 + 上下文」把任务转成纯自回归生成,不再需要显式 Encoder。考察点。
2025-12-10 16:38:03
1223
5
原创 【Java 面试宝典】30 道 Java 面试题宝典(精选面试题和面试必过的答案完整详细解析)
下面给你一份「30 道 Java 面试题宝典」,偏向通用 Java 开发/后端岗位,题目覆盖:每题包含:你可以当作“背诵提纲”来用,真正面试时再展开举例即可。考察点:基本功、OOP 理解。必会:加分:考察点:OO 设计、Java 特性。必会:抽象类()接口(,Java 8+)使用场景:加分:考察点:参数传递机制,常见坑。必会:加分:考察点:对象比较、集合 key、基础扎实度。必会:重写 时:加分:考察点:字符串、性能、线程安全。必会:加分:考察点:异常体系、编码习惯。必会:加分:考察点:集合底层、时间复杂
2025-12-10 16:37:34
1101
1
原创 万字详解:程序员在研发项目需求中与协作方高质量沟通指南——沟通,是程序员最值得投资的软技能
本文系统性地介绍了程序员如何在研发项目中与协作方进行高质量沟通。文章首先强调沟通是程序员职业成长的关键技能,提出从"代码实现者"到"问题解决者"的心态转变。然后从五个核心原则展开:转变角色定位、换位思考、主动沟通、聚焦共同目标和追求共识。 在方法论部分,文章详细拆解了需求沟通的四个阶段: 需求启动与澄清阶段:强调会前准备、高效提问和会后跟进; 需求分析与拆解阶段:包括MVP思维、边缘案例识别和用户故事定义; 技术方案设计与评审阶段:涵盖技术翻译、风险评估和多方案提供;
2025-11-06 01:06:30
1823
3
原创 万字长文:深入解析“上下文工程”(Context Engineering)——驾驭百万Token时代的AI性能缰绳:五种典型的“上下文失效”模式与解决方案
信息过载:上下文超出模型的“有效处理容量”,关键信息被冗余、错误内容掩盖;注意力稀释:模型的注意力资源无法在长上下文中均匀分配,导致关键信息被忽略;一致性缺失:模型缺乏对上下文信息的“校验、冲突处理”机制,无法保证输入的有效性与逻辑性。Context Engineering不是“对抗”大模型的上下文,而是“驾驭”它。在大模型的上下文窗口持续扩容的今天,单纯追求“更长的窗口”已无法解决实际问题——真正的竞争力,在于如何让大模型在海量信息中精准定位核心、规避风险、高效输出。
2025-10-25 12:58:12
4153
原创 万字详解:36岁中国程序员未来三十年人生规划2025-2055
中国程序员36岁后的30年人生规划 36岁的中国程序员正处于职业与人生的关键转折点。面对技术迭代、AI崛起和行业变革,未来30年规划应分三阶段推进: 36-40岁(转型期):选择技术深耕或管理转型,聚焦AI、云计算等新兴领域,突破职业瓶颈,提升软技能。 41-50岁(黄金期):发展多元化职业路径,打造个人品牌,建立副业与投资组合,应对职业风险。 51-65岁(价值期):转向咨询、教育等柔性工作,参与公益活动,实现经验传承与人生价值。规划需兼顾技术敏感度、财务稳健和生活平衡,在快速变化的行业中保持持续竞争力与
2025-07-07 01:23:20
6516
14
原创 《Agentic AI 实战》第7章 DeepResearcher:基于MCP和browser-use实现深度研究Agent
DeepResearcher:基于MCP与浏览器自动化的深度研究Agent DeepResearcher是一个结合MCP(Model Context Protocol)和browser-use技术的智能研究Agent系统,实现了网络搜索、学术论文分析、网页内容提取与结构化报告生成的全流程自动化。系统采用分布式微服务架构,包含研究服务器、客户端服务器、LangGraph工作流和Streamlit前端等核心组件。 技术亮点包括: 通过MCP协议标准化连接LLM与外部工具 使用browser-use技术进行深度网
2025-06-23 23:10:15
1323
原创 程序员职业生涯系列:关于技术能力的思考与总结
引子儒、释(佛)、道三家思想:释(佛家):处理好人与心的关系,我们要战胜自己;儒(儒家):处理好人与人的关系,我们要团结好他人;道(道家):处理好人与自然的关系,我们应该顺势而为。明人陆绍珩《醉古堂剑扫》自叙有云:一愿识尽人间好人,二愿读尽世间好书,三愿看尽世间好山水。或曰:静则安能,但身到处,莫放过耳。旨哉言乎!余性懒,逢世一切炎热争逐之场,了不关情。惟是高山流水,任意所如,遇翠丛紫莽,竹林芳径......
2022-08-29 10:00:40
136140
241
原创 Agent 推理 vs Agent 执行:两大能力为何必须分离才能落地
在自主Agent系统的设计与实现中,推理与执行是两大核心能力。本文从第一性原理出发,深入分析了这两大能力的本质区别、相互关系以及为什么在实际落地应用中必须将它们分离设计。我们通过数学模型、架构图示、代码实现和案例研究,全面阐述了分离设计的理论基础、技术优势和实践价值。文章不仅为Agent系统开发者提供了具体的实现指南,也为理解人工智能系统的认知架构提供了新的视角。在深入探讨之前,我们需要明确定义问题空间。什么是Agent推理?它包括哪些具体能力?有什么特点?什么是Agent执行?它包括哪些具体能力?
2026-04-23 02:13:52
106
原创 深入解析 Multi-Agent 协同决策机制与架构设计
让我们从一些基础定义开始,为后续的讨论建立共同的语言。在计算机科学和人工智能领域,智能体(Agent)是指一个能够感知环境、做出决策并执行动作的实体。智能体是任何可以通过传感器感知环境,并通过执行器作用于该环境的事物。atπstatπststs_tst是时刻ttt的环境状态(或智能体的观测)π\piπ是智能体的策略(Policy),即从状态到动作的映射ata_tat是智能体在时刻ttt选择执行的动作多智能体系统(MAS)
2026-04-23 01:22:43
15
原创 AI Agent执行链路的性能优化:从延迟到吞吐量的系统调优
本文以图灵奖获得者David Patterson提出的「延迟-吞吐量权衡定律」为第一性原理,对AI Agent执行链路这一新兴分布式智能系统进行了全方位的结构化分解与性能优化实践。首先,我们从领域背景出发,梳理了Agent执行链路从早期「大语言模型(LLM)单步推理」到当前「多Agent协作、链式工具调用、状态持久化」的5个关键演化阶段,并通过问题空间的三维度量化模型(延迟维度DtotalDtotal、吞吐量维度TpeakTpeak、资源效率维度EresourceE。
2026-04-23 00:26:27
99
原创 MetaGPT 深度剖析:AI Agent Harness Engineering 从需求到产品的全流程自动化逻辑
MetaGPT是一个基于大语言模型的多 Agent 协作框架,它模拟了真实软件公司的工作流程,通过多个专门化的 AI Agent 协作完成复杂的软件开发任务。核心概念:多 Agent 系统:由多个具有不同专业角色的 AI Agent 组成角色扮演:每个 Agent 扮演特定的软件开发角色(产品经理、架构师、工程师等)标准化工作流程:遵循 SOP(标准操作程序)进行协作结构化输出:生成标准化的软件工程文档和 artefacts在这一节中,我们将通过一个实际的例子来展示 MetaGPT 的强大能力。
2026-04-22 23:35:19
46
1
原创 拆解 AI Agent Harness Engineering 核心架构:大脑、感知与工具使用的完美闭环
AI Agent 并不是一个新概念——早在 1956 年的达特茅斯会议上,马文·明斯基(Marvin Minsky)就提出了「Artificial Intelligence」的概念,而「Agent」这个词在计算机科学领域的使用可以追溯到 20 世纪 70 年代的分布式人工智能(Distributed Artificial Intelligence, DAI)领域,当时的研究人员主要关注的是「如何让多个智能体协同工作来解决一个复杂的问题」——比如「分布式机器人导航」、「分布式资源调度」。
2026-04-22 22:33:58
19
原创 从单智能体到多智能体:系统复杂性管理的工程实践
本文的核心目的是让没有AI/多智能体基础的程序员,也能从零到一理解并实现一个简单但实用的多智能体协作系统识别“什么时候应该用单智能体,什么时候必须用多智能体”——技术选型的第一原则拆解多智能体系统的复杂性——系统架构的核心步骤选择合适的算法、工具和最佳实践——落地工程的关键武器第一步:热身——搭一个单个的咖啡师乐高小人(单智能体基础)第二步:思考——为什么单个咖啡师不够用?(问题背景与技术选型)第三步:规划——怎么让一群咖啡师乐高小人分工?(多智能体核心概念、架构、数学模型)
2026-04-22 21:32:34
91
原创 为什么你的 AI Agent Harness Engineering 总是“听不懂人话”?意图识别与槽位填充的优化实战
在构建智能对话系统时,我们常常遇到AI"听不懂人话"的尴尬场景。本文将深入探讨AI Agent中自然语言理解的核心技术——意图识别与槽位填充,分析导致系统"理解障碍"的根本原因,并提供一套完整的优化实战方案。我们将从基础概念讲起,逐步深入到技术原理、算法实现、项目实战,最后展望未来发展趋势,帮助你构建更"善解人意"的AI系统。在当今这个AI赋能的时代,智能对话系统已经渗透到我们生活的方方面面:从手机上的语音助手,到电商平台的客服机器人,再到智能家居的控制中心。
2026-04-22 20:31:11
207
原创 AI Agent Harness Engineering Harness工程的代码管理最佳实践:Agent逻辑的版本控制与协作开发
概念奠基:我们将深入剖析 AI Agent Harness Engineering 的核心概念、组成要素,并通过可视化图表展示它们之间的关系。挑战分析:详细对比传统软件工程与 Agent 开发在代码管理上的差异,明确我们面临的核心挑战。仓库结构与代码组织:授人以鱼不如授人以渔,我们将推荐一套最佳的仓库目录结构,并解释为什么这样设计。版本控制最佳实践:这是全文的重中之重。我们会讲解如何用 Git 管理代码,特别是如何管理 Prompt、配置和模型快照。协作开发与分支策略。
2026-04-22 19:34:56
92
原创 Agent决策系统设计:如何确保AI做出可靠选择
在当今人工智能快速发展的时代,Agent决策系统已经成为AI领域的研究热点和应用核心。从自动驾驶汽车的实时路况判断,到智能客服的对话策略选择,再到金融风控系统的风险评估,Agent决策系统无处不在。Agent决策系统是指能够感知环境、做出决策并执行行动的智能系统。它模拟了人类或生物的决策过程,通过感知器获取环境信息,经过推理和决策过程,最终产生行动输出。核心概念包括:在本文中,我们将深入探讨如何设计一个可靠的Agent决策系统,从理论基础到实践应用,从架构设计到具体实现,全方位解析这一复杂而又重要的主题。随
2026-04-22 02:37:04
146
原创 用 MCP 统一工具接入:从 Function Calling 到能力市场
本文将带你从问题的根源(Function Calling 的碎片化)出发,一步步拆解 MCP 的核心概念、架构设计、数学模型(是的你没看错,MCP 本质上是一种分布式能力调用的协议,背后有严谨的数学基础)、行业发展历史;然后,我们会从零到一实战:搭建一个本地 MCP 服务器、对接 OpenAI/Claude 两个主流大模型、接入几个常用的第三方工具(爬虫、计算器、GitHub 搜索)、最后搭建一个极简版的 LLM 能力市场原型;最后,我们还会探讨 MCP 的边界与外延最佳实践未来发展趋势。
2026-04-22 01:45:53
157
原创 智能体韧性:当 AI Agent Harness Engineering 遇到异常与失败时如何恢复?
假设你正在开发一个企业级AI旅行规划Agent,目标是为用户生成包含「机票预订API验证-酒店预订API验证-景点路线规划-当地美食推荐」四步的完整方案。用户输入“从上海虹桥飞重庆江北,住解放碑附近希尔顿花园酒店,行程3天,预算每人每晚1200元”,Agent明明拿到了机票价格(单程虹桥-江北280元)、希尔顿花园解放碑店每晚1180元(满足预算),却在第三步路线规划时。
2026-04-22 00:44:30
308
原创 用 WebAssembly 插件扩展 Harness 能力
好消息是,Harness在2023年下半年推出了——这是Harness插件架构的一次革命性升级,它彻底解决了上述所有痛点。本文将带你从底层原理到企业级落地我们会先深入理解Harness插件化架构的演进,以及为什么WebAssembly是这次升级的最优解;然后我们会详细介绍Harness Wasm Plugin Framework的核心概念、架构设计和技术选型;接下来我们会用Rust、Go、JavaScript三种主流语言。
2026-04-21 22:46:53
101
原创 Agent幻觉治理实战:记忆增强、置信度校准与人工干预的协同策略
在这篇博客中,我们将深入探讨Agent幻觉治理这一重要话题。想象一下,如果你有一个超级聪明的助手,但它有时候会像讲故事一样编造一些听起来很真实但实际上完全错误的信息,这会是多么令人困扰的事情!这就是我们要解决的"幻觉"问题。我们的目的是教会大家如何使用三种强大的工具——记忆增强、置信度校准和人工干预——来让AI Agent变得更加可靠。我们会从最基础的概念讲起,然后一步步深入到实战应用,最后甚至会展望一下未来的发展方向。
2026-04-21 21:50:37
104
原创 从企业数据到智能体行为:数据管道设计与落地
本文的核心目标是帮助企业技术团队、数据工程师、AI应用开发者,快速掌握AI时代数据管道的设计逻辑和落地方法,跑通「原始数据采集→数据清洗加工→特征/上下文输出→智能体推理→行为执行→数据回流」的完整闭环。本文覆盖的范围包括:数据管道的核心架构设计、多源异构数据的采集适配、批量/实时数据的加工策略、面向智能体的输出适配、管道的可观测性和稳定性建设。不涉及底层大数据存储内核原理、大模型训练、智能体推理逻辑等超出管道范畴的内容。核心概念部分:用奶茶店的类比讲清楚企业数据、数据管道、智能体行为三者的关系。
2026-04-21 20:46:48
210
原创 让 Agent 懂得拒绝:Harness 中的否定约束设计
让读者明白“让AI Agent懂拒绝”的紧迫性和必要性——为什么不能只关注Agent的“能力上限”,还要守住“能力下限”?把Harness中的否定约束设计讲透——从核心概念到数学模型,从算法原理到代码实现,从设计思路到边界守护,全方位拆解。给读者提供可落地的实战指南——不管你是学生、个人开发者还是企业工程师,都能跟着本文的步骤,用Harness快速构建一个有否定约束的AI Agent。展望否定约束的未来发展方向——它会和多模态、大模型微调、强化学习等技术结合成什么样?会面临哪些新挑战?背景介绍。
2026-04-21 19:52:59
247
原创 如何构建金融行业可监管 Agent:审计链、责任链与 Token 留痕
面对上述痛点,我们提出了一套面向金融行业全场景的可监管Agent技术架构——该架构以**「金融级分布式账本(许可链/联盟链)+可验证计算(VC)+可解释大模型(XAI-LLM)」为底层支撑,以「全生命周期的Token留痕机制」为核心枢纽,通过将Agent的「透明不可篡改」的审计链:面向监管机构、内部合规部门,提供从「业务请求发起」到「最终结果反馈」的全流程、细粒度、可解释、可验证的决策证据链查询能力。
2026-04-21 02:55:04
338
原创 ROI 怎么算才靠谱:把节省人力、错误成本与机会成本算清楚
在数字化转型浪潮席卷各行各业的今天,“要不要做这个项目?”“这笔技术投入值不值?”已经成为CEO、CTO、产品经理和业务负责人每天都要面对的灵魂拷问——而ROI(投资回报率)正是回答这些问题的核心工具。然而,大多数企业或团队在计算ROI时,要么只算“明面上”的成本和收益(比如软件采购费、直接销售额增长),要么凭经验拍脑袋估“软收益”,结果要么错过了真正创造长期价值的项目,要么把钱砸进了看似短期收益高但暗藏坑点的项目里。节省的人力成本(从“工时估算升级到人力价值模型”)
2026-04-21 01:53:41
307
原创 Harness 中的推理步数预算:防止无限循环
大语言模型(Large Language Models, LLMs)在复杂推理任务(如数学证明、代码调试、长文本理解与生成、多跳问答系统构建)中展现出惊人的能力——通过思维链(Chain-of-Thought, CoT)自我反思(Self-Reflection)工具调用(Tool Use)等技术,它们能够像人类一样“分步拆解问题”“验证中间结果”“结合外部知识库”完成任务。然而,这一特性也带来了一个致命的安全与效率隐患:LLM 可能陷入无限循环推理递归工具调用逃逸。
2026-04-21 01:02:35
231
原创 Multi-Agent 任务冲突解决:基于博弈论的3种协商机制(附伪代码)
打破认知壁垒:用抢积木、抢蛋糕、抢公交车站这类生活场景,把博弈论、Multi-Agent系统、任务冲突这些“高大上”的学术/工业概念掰碎了讲,让刚接触人工智能的程序员、产品经理、甚至对AI感兴趣的高中生都能看懂。掌握实用工具:不仅讲“是什么”和“为什么”,还要讲“怎么做”——提供3种协商机制的完整原理推导、工业级伪代码、Python可运行代码、测试用例,让读者看完就能直接用到自己的项目里。拓宽应用视野。
2026-04-21 00:06:17
352
原创 Harness Engineering:Agent长流程任务拆分
在正式介绍Harness Engineering的任务拆分机制之前,我们需要先明确长流程复杂任务的定义、任务拆分的目标以及任务拆分问题空间的边界。从第一性原理出发,我们可以将任何任务拆解为输入操作集合约束条件输出输入:完成任务所需的所有外部信息,包括自然语言描述、文本数据、图像、音频、视频、代码、API密钥、硬件配置等;操作集合。
2026-04-20 23:10:01
117
原创 AI Agent的自主性与可控性平衡:安全对齐的关键挑战
AI Agent是一种能够感知环境、做出决策并采取行动以实现特定目标的人工智能系统。感知能力:能够从环境中获取信息推理与决策能力:能够处理信息并做出决策行动能力:能够执行具体的行动学习能力:能够从经验中改进其行为目标导向性:行为是为了实现特定目标"""环境类,表示AI Agent所处的环境""""""获取环境感知信息""""""根据Agent的行动更新环境状态"""pass"""AI Agent抽象基类""""""感知环境"""pass"""推理并做出决策"""pass。
2026-04-20 22:08:41
69
原创 对齐问题:确保 Agent Harness 符合人类价值观
本文不会只停留在空洞的伦理说教上。作为一名资深软件工程师和技术博主,我将带你从技术底层逻辑什么是 Agent Harness?它在 AI 代理栈中扮演什么角色?什么是价值观对齐?为什么它在 Agent 场景下比传统 LLM 调用更难?如何从 0 到 1 构建一个具备对齐能力的 Agent Harness?我们会拆解出“指令约束”、“行为审查”、“反馈闭环”三大核心模块,并提供 Python 伪代码/简化代码示例。当前的对齐技术有哪些局限性?我们如何在工程实践中权衡“安全”与“能力”?
2026-04-20 21:17:30
289
原创 Harness中的Token预算管理应对LLM成本
让我们设计一个完整的项目,展示如何实现一个简化版的Harness Token预算管理系统。Token使用计量与估计多层次预算管理实时预算检查与控制使用情况分析与报告成本优化建议。
2026-04-20 20:16:07
278
原创 AI Agent Harness模型推理精度与速度平衡
核心概念与基础架构:先明确Agent、Harness、推理精度、推理速度的定义,再拆解生产级Agent Harness的核心组件与交互关系;量化模型:建立「有效精度-有效延迟-有效资源」的评价体系:打破传统纯模型指标的局限,结合Agent场景定义三维量化模型与关键评价指标;基础模型层的优化:从模型本身出发的「硬优化」与「软优化」:硬优化包括剪枝、量化、蒸馏、算子融合,软优化包括模型选型的级联策略、多模型协同推理;Harness组件层的优化:从能力整合出发的「软优化」为主。
2026-04-20 19:24:59
282
《Kotlin项目实战开发》第3章+类型系统与可空类型
2017-09-30
ClickHouse 高性能、可扩展和低成本的OLAP数据库 陈光剑 20230912
2023-09-14
Will AI Fix Work? 工作节奏超过了我们的跟上能力 人工智能有望创造一种全新的工作方式
2023-05-17
THE AI INDEX REPORT 人工智能指数报告 Measuring trends in Artificial Inte
2023-04-06
An introduction to functional programming through lambda calculus.PDF.zip
2019-09-22
Principles of programming languages by Gilles Dowek (auth.) (z-lib.org).pdf
2021-04-28
Kotlin Coroutines by Tutorials (1st Edition)
2021-04-28
A Brief History of Artificial Intelligence
2021-04-28
谁能讲讲?这元旦节到底是放了还是没放?#元旦节#
2025-12-27
2024 年可以实现 AGI 吗?
2024-01-02
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅