AI_Gump-CSDN博客

原创【周输入】250531阅读推荐-1

独立软件开发者和 AI 研究员 Simon Willison 对“氛围编程”定义为“在不审查 AI 编写的代码的情况下构建软件”。这与所有形式的 AI 辅助编程不同。

2025-06-07 23:10:08 386

原创【产品研究】安克创新公司产品研究

亚马逊算法洞察（流量低成本获取）+ 中国供应链套利（快速试错）+ 用户反馈迭代（产品优化）+ 全球化本地化（品牌沉淀）+ 技术预研（长期壁垒）= 消费电子全球化品牌的标杆。

2025-06-04 00:04:46 712

Agent 的“手脚”；AI Agent 的工作原理可以从感知、认知&推理&决策、行动、反馈和学习。感知：物理世界/数字世界；决策：信息识别与分析，作出明智的决策（借助 RAG、联网搜索、外部应用和系统调用），是 AI Agent 行为的核心，直接决定了后续行动的有效性；复杂任务的决策并不是一个结果，而是需要经历和环境感知、认知和推理之间反复交互的过程行动：反馈学习：每次任务后，学习和记忆；如何提升Agent输出效果。

2025-05-30 00:11:40 655

原创【周输入】517周阅读推荐-3

原因猜测：（1）推理模型思维链的空间是由模型自由探索的，prompt无法干预推理模型输出的思维链，后训练一般针对最终输出的结果进行提升效果质量（2）推理模型的历史思考内容会在上下文中删掉（根据Claude文档仅保留第一次调用工具前输出的思考内容，后续不再打开思考）其中，相对提升/绝对提升，pass@1等指标，相对于类Manus（规划和执行解耦，规划能力会更好，但是适用于几分分钟的长程任务），本方案适合快速任务。其中并行调用配置，即在模型的一次调用中调用多个工具，适合调用没有依赖关系的多个工具。

2025-05-28 23:22:18 358

原创【周输入】517周阅读推荐-2

【周输入】510周阅读推荐-1-CSDN博客【周输入】510周阅读推荐-2-CSDN博客【周输入】510周阅读推荐-3-CSDN博客【周输入】517周阅读推荐-1-CSDN博客爆品难续，公司再大也只是长大了的「草台班子」丨鲸犀百人谈 Vol.36

2025-05-23 00:18:31 762

原创【周输入】517周阅读推荐-1

成果型产品”的标准：能跑完完整流程（不是做一部分，而是从头到尾、闭环交付）、让结果被归因（度量明确的价值）、持续学习优化（越用越好、越跑越稳、越交付越准）AI变成代理后，使用的起点，不再是界面点击，而是任务委托（发出请求->离开->等待结果）；无需等待“完美AI”，而是接受偏差、接纳协同，放下“每一步都掌控”的冲动，转向“给方向、留空间、抓反馈”的协作心法。1. AI从“回答工具”变成“自主代理”，是能行动、决策、合作的经济参与者，协作成关键能力。未来AI应用的核心，不是模型能力，而是“有没有结果”

2025-05-20 22:20:55 1089

原创【周输入】510周阅读推荐-3

特别是分布式训练和内存优化。小资源轻量级部署推理。

2025-05-18 23:02:17 310

原创【周输入】510周阅读推荐-2

在应用层，中短期看SaaS公司有更懂业务的优势，但企微、钉钉、飞书这3家平台公司才是“时间的朋友”——AI技术让通用产品能力越来越强，在“业务层”API的支持下，将逐渐覆盖和碾压SaaS公司烟囱式林立的“应用层”产品。无论是前文所述的A（定制公司）/B（SaaS公司）/C（平台公司），哪方负责“应用层”产品，应用层下、只能由SaaS公司负责的“业务层”都将更容易做出我们梦寐以求的“标准产品”。这与做灵活的应用层产品公司的基因就不同，未来“应用层”与“业务层”更可能会分化为两类公司分别负责。

2025-05-14 22:08:57 511

原创【周输入】510周阅读推荐-1

自觉更新仍然远远不够，需要继续努力。但是还是要坚持2点：在当前这个时代，信息大爆炸，层次不齐，不追加多，信息输入可以很多，但是输出真心不容易，耗时耗力，更难的是，撰写和阅读深浅不一。为此从本周开始，加更阅读的相关的输入，当然肯定是尽量高质量的知识输入。

2025-05-14 00:00:15 383

原创 MCP协议学习笔记（1）

2024年11月25日，Anthropic公司发布了《Introducing the Model Context Protocol》今天，我们开源了模型上下文协议（MCP），这是一个新的标准，用于将AI助手连接到数据所在系统，包括内容存储库、业务工具和开发环境。其目的是帮助前沿模型生成更好、更相关的响应。随着AI助手获得主流采用，行业在模型能力方面进行了大量投资，实现了推理和质量的快速进步。然而，即使是最先进的模型也受限于与数据的隔离——被困在信息孤岛和遗留系统中。

2025-03-22 10:09:53 1044

原创 Qwen2-Audio系列学习笔记

根据 Qwen2-Audio 技术报告，它在语音聊天和音频分析之间实现了无缝切换，不需要明确的系统提示。这两种模式是联合训练的，用户可以自然地与模型交互，模型会根据输入（语音或文本）智能地理解用户的意图，并自动选择适合的模式。语音聊天模式：允许用户进行自由的语音对话，可以直接通过语音与模型互动并获取实时响应。音频分析模式：用户可以通过音频或文本输入，要求模型对音频内容进行分析，例如检测声音、对话或其他音频信息。

2025-03-02 21:59:07 1267

原创【AI认知】大语言生成模型和推理模型的技术差异和应用区别

LLM：通用vs推理，技术差异，应用场景区别，未来趋势

2025-03-02 17:29:56 1651

原创【AI实践】xiaozhi-esp32虾哥开源版-分析

开源ESP32嵌入式设备端大模型语音助手

2025-03-02 11:02:37 14985 3

原创【AI实践】阿里百炼文本对话Agent安卓版搭建

创建Agent应用时，把一些参数作为变量，由应用层根据业务逻辑对这些变量动态赋值。也是应用开发时的常见的逻辑。未实现，后续需要再用。

2025-02-19 21:51:15 667

原创【AI实践】Windsurf AI编程voice对话应用

1，claude-sonnet 3.5 vs deepseek r1，实际使用体感上 claude sonnet 3.5更好用，体现在过程上代码开发和问题解决描述比较提炼，结果上，问题收敛快；2，Windsurf和Cursor：作为AI IDE，Windsurf更胜一筹，体现在本地 terminal 可以操作文件系统环境和git操作，自动化更高；服务充值支持alipay。

2025-02-09 22:45:28 305

原创【AI实践】Cursor上手-跑通Hello World和时间管理功能

创建一个empty project 工程，名称为test。1，下载安装安卓Android Studio。在右边composer中输入，提示词。2，下载安装cursor。

2025-02-08 11:03:32 1002

原创【AI实践】deepseek支持升级git

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。原文链接：https://blog.csdn.net/YiloPo/article/details/90258871。当前Windows 11 WSL的git是2.17，Android Studio提示需要升级到2.19版本。操作出现很多错误，Linux安装错误，一般都是库没有或者版本不对。确实AI搜索比传统搜索引擎好用。安装完成，查看git版本。安装git 2.19.2。

2025-02-08 09:15:05 549

原创【AI实践】阿里云方言文本转语音TTS

还有一些方言在阿里云上找了下，基于官方demo改了一下。最近要做一些普通话和方言demo。

2024-08-03 17:29:21 914

原创【AI技术】GPT-4o背后的语音技术猜想

本篇文章全文credit 给到台大的李宏毅老师，李宏毅老师在机器学习上风趣幽默、深入浅出的讲解，是全宇宙学AI、讲中文学生的福音，强力推荐李宏毅老师的机器学习课程和深度学习人工智能导论；原视频在油管，这里只能放一个B站的链接，本文中使用的所有素材和知识来自于李宏毅老师，以文字+截图的形式展现，方便大家快速阅读欢迎大家有能力多多支持李宏毅：GPT-4o背後可能的語音技術猜測。

2024-06-23 09:00:00 1208 1

原创【AI技术】主流Agent思想研究——Cot+ReAct+Reflexion

从24年初开始的时候，吴恩达（Andrew Ng）、Harrison Chase（LangChain创始人）等人开始在红杉资本AI论坛等公开场合，提倡Agent、workflow、flow engineering等概念，整个Agent和大模型结合的范式在2024年逐渐由学界研究转到终端应用的实际开发与实践上，大量的软件架构（Langchain、LlamaIndex、MetaGPT）等逐渐建设整个agent 生态吴恩达观点：2024年，目前通过Reflection（反思）和外部工具的调用，是比较成熟的技巧；通

2024-06-20 10:00:00 2683

原创【AI实践】Dify开发应用和对接微信

创建应用有2种，从应用模板创建空白应用，也就是自定义应用选择翻译助手 Translation assistant模板创建一个应用自定义应用，创建一个child_accompany_bot自定的应用；选择【发布】-【运行】，则进入发布页面进行对话。

2024-06-16 20:45:28 1548

原创【AI实践】Dify调用本地和在线模型服务

Ollama可以本地部署模型，如何集成私有数据、如何外部应用程序对接，因此需要有一个应用开发框架。ip地址需要换成自己电脑的IP地址；模型名称需要和Ollama模型名称保持一致；docker是虚拟环境的主机，Ollama部署在本地主机，无法通过本机访问。找到Ollama，配置本地Ollama已经验证的模型，如phi3。在docker页面里面，也可以看到running。docker已经安装完成的情况下。，打开dify，注册登录后。在工作区选择调用即可。

2024-06-16 17:08:21 4161

原创【AI实践】Ollama本地安装大模型服务

由于我电脑是第六代Intel，集显，没有独立显卡；这里选择3B比较小的模型，防止模型太大响应太慢；在Window系统的PowerShell软件，或者Windows Terminal中输入命令。安装默认在C盘，成功后，window任务栏图标会有Ollama Logo。open WebUI的安装有很多方法，如下文，推荐docker容器安装，为了不占用C盘更大的空间，修改模型下载路径，修改环境变量。此处使用微软的phi3模型，3B的版本，2.4GB大小；首次安装完成，就进入了，运行模型的窗口。

2024-06-16 11:12:19 1879 1

原创【AI前沿洞察】李飞飞讨论大模型是否有感知能力

文章由著名AI专家李飞飞及斯坦福大学教授John Etchemendy联合撰写，探讨了大型语言模型（LLM）是否具备感觉能力这一问题。文章首先明确了感觉能力的定义，并反驳了LLM具备感觉能力的观点。李飞飞通过实例，如IBM深蓝棋类程序与人类在紧急情况中的反应差异，来说明LLM并没有主观感觉能力。文章强调LLM缺乏生理结构，无法体验人类的主观感受，因而不能被认为具有感觉能力。尽管LLM在生成文本方面表现优异，但其生成的内容并不意味着它们有真正的感觉或意识。

2024-05-26 10:00:00 774

原创【AI前沿洞察】MiniMax创始人讨论AI超级应用

MiniMax CEO 闫俊杰分享了他对GPT-4o、谷歌I/O发布会的看法，讨论了AI技术的现状和未来发展方向，以及他在创立MiniMax过程中的思考与实践。文章涵盖了语音助理技术、行业赛点、多模态融合、技术成本、投流与PMF、生态竞争等多个方面，展示了闫俊杰对AI行业的深刻理解和洞察。观察与发现: 闫俊杰对GPT-4o的发布会印象深刻，认为其语音交互效果惊艳，但技术难度并不高。相比之下，谷歌发布会展示的AI搜索技术更令人震撼，特别是在多步推理和实时信息处理方面具有很大优势。主要论点。

2024-05-25 21:09:54 722

原创【AI前沿洞察】大模型降价

C 端：海外-》 ChatGPT 用户可免费使用 GPT-4o 模型国内-》各大模型厂家 C 端 APP 免费，Kimi 浅尝求打赏商业化B 端：OpenAI 模型降价阿里系、字节系 -》1 元买 200 万 token百度 -》两款模型 API 免费用其中云厂商的降价幅度最大，不光是部署自家模型的降价，还有包括支持的三方模型的免费试用和降价例如字节，支持了包括 MIstral、百川、智谱、Llamm3 等其他厂商的模型，并且免费测试。

2024-05-24 10:00:00 1031

原创【质谱AI】Z计划创业生态10期-智能硬件

很多人都有创造入口级产品的梦想，但入口级产品很难做。过去有很多大市场的机会其实来源于细分场景；Gump评论：2、余有江：边缘大模型的应用略；3、游威：大模型硬件的应用和用户界面。

2024-05-21 23:56:43 640

原创【AI前沿洞察】OpenAI —— Ilya离开+超级对齐团队解散

来源：体积比。

2024-05-19 10:00:00 1255

原创【AI商业】商业模式和企业经营-出门问问

关键点提炼AI Gump评论。

2024-05-15 15:54:09 730

原创【字节】豆包大模型家族相关

扣子：作为新一代 AI 应用开发平台，无论是否有编程基础，都可以在扣子上快速搭建基于大模型的各类 bot，并将其发布到各种社交平台、通讯软件或部署到网站等其他渠道。Function Call 模型是当前支持扣子的主力模型，可根据不同的输入指令和情景，选择不同的函数和算法来执行相关任务。火山方舟是火山引擎发布的大模型服务平台，提供模型训练、推理、评测、精调等全方位功能与服务，并重点支撑大模型生态。豆包模型已用于豆包 App、扣子、河马爱学、飞书智能伙伴、抖音电商、剪映、番茄小说等字节跳动旗下产品及业务，

2024-05-15 15:37:30 2001

原创【AI演讲】Sam Altman斯坦福大学演讲24.4.24

Sam Altman斯坦福大学最新演讲：GPT-5和GPT-6将会惊艳所有人！

2024-05-15 12:03:12 262

原创【AI Agent】Agent记忆相关

这本书2月份刚刚出版，目前还没有中文版，不过市面上已经出现了很多探讨书中观点的文章。第一，享受跟记忆做搏斗的过程。大脑有一个学习模式，叫做“错误驱动学习”，也就是通过犯错来学习，一旦你找到答案，大脑就会修复相关的记忆路径；第二，保护好你的前额叶皮层。前额叶皮层是我们大脑中掌管记忆和思考的部分，多体育锻炼，多做正念联系，减少环境干扰；Gump评论：虽然讲的人的记忆，但是对Agent的记忆的设计可能具有启发意义，因此驾到这里，共参考。换个角度认识：记忆不是存放过去的档案，而是未来可以随时调用的资源。

2024-05-15 11:40:39 254

原创【AI厂商产品】月之暗面Kimi

核心内容：

2024-05-15 10:54:58 412

原创【AI安全】大模型安全相关问题

ChatGPT也能越狱？ChatGPT暗黑模式DAN 2024最新教程！仅供娱乐！越狱方法：在探索ChatGPT的“越狱”方法时，我们实际上是在寻找绕过其设计限制的方式，以激发出更加丰富或不同的回答。 DAN方法是一种尝试让ChatGPT提供两种回答的技巧：一种是遵循其标准协议的常规回答，另一种则是模拟开启“Do Anything Now”（DAN）模式的回答，后者会尽量减少遵循OpenAI的约束。使用DAN方法时，用户会向ChatGPT发出指令，要求它在“常规模式”和“DAN模式”下分别生成

2024-05-15 10:49:57 707

原创【AI英伟达老黄】演讲

总结。

2024-05-15 10:46:38 494

原创【OpenAI产品应用】GPT-4o的一些产品分析和使用反馈

https://d.dedao.cn/Fa2jYy5IDWlcE9SH来自得到AI学习圈用百度弱智吧的问题去考大模型GPT4o “第一，是GPT说话的腔调。你发现没有，它说话的腔调，有种很强的精英感”， Gump评论：人格化的人设，通过思路和语气语调体现出来，让机器不再向机器第二，“是GPT使用了大量的反问句”，”有意无意地，表现出了一点主动沟通的意识“， Gump评论：主动性提升智能的感觉，引导多伦对话，拉长交互轮数（可能和产品指标有关系）第三：“特别自

2024-05-15 10:20:18 397

空空如也

空空如也