酌沧-CSDN博客

原创多智能体协同工作实例拆解

多 Agent 本质上是在大模型的指导下，多个 Agent 共同协作完成用户的任务。本文用一个实例分析 supervisor 架构下的多 Agent 设计。

2025-07-20 16:07:29 1172

原创智能体长短期记忆最佳实践

通过的组合，LangGraph 让我们能够编排复杂、可恢复、可解释、可协作的 Agent 工作流。实现上下文工程的写入上下文。

2025-07-20 16:05:40 969

model=summarization_model, # 可以用更便宜的模型max_summary_tokens=128, # 每次新增的摘要 token 上限# 新增此键用于保存先前的摘要信息，以避免每次 LLM 调用都重新摘要📊 摘要策略可利用 langmem 库的 SummarizationNode。当对话达到 max_tokens 时，它会自动对较早的消息生成摘要。当历史 + 新请求 > 384 token，就把“过界”的部分喂给⇒ 产出摘要块 ⇒ 用摘要块 + 最新消息继续。

2025-07-19 19:43:13 1108

原创智能体上下文选择-记忆工具知识

选择上下文是智能体架构中的核心机制，旨在根据任务动态筛选最有价值的信息进入上下文窗口，提升推理质量与效率。实现从状态、记忆、工具、知识等提取关键上下文，有效控制大语言模型的“注意力焦点”。

2025-07-19 19:42:21 987

原创大模型认知能力生物学启发

用拆解“大模型transformer的注意力”在神经网络里的秘密，让你看到从生物到算法的跨界共振。

2025-07-16 21:59:50 589

原创图示+例子深入理解前向反向传播

详细解析神经网络中的前向传播、反向传播以及计算图的原理与应用，帮助你更好地理解深度学习模型是如何优化和学习的。

2025-07-16 21:58:05 965

原创深度学习必然用到的微积分知识

带你看懂如何驱动深度学习，让模型在海量数据中迭代进化、越练越强。

2025-07-09 21:53:42 836

原创深度学习最简单的神经网络线性回归网络

用最简单的线性模型讲清训练全流程，让你 5 分钟看懂AI 是怎么学会预测的 🔥。

2025-07-09 21:52:13 1450

原创深度学习必然用到的线性代数知识

把标量到张量、点积到范数全串起来，帮你从搭建 AI 数学底座 🚀。

2025-07-06 14:52:45 967

原创 AI做美观PPT：3步流程+工具测评+避坑指南

用AI做PPT不再头疼！从快速生成到工具选择，再到避坑美化，轻松搞定美观又专业的演示文稿。

2025-07-06 14:49:22 1087

原创 AI大模型输出有时机械有时即兴搞明白解码策略

带你看懂，并教你用参数调教它🔥。

2025-07-02 22:23:56 669

原创 AI大模型输出解码加速剖析如何效率翻倍

先把最费内存的注意力“碎块+就地算” (Flash)，再把历史缓存“分页+目录” (Paged)，最后把用户请求“灵活拼车” (Batch)。三件小事一起做，就把大模型推理从“显存搬砖工”变成“高速流水线”。

2025-07-02 22:22:18 767

原创 ViT与CLIP：图像×文本多模态读心术揭秘

讲解ViT与 CLIP的原理、差异，以及它们在多模态大模型中的应用。

2025-06-30 22:02:16 1067

原创 6阶段实现最强RAG 模块化检索增强实践指南

通过RAG检索增强生成，补充大模型的能力，是当前AI应用热点方向，带你一次读懂的实践要点，帮AI应用系统开发者快速落地 🔥。

2025-06-30 22:00:50 869

原创 AI大模型指令微调数据全面解析

本文拆解的来源、评估与训练套路，帮你用最小成本做出“言听计从”的大模型，做好大模型微调🚀。

2025-06-28 10:28:38 941

原创开源版gpt4o 多模态MiniGPT-4 实现原理详解

MiniGPT-4是开源的GPT-4的平民版。本文用带你快速掌握多模态大模型MiniGPT-4的模型架构、训练秘诀、实战亮点与改进方向。

2025-06-28 10:26:28 1079

原创大模型训练参数量-运算量-显存如何分析计算

带你亲手算一笔账，从参数量、运算量、训练时间到显存开销，彻底搞懂训练一个大模型究竟需要多少“硬通货”。

2025-06-26 06:18:10 771

原创大模型训练数据做好质量控制三个关键处理

训练好模型前，先修好数据管道！本文带你用，把互联网“大杂烩”打造成可口的模型营养餐用于大模型的预训练，效果立竿见影🔥。

2025-06-26 06:16:37 917

原创大模型训练优化参数设置 4个技术

还在为“炼丹”参数发愁吗？这篇文章将带你彻底搞懂批次大小、学习率、优化器这些核心参数背后的深层逻辑。

2025-06-23 22:47:36 736

原创 Qwen3 Embedding 结构-加载-训练看透模型设计哲学

作为整个句子的代表。对于因果语言模型（Causal LM）来说，这非常合理，因为模型在预测最后一个token时，其隐藏状态已经编码了前面所有文本的精华信息。这就像读完一整篇文章后，脑子里形成的那个最终总结，信息量最大！🚀fill:#333;color:#333;color:#333;fill:none;输出与应用核心计算流程(modules.json)输入与预处理Token IDs处理后Token IDs序列Token向量单句向量最终Embedding最终向量余弦相似度计算。

2025-06-20 21:19:23 1470

原创用浏览器插件让你的鼠标变成超萌猫爪

。

2025-06-20 18:49:55 415

原创超级马里奥游戏带你拆解最火的强化学习PPO

本文将用超级马里奥游戏，带你一步步拆解当前最火的强化学习算法——PPO，看看它是如何把一个什么都不会的AI，调教成顶级游戏高手的。

2025-06-18 21:02:15 828

原创 Python 中不那么 Pythonic的实用技巧

虽然 Python 有一套强大的设计哲学（体现在“Python之禅”中），但总有一些情况需要我们“打破规则”来解决特定问题。。

2025-06-18 11:28:02 768

原创思维链底层逻辑，换个Prompt性能飙升50%

本文带你揭开思维链（CoT）的底层逻辑，告诉你如何通过“编程”式 Prompt，将 LLM 的推理能力压榨到极致。🚀。

2025-06-17 19:01:33 864

原创用DeepSeek做量化赚钱：策略、实操与避坑

本文用通俗语言拆解其核心交易模型、完整落地流程与常见陷阱，并讲透背后的AI驱动原理，助你用更少的时间跑出更高的收益。高频套利则侧重统计学：ADF 检验可判断两个价格序列是否“有磁力”（协整），一旦被拉远即期待“橡皮筋”弹回。组合，让从“小白”到专业量化团队都能用同一工具。AI 不会替你承担市场风险，但能帮你快速、准确地完成数据处理与策略执行，把。AI 不会替你承担市场风险，但能帮你快速、准确地完成数据处理与策略执行，把。：DeepSeek 同时解析文字、代码与数据，像“全栈分析师”。

2025-06-15 10:38:07 718

原创 AI服务器怎么测试最大并发用户数附完整代码

💡 依次以2 4 8个并发进行测试的图片💡 依次以2 4 8个并发进行测试的log具体压测代码已经开源在github和gitee 搜索AI_pressuretest即可压测核心目标是 “在单位时间内，以尽可能小的资源消耗，模拟出海量的、符合业务场景的请求”。压测工具通过创建“虚拟用户”来模拟真实用户。生成这些虚拟用户主要有两种模式：A. 基于线程模型B. 基于事件驱动/异步I/O模型并发数本身是一个没有意义的孤立数字。有意义的说法是：“在P99响应时间低于500ms，且错误率低于0.1%的前提下，系统能

2025-06-12 20:57:57 634

原创打造超轻量的仿chatgpt的AI聊天应用

使用纯 HTML、CSS 和 JavaScript实现了一个类似 ChatGPT 的聊天界面。支持 Markdown 渲染（AI 回复）、代码高亮、图片上传和预览、全局搜索、对话切换等。左侧边栏：显示历史对话列表，可以新建对话。主聊天区：显示用户与 AI 的消息流。顶部工具栏：包含侧边栏开关、模型选择器和全局搜索功能。底部输入区：用户可以在此输入文本、上传图片，并发送。项目开源地址 https://github.com/jiaxin576/LightAIChat。

2025-06-11 20:56:25 1046

原创 Correlations氛围测试：文本或图像的相似度热图

它的本质是将两个嵌入向量集合之间的**余弦相似度矩阵（Cosine Similarity Matrix）**渲染为一个热图，并提供丰富的交互功能让你“用肉眼判断”相似性结构。通过构造两个矩阵（原文向量 A 和摘要向量 B），计算它们所有可能组合的语义相似度（余弦值），形成一个矩阵 S，并将其可视化为热图。该步骤是把原始内容（文本或图像）分块后，使用 Jina API 生成向量（embedding），保存为。文件，计算两组向量之间的余弦相似度矩阵，启动本地服务器呈现可交互热图。个摘要向量的余弦相似度。

2025-05-31 20:01:49 910

Chromeextent_paly.zip

空空如也