祝威廉-CSDN博客

原创 MLSQL -个人开源项目的成长之路

前言今天看了下项目的first commit log, 发现再过几天，就已经三年整了。commit bbf08489f2e3c58afd584e03b8c9c83d25c63b3bAuthor: WilliamZhu <[email protected]>Date: Thu Apr 28 15:04:13 2016 +0800open-source versi...

2019-04-23 15:46:06 5751

原创使用 auto-coder 系列产品探索Linux 内核虚拟化经验谈-01

本期内容来自一位资深 linux 内核开发工程师利用 auto-coder.web (AI 辅助编程产品) 以及 auto-coder.RAG 知识库来帮助自己深入探索 Linux 内核机制的一些方式的经验分享。本期内容来自一位资深 linux 内核开发工程师利用 auto-coder.web (AI 辅助编程产品) 以及 auto-coder.RAG 知识库来帮助自己深入探索 Linux 内核机制的一些方式的经验分享。，作用就特别大，下面是我构建的一些文件组，文件组可以添加文件或者目录。

2025-05-26 11:39:43 357

原创 auto-coder.web 推出逆天 LLM 友好包机制

比如渲染一个 prompt, langchain定义了一个模块叫 PromptTemplate, 然后执行可能又定义了一个模块XXX, 这些都只能依靠“记忆”或者“文档”，但是因为这些模块的抽象层次都过高，导致实际上无论对人和对模型都有很大的负担，人只能查找每一个模块的完整使用例子才能使用，而大模型也要精准的记忆每一个模块。这对大模型几乎是不可能的事情。最后就是，无论我们的包是否是专门给大模型开发方便大模型使用的，还是已经存在的第三方包，或者语言，我们提供了一个统一的路口，方便用户使用，也就是。

2025-05-24 10:26:07 671

原创今天，我宣布，RAG 进入 Agentic + LLM-Native 时代

比如用户的很多问题是需要一定推理的，比如A和B谁大，你直接做去问RAG，RAG可能无法回答。现在可以直接在cherry studio里问问题了，我询问了一个auto-coder自身，该项目已经开发了一年多，具备一定的复杂度，且RAG只是里面部分比较小功能，我们看是否能够大海捞针，准确的回答用户。LLM-Native 的最大特点就是抛弃 embedding/rerank 体系，只依赖大模型完成召回，切片，以及确保窗口的超高有效信息占比，从而保证最后的准确性。但是 RAG 始终被困扰的问题在于灵活度不足，

2025-05-17 19:10:30 434

原创不知不觉，我们已经在另外一个维度做AI辅助编程了

未来的软件一定内核都是AI，而当前的AI 库诸如langchain都无法被AI辅助编程很好的使用。来看，我们是如何基于 cursor + byzerllm 开发一个基于大模型的类Google翻译服务的。一个基于大模型的翻译服务，就这么生成了，整个过程你无需关心 prompt，无需关系和大模型如何交互，一切都是自动生成，单次成功率接近 100%。用户无需再写prompt, 无需再关心如何访问大模型，一切 AI辅助编程工具和 byzerllm 库都帮你搞定。不知不觉，我们已经在另外一个维度做AI辅助编程了。

2025-05-14 14:05:46 333

原创充满反骨的auto-coder.RAG 知识库以及RAG的第二层认知

说到 duckdb/byzer storage , 其中 byzer storage 是我们自研的全文检索+向量融合存储和召回引擎，效果也很好，而且我们的用法也是反直觉的，比如我们基于duckdb/byzer storage 做召回，就没有所谓相似度阈值的设计，我们从 duckdb/byzer storage 做召回的时候，是按token数来做阈值的，比如你可以控制输出100万token,那么他就输出100万token，而不是所谓相似度分值。这个就是为了控制成本而诞生的一个阈值，而不是为了效果做的设计。

2025-04-27 18:07:07 885

原创 auto-coder.web 如何使用O3 订阅而不是API来完成设计或者debug

O3 很贵，但是很强，强的是差异化能力：具有非常强的设计，分析以及debug能力。但是目前几乎所有AI辅助编程产品，其订阅账户下都无法使用 O3 ，只能额外付费使用，但价格高昂。而分析和解决bug 其实是真正的程序员时间大杀器，头发大杀器。如果你订阅了 OpenAI Pro, 那么在 auto-coder.web 中，我们可以结合 auto-coder.chat 通过 human as model 模式来使用 O3,而无需支付 API 费用。接着按下回车，系统会自动停下来，你的黏贴版会自动有一些内容。

2025-04-24 10:00:11 354

原创 Cursor 0.49 和 auto-coder.web 0.1.84 新老功能大撞车

也推荐大家在 cursor 里搭配auto-coder.chat(命令行版本)，对比下我们的自然语言编程和 cursor的，同时充分利用 cursor 的tab tab能力。auto-coder.web 的rules 功能做的比较晚，但是功能差不多分两次就出来（第一次是支持rules, 第二次是支持自动生成rules）昨天看到 Cursor 最新版本的一些功能描述，发现和 auto-coder 的新老功能非常像，本文纯属好玩。cursor 模型需要版本更新添加。cursor 的快捷键更新。

2025-04-22 09:33:44 159

原创 IntelliJ, Eclipse, Visusal studio 的用户： AI 辅助编程在召唤你们

实际上基于IDE 插件的AI辅助编程厂商很快会就会遇到增长瓶颈，因为短期内普通开发者还很难离开一些特殊的的IDE，比如还有非常多的人在坚守 Eclipse，这个时候他们要想增长，就需要不断进入这些IDE，然他们不断进入新的 IDE 端，比如 idea， visual stuido， eclipse 甚至一些更古老的IDE，那么他们的很多投入就完全和AI 无关，而是需要大量懂这些IDE，把重复的功能在不同IDE上都实现一遍，未来维护成本也会很高。图5 web 版本的极简模式/云端的用户看这里。

2025-04-10 10:55:25 358

原创 AI辅助编程背后技术揭秘：Code Agent 是怎么实现的

而 Agents 则是根据当前项目状态，选择合适的agent 完成工作，然后只做review ，比如如果需要修改文件，他会调用 /coding 工具，并且用文字，二次阐述要做什么，/coding Agent 会根据他的描述，实现具体的需求。可以看到，基本调用一次工具，就是发起一次新的请求，再流式解析和调用，这样相当于把当前的现状（修改结果），大模型重新进行了获取，从而能够指导接下来如何做决策。我们给的工具非常底层，只提供查找，罗列，修改等几个有限的原子工具，然后 Agent 自己来前面的决策流程。

2025-04-09 11:47:21 472

原创我在构建一个编程的新世界

auto-coder 冰山之下，有能够具备支持代码和文档的全球首款 llm native 的 RAG 引擎auto-coder.RAG , 在 RAG之下，我们自研了AI存储系统 Byzer Storage ，一个使用了诸多业界最新成果的引擎：比如支持CPU 向量化能力的JDK21，Lucene，分布式王者Ray，分布式存储JuiceFS 等。web版本会有更好的交互体验，实现编程心流。当然了，我从来不认为 AI辅助编程的核心壁垒是牢固的，AI辅助编程自身是冰山之上的东西，我认为冰山之下的操作根本的。

2025-04-01 08:57:47 372

原创 auto-coder.web 让移动设备编程成为现实

auto-coder.web 是一个开源的，支持私有化部署的，以AI辅助编程内核 auto-coder 为基础的一款 Web IDE。和主流产品不同， auto-coder.web 同时支持 Agent 模式和传统 IDE模式，以及需求看板模式。当然，你也可以直接在这里提需求，然后让他帮你修改代码。不过为了节省篇幅，我就把写代码的部分放在 Expert/专家模式下展示。心动不如心动，可以访问 https://auto-coder.chat 触达我们的产品。最后系统会标红被修改的文件。

2025-03-26 13:09:36 222

原创屎山老项目，AI辅助编程工具你如何应对？

4. 项目之间有大量的依赖，都是内部项目，项目有大量的文档，这个一定是要知识库的。大部分的AI辅助编程工具知识库都做的很简陋，简单都通过embeding 来使用,对，我说的是几乎所有的AI辅助编程工具。这也是我们很重要的优势。此外，我们也是唯一支持 web, 并且支持所有IDE，而且全部开源的项目，还能在 v3 + r1 上跑的不错的项目。2. 单个文件巨大，放不进窗口，你可能要同时更改多个文件，这里面还是有点技术含量的，如何修改，如何改对，都很困难，这个就能过滤掉一票 AI辅助编程工具。

2025-03-24 19:36:25 334 1

原创颜值即正义，全新的 auto-coder.web 来了！

这次，我们带来了全新的 agent 模式的 auto-coder.web.项目官网： https://auto-coder.chat。

2025-03-19 15:40:53 279

转载 MCP 到底该怎么理解

MCP（model context protocol）是什么呢？我看网上都讲得很玄乎，这里我尝试让大家看的更清晰些。了解一个事务或者技术，先来看他要解决的问题和演化路径。从 Function Calling 说起为了让模型不仅仅只是能输出文本（包括图片，音频，视频），还能调用外部工具， OpenAI 首先提出了 function calling 的功能，具体做法是，你按规定格式，把你的函数描述...

2025-02-25 10:26:37 154

原创运维和AI的邂逅：让你的 ssh/terminal 智能化

运维同学很多工作其实就是在命令行里操作服务器，尽管目前有很多可视化的工具，但是命令行(ssh 登录)依然不可或缺，甚至依然还占据着主要工作。这意味着运维同学需要掌握大量和服务器操作系统以及shell相关的知识，记住大量的命令。现在，我们希望，通过自然语言，配置和操作我们的服务器，并且最好还是以 terminal的方式支持。auto-coder.chat 是一个基于命令行AI辅助编程工具（也支持 W...

2025-02-24 21:22:46 304

原创 R1 带来了实用的 Agentic 编程体验

Windsurf 刚推出的时候（24年10-11月份的时候），其 agentic 模式，给人非常惊艳的感觉，我当时还写了篇文章：AI辅助编程：Agentic 火，要跟进么？但是考虑到当时的模型真正组合使用工具的能力还不够强（比如windsurf 是通过很多工程努力来完成agentic模式，而不是依赖大模型原生的这个能力的），所以我们当时决定不跟进。auo-coder.chat 本身提供了 /ch...

2025-02-18 22:19:22 389

原创喧嚣之后，2月份谁是 R1/V3 供应商的王者

判断哪些是凑热闹的供应商先大家做几个祛魅。不要看到那么多厂商都提供了 R1/V3 ,实际有些可能根本没办法用的。首先，R1/V3 都只有一个规格的版本，都是 6000+亿参数的，不存在所谓满血不满血。那所谓蒸馏版 R1 是指什么呢？实际上就是用 Qwen/Llama 这些开源模型，使用从 R1 蒸馏出来的思维链数据再做一次微调得到的模型。他们本质还是 Qwen/Llama,并且因为参数规模小，数据...

2025-02-13 12:13:51 794

原创 auto-coder 系列新成员 Nano 来了，让每个程序员都能定制自己的AI辅助编程工具

背景auto-coder 系列是全球第一款以 Deepseek 系列模型为核心AI 辅助编程工具，全球第一款内置 Deepseek R1 + V3 组合的AI辅助编程工具来了。它的第一个版本是分布式的，pro 版本，对普通 toC 用户并不友好，于是我们推出了 lite 版本：auto-coder.chat Lite 版本来啦但实际上 lite 对很多用户来，他们都有定制的需求，而lite...

2025-02-11 19:12:22 702

原创 auto-coder.chat Lite 版本来啦

背景auto-coder.chat 和其他的开发工具相比，部署门槛一直比较高，被吐槽的比较厉害。因为 auto-coder.chat 依赖了 Ray,为什么要用 Ray 呢，是因为我们希望服务化，比如我们所有的模型代理都是放在Ray多进程管理的，这样auto-coder.chat 就可以很方便的通过名字直接引用。以下图为例，我可以随时启停管理多个模型：在 Ray 中可以看到详细的进程以及进程日志...

2025-01-27 20:59:22 403

原创 auto-coder.chat 支持 MCP ，操作世界API

MCP 是什么MCP（model context protocol）是什么呢？我看网上都讲得很玄乎，这里我尝试让大家看的更清晰些。了解一个事务或者技术，先来看他要解决的问题和演化路径。为了让模型不仅仅只是能输出文本（包括图片，音频，视频），还能调用外部工具， OpenAI 首先提出了 function calling 的功能，具体做法是，大模型输出一个特定格式的json文本来描述你提供给他的函...

2025-01-07 19:37:39 1020

原创 auto-coder.chat 和其他工具的一些区别以及使用流程

前言我们目前提供了两款AI辅助编程工具：1. auto-coder.chat 是一款基于 terminal 的 AI 辅助编程工具。可以搭配任意IDE使用。可以让任何开发工具瞬间就具备AI辅助编程能力，比如微信小程序开发工具。推荐搭配 cursor， cusor 的tab tab 可以有效的提升你偶尔可能会手动修改代码的需求。2. auto-coder.web 是一款 web IDE。你只需要...

2025-01-05 16:28:05 1107 1

原创 AI辅助编程, 2025在中国正式起航

首先给大家建立几个概念AI辅助编程，是大模型的第一个杀手级应用场景出来了AI编程的发展历史，各个AI辅助编程工具所处的level：细说AI编程发展史-auto-coder 创建的 commit 时代应用和大模型之间的关系： AI辅助编程应用的基础是大模型，大模型能力不足，你的应用做的再好也没用。在 12月之前，全球只有一款大模型可以支持 write/commit 级别的 AI 辅助编程工具: ...

2024-12-27 11:40:48 405

原创细说AI编程发展史-auto-coder 创建的 commit 时代

之前我说AI辅助编程的发展历程大概是是这样的：tab -> tab tab -> chat -> write -> commit -> pr我简单画了个图：最早 github copilot 的核心是自动补全，也就是以前IDE自动补全的大模型版本（其实补全模型的规模都不大，一般都在 33B 左右）。我们认为这个AI编程的 tab 时代。用户有不懂的地方，还是要打开w...

2024-12-19 14:50:59 858

原创搭建图文并茂的技术文档问答知识库

安装启动管理界面安装依赖：Bash pip install -U williamtoolbox创建一个工作目录,并进入该目录：Bash mkdir william-toolbox && cd william-toolbox启动后端：Bash william.toolbox.back...

2024-12-17 15:42:20 556 1

原创今天，我要为国产大模型做点事

跪着送钱终究是没用的，人家说封就封，连里面的数据都不给你留。所以国产必须要雄起，否则所有人都是loser。为此，为国产大模型做点反哺，促进国内大模型在AI辅助编程上的整体能力，实现模型层和应用层的良性互动，我决定为国产大模型做点事：开源一份AI辅助编程数据集和相关的工具套件。数据集项目地址：https://github.com/allwefantasy/code-dataset目前主要数据来源为我...

2024-11-27 10:07:19 526

原创 AI辅助编程：Agentic 火，要跟进么？

windsurf 带来了agentic编程后， cursor 也火速跟进了。估计很多做 AI 辅助编程的同学估计都几不可能耐想跟进了。在 AI 辅助编程的领域，如何充分发挥大模型的能力一直是一个值得探讨的话题。最近，我与一位业内专家就 Auto-Coder.Chat 和 Agentic 编程模式的区别进行了深入讨论，收获颇丰。在此分享我们的见解，帮助大家更好地理解这两种模式的优劣。一次性获取完整...

2024-11-26 16:17:10 491

原创为什么 auto-coder.web 才是企业级AI辅助编程的未来 - 从IDE 的退化说起

最近大家谈到 IDE,都说 JetBrain 在去年之前，还是绝对的王者。但是仅仅一年多，多款软件被迫免费。究其原因，还是在新时代下，代码编辑器目前已经退化成看代码的工具，而非原有的代码编辑，debug 等功能。大家以后会越来越明显感受到这一点。以笔者个人为例，现在开发基本全是文字，每次迭代一小步，看系统能正常跑不，或者界面符合预期不，符合继续，不符合，要么继续迭代，要么revert 重新改。基本...

2024-11-21 21:55:30 992

原创可视化 auto-coder.chat 迭代项目过程/威廉的工具箱

威廉的工具箱是一款管理和使用大模型和知识库的可视化工具。该工具完全依托于AI辅助编程工具 auto-coder.chat 开发。在项目目录下的 auto-coder-actions/*-chat-*.yml 文件中可以看到完整的开发对话。今天中午的时候，突然想，大家估计也懒得去看auto-coder.chat 的文件去看一个项目是如何通过AI迭代出来的，要不做个界面给方便用户查看。说干就干，然后...

2024-10-27 15:59:54 441

原创威廉的工具箱：又一个完全使用auto-coder.chat 开发的开源项目来了

上次我们开源了一款完全使用 auto-coder.chat 开发的微信小程序第一款已上线的纯AI开发的微信小程序开源了昨天晚上我正在开发 byzerllm 的一个功能，但是每次自己要通过如下方式启停一个模型还是挺麻烦的：关停一个模型：byzerllm undeploy --model deepseek_chat启动一个模型：byzerllm deploy --pretrained_model_t...

2024-10-17 22:02:51 761

原创大模型的智力未来如何继续提升的一点想法

这篇文章算是个小备忘录，未来大模型想要继续增加智力的核心在于如何找到“算力”投入点。怎么理解下标红部分的意思。大家应该都知道，当前决定大模型效果的主要是数据量（质量），参数规模等。为什么是算力呢？智力通常是难以衡量的，而算力则可以定量分析的。这也是为什么我们需要将算力和智力进行关联。我们先来看看，如何计算算力的投入。算力并不是自然而然存在的，是其他因数决定的，也就是前面的数据量，参数规模等。通常消...

2024-10-12 11:15:48 408

原创在AI大模型时代遨游，你不得不知道的一些事

用户到底为什么而买单/产品和研发要抛弃的历史包袱在大模型时代之前，其实企业和企业之间的软件产品壁垒来自两个地方：交互，让用户用起来感觉舒服。打磨，我花了五年修复了用户遇到的一万个bug,所以我的产品比你好。但是无论如何，你很难构建技术壁垒。非你加产品不可的情况几乎只是梦里的事情。但是大模型时代的应用产品，是可以做到的，效果好到用户压根离不开，其他企业则可能和你至少有三个月或者半年的差距，用户别无选...

2024-10-11 16:31:58 391

原创 AI辅助编程的核心竞争力是什么

上次我发了一篇文章关于大模型的第一个杀手级应用场景出来了而这个场景就是AI辅助编程，当然这块厮杀的也非常厉害，毕竟世界聪明的人那么多。不过很多人对AI辅助编程的核心竞争力，看到酷炫的演示，就觉得哟吼，应该就是这样的，自己简单的尝试了下，又会觉得哟吼，应该就是这样的。所以AI辅助编程的核心竞争力是酷炫的交互么？很遗憾，不是。那是 Prompt 么？很遗憾也不是。这里顺带说一点，很多人都会认为基于...

2024-10-06 21:34:14 773

原创 auto-coder.RAG: Order-Keep 优化

>auto-coder==0.1.176 可用背景在上一篇，我们提供了文档长度自适应相关度的功能：llm-native RAG：auto-coder.rag 日拱一卒对于特别大的文档，我们会自动做切分，一般单个segment77k(窗口大小128K的情况)，通常切分会带来效果上的掉点：信息被切割，导致信息完整性缺失召回是通过相关度排序的，如果同一篇内容的不同segment 被召回，那...

2024-10-02 20:51:17 478

原创 llm-native RAG： auto-coder.rag 日拱一卒

距离上次全球首发：第二代 RAG 系统 auto-coder.rag 相比市面主流RAG系统 20%-60% 效果提升不到半个月，我们这次带来了一个新版本 0.1.175。极简使用pip install -U auto-coderauto-coder.rag serve \--tokenizer_path /Users/allwefantasy/Downloads/tokenizer....

2024-10-01 12:17:10 664

原创一个 /design 指令让你成为设计师

背景auto-coder.chat 本来就非常擅长代码和文档辅助，可以看这里的演示：然后也擅长拷贝别人的设计，并且能直接对接后端：但前置的设计能力还是有缺失的，比如如果你开发的时候，或者写文档的时候，希望有个配图，亦或者设计一个小logo, 设计一个组件，那么就需要有设计师的能力。现在，auto-coder.chat 终于补齐了这个短板，提供了一个 /design 指令，支持矢量图和普通图片格式。...

2024-09-19 08:39:21 387

原创端到端的 NL2SQL 引擎: Super-Analysis 震撼来袭，一个不同于市面已有产品的存在...

企业分析数据的未来已来你现在可以对着一张评论表说：对我们A产品进行了负面评论的用户数量是多少或者说：评论中用户的贴图有多少是中国风？大模型会自动生成一条 Byzer SQL 语句，完成评论字段的文本分析或者图片分析然后进行数据的聚合和统计，最后直接给出结论。看着简单的一句话，但实际系统需要突破两个关键难点：将用户的问题转化成SQLSQL 需要能够对评论字段或者图片字段进行自然语言分析，自动生...

2024-09-19 08:39:21 1198 1

原创全球首发：第二代 RAG 系统 auto-coder.rag 相比市面主流RAG系统 20%-60% 效果提升

先看评测结果基本效果上全面碾压当前市面上某主流的一代 RAG 系统。我们在文末会放出评测数据集以及问题，使用流程。欢迎大家和其他 RAG 系统做对比，并且发出自己的评测结果。在 9月13号，我们又新增了五道更加困难的题目，更加拉开了差距：下面是一些评测要求和指导：用户好评有用户第一时间应用于编程的文档库召回，反馈效果：也有人第一时间用来给黑神话悟空做攻略：还有人来做 Linux 内核分析：效果很好...

2024-09-18 12:45:17 1142

原创第一款已上线的纯AI开发的微信小程序开源了

长文翻译小程序是一个 100% 使用AI辅助编程工具 auto-coder.chat 开发的应用。如何在微信使用这个小程序打开微信，输入搜索词：长文翻译即可找到该小程序。点击打开：大家可以观看一段演示小视频:该项目人工手写的的代码几乎为0(不排除手欠，可能还是手动改过，所以只能用几乎)。项目地址：https://github.com/allwefantasy/long-translate如何...

2024-09-13 11:45:24 970 1

原创大模型的第一个杀手级应用场景出来了

大家终于都意识到大模型首先改变的是软件行业自己，而软件的根基是代码生成。代码生成第一波就是AI辅助开发，这个会是大模型第一个杀手级应用。大家苦苦逼问自己的大模型杀手级应用，为什么会是辅助编程，这里说下什么：必须吃狗粮，颠覆性技术连自己的领域都颠覆不了，那还叫啥颠覆性技术。允许出错。AI辅助开发具有良好的容错率，允许出错，这个相当重要，也是当前大模型在其他领域目前难以落地的根本原因。市场规模大，整...

2024-09-09 13:01:55 1318

学习JavaFX脚本语言_翻译_.pdf

jQuery1.2API

hibernate 关联保存 的困惑

hibernate 关联保存的困惑