自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

DEVELOPERAA的博客

原创还不知道怎么学大模型？别再闷头瞎学了，看我五分钟，顶你两小时

我虽然没有在大模型的专业领域登峰造极，但也是从零基础一点一点学成的，路上踩过不少坑，中途也划过水，甚至想过放弃，不过最后咬牙坚持了下来，我不敢说自己的建议多专业，只能说接点地气，可操作性强一点。

2025-05-10 16:51:10 1633

原创 10分钟无痛部署！字节Coze开源版喂饭教程

短短48小时内，GitHub星标数突破9000+ ，掀起开发圈热潮。最令人惊喜的是——它仅需2核CPU+4GB内存即可本地运行，真正将AI开发门槛拉低到“家用电脑级”。

2025-08-02 08:00:00 477

原创 2025主流大语言模型横评：合规、成本、开源，谁是企业最佳选择？

本文从企业最关注的六大维度出发，对全球主流大模型展开深度横评，为您的选型提供硬核参考。

2025-08-01 10:41:25 538

原创 2025大语言模型部署实战指南：从个人笔记本到企业级服务的全栈方案

本文将深度解析四大主流部署框架，覆盖个人本地调试、边缘设备、高并发生产环境三大核心场景，助你精准匹配技术方案。

2025-08-01 10:35:27 621

原创 2025年完整指南：Agent2Agent (A2A) 协议高级特性详解（第二部分）

本文是 A2A 协议完整指南的第二部分，重点介绍流式操作、异步处理、扩展机制和任务生命周期管理。

2025-07-31 14:41:13 527

原创 2025年完整指南：Agent2Agent (A2A) 协议 - AI智能体协作的新标准

Agent2Agent (A2A) 协议是一个开放标准，专门解决AI智能体生态系统中的核心挑战：如何让不同团队、使用不同技术、属于不同组织的AI智能体有效沟通和协作？

2025-07-31 14:39:44 554

原创投大模型岗？50道大型语言模型（LLM）面试问题汇总

通过本指南，深入探索大型语言模型（LLMs）的关键概念、技术和挑战，特别适合正在为面试做准备的AI爱好者和专业人士。

2025-07-30 09:43:19 984

原创 2个月转型AI产品经理，拿下25K的offer!把握这几点，你也可以做到！

2个月转型AI产品经理，拿下25K的offer!把握这几点，你也可以做到！

2025-07-30 09:37:01 454

原创 Coze开源版？别吹了！

但今天要谈的不是安装的问题，而是在深度体验了 Coze 开源版之后，感受到开源版存在两个致命问题，想和大家聊聊。

2025-07-29 14:03:55 699

原创本地AI知识库问答开源技术实现（三）--配置模型和知识库

通过三篇内容将最近学的内容梳理了一遍，从基本概念理解，到动手搭建，再到参数调整，最终达到一个基本可用的状态，所有数据都在内网流转；效果没有想像中的那么完美，但是用于知识库是可行的。

2025-07-29 09:00:00 880

原创本地AI知识库问答开源技术实现（二）--配置模型和知识库

本地AI知识库问答开源技术实现（二）--配置模型和知识库

2025-07-28 10:48:05 764

原创本地AI知识库问答开源技术实现（一）--安装和准备

自从 DeepSeek-R1 火出圈以来，很多个人和公司开始尝试本地化部署，以解决原来一些内部资料安全和隐私问题

2025-07-28 10:43:16 932

原创基于Ollama安装deepseek-r1模型搭建本地知识库（Dify、MaxKb、Open-WebUi、AnythingLLM、RAGFlow、FastGPT）

大模型（LLM，Large Language Model）指的是参数量巨大、基于深度学习训练的人工智能模型，用于自然语言处理（NLP）任务，如文本生成、对话、翻译、代码补全等。

2025-07-27 10:15:00 938

原创关于如何搭建anythingllm+ollama（deepseekr1、嵌入模型）+milvus的本地知识库语言模型

关于如何搭建anythingllm+ollama（deepseekr1、嵌入模型）+milvus的本地知识库语言模型

2025-07-27 07:00:00 972

原创 Qwen Code与Claude Coder Router体验

Qwen Code 是一个命令行 AI 工作流工具，源自 Gemini CLI，针对 Qwen3-Coder 模型进行了优化，增强了解析器支持和工具支持。

2025-07-26 11:36:28 1108

原创 AI工具推荐：使用AnythingLLM帮助你学习

AnythingLLM 是一个最容易使用的全能 AI 应用，可以进行 RAG、AI 代理等多种功能，无需编写代码或担心基础设施问题。

2025-07-26 11:35:22 988

原创大模型面试官：Dify如何调用外部程序？

Dify 有多种调用外部程序的方式，例如调用外部 Java、Python 等程序。

2025-07-25 10:54:48 727

原创大模型面试官：聊聊RAG的执行流程？

RAG、MCP 和 FunctionCall 等都是 AI 的核心技术，同时也是面试中最长问的知识点，那么今天就来看下：RAG 技术及其执行流程。

2025-07-25 10:51:01 766

原创 Dify v1.5.0 版本深度解读：开发者必看核心特性与升级全解析

一个完整的 Dify 智能体开发，链路往往又长又复杂。从 RAG 检索、工具调用、LLM 推理到代码整合输出，每一步都可能成为“黑盒”。

2025-07-24 10:36:02 725

原创个人本地知识库最优管理方案 FastGPT 部署指南

FastGPT 是一个基于大语言模型（LLM）的知识型平台，支持数据处理、RAG 检索、可视化 AI 工作流编排等功能，可以帮助你快速搭建复杂的问答系统，无需复杂配置。

2025-07-24 10:34:29 631

原创小白能看懂的AI大模型系列一引言

大模型一般是指参数了超过1B的模型，还有一些比较小的模型，比如bert模型，可能总共几百M，算是GPT3.5、qwen、DeepSeek之前的优秀模型了，大家刚开始玩的时候，可以先用bert模型试一试。

2025-07-23 10:53:45 452

原创小白能看懂的AI大模型系列-本地部署（vllm）

目前开源大模型的一大优势就是，它可以本地化部署，只要你的显卡硬件配置能满足要求，你可以在自己的本地部署属于自己的大模型，不用担心数据泄露等问题。

2025-07-23 10:52:13 791

原创 MCP实现AI Agent的最佳实践

通过MCP实现AI Agent的最佳实践，目前主要集中在开发工具集成、自动化工作流、跨领域协作以及生态扩展等方面。我们一个个来看。

2025-07-22 08:45:00 713

原创 RAG 实战指南（五）：RAG 信息检索：如何让模型找到‘对的知识’

如果查的资料靠谱、精确、上下文合理，回答自然逻辑清晰、信息详实；反之，如果检索不到关键内容，生成再强的模型也只能“睁眼说瞎话”。

2025-07-21 09:00:00 1757

原创 RAG 实战指南（四）：RAG-embedding篇

Embedding（嵌入向量）是将文字、图片、语音等“人类语言”转换为“计算机语言”的关键一步。它的作用，是把一句话或者一个词，变成一串可以进行数学运算的数字向量，让模型能“理解”我们在说什么。计算机不懂“情绪”“背景”“常识”，它只能处理数字。所以如果我们问它：“北京和上海哪个更大？”它必须先把这句话变成数字（向量），再去和知识库里的内容做匹配——这就靠 embedding。如果没有 embedding，AI 就像一个英语六级都没过的“文盲”，你说什么，它都回你：“对不起，我不明白。

2025-07-20 07:30:00 661

原创 RAG 实战指南（三）：一文搞懂RAG的切分策略

在RAG系统的构建中，文档切分策略很大程度上决定着模型检索质量，切分的好，信息命中更精准，生成回答更有上下文逻辑；切分的差，AI或许会变成“口吃患者”。

2025-07-19 08:30:00 824

原创 RAG 实战指南（二）：一文搞懂RAG 的文档解析

对于RAG来说，最重要的无疑是从文档中提取内容作为知识库，所以从文档中提取得到高质量的数据至关重要。

2025-07-18 10:00:00 842

原创 RAG 实战指南（一）：什么是RAG？一文搞懂检索增强生成技术

大家好，我准备开启一个全新的系列，来聊聊——RAG（Retrieval-Augmented Generation）系统的底层设计与工程实现。

2025-07-18 08:00:00 914

原创 RAG从入门到精通系列3：Routing（路由）

LLM（Large Language Model，大型语言模型）是一个功能强大的新平台，但它们并不总是使用与我们的任务相关的数据或者是最新的数据进行训练。

2025-07-17 10:45:00 961

原创 RAG从入门到精通系列2：Query Translation（查询翻译）

RAG（Retrieval Augmented Generation，检索增强生成）是一种将 LLM 与外部数据源（例如私有数据或最新数据）连接的通用方法。它允许 LLM 使用外部数据来生成其输出。

2025-07-17 08:45:00 605

原创 RAG从入门到精通系列1：基础RAG

RAG（Retrieval Augmented Generation，检索增强生成）是一种将 LLM 与外部数据源（例如私有数据或最新数据）连接的通用方法。它允许 LLM 使用外部数据来生成其输出。

2025-07-16 09:30:00 610

原创 LLM大型语言模型脑图（三）应用篇

基于大模型的应用平台是连接用户需求与模型能力的桥梁，旨在通过集成化的开发环境和工具链支持快速构建AI应用。

2025-07-16 09:00:00 1002

原创 LLM大型语言模型脑图（二）开发篇

基于大模型的开发是一个快速发展的领域，涵盖从需求分析到部署优化的完整流程。开发框架如Hugging Face、LangChain等提供了强大的工具支持，而开发方向则覆盖了对话系统、代码辅助、多模态应用等多个领域。

2025-07-15 11:16:26 530

原创 LLM大型语言模型脑图（一） - 开发篇

收到很多同学的私信，发现大家对LLM基础技术还是比较感兴趣，故根据我现在已有的知识，给大家整理一个脑图；主要梳理了基础技术篇的脑图，后续文章会继续给出开发、应用偏的脑图；辅助小伙伴们对LLM认知。

2025-07-15 11:08:26 808

原创全网最全解析！大模型面试宝典60题（附答案）

最近没有什么事，想系统的梳理一下大模型相关的事情。偶然阅读了李博杰翻译的《图解大模型》一书，其中有配套阅读：大模型面试题 60 问，根据自己的理解给了相应的一个答案，供大家参考。

2025-07-14 10:10:40 791

原创 2025 神仙开源 AI 教程，还不学你真就落后了

大家好，如果说国内想要学习 AI 开发的教程， Datawhale 出品的课程不得不推荐大家了。置顶仓库都是关于 AI 学习的。

2025-07-14 10:08:41 823

原创 Google这波开源太牛了！让大模型连上数据库!!

Google这波开源太牛了！让大模型连上数据库!!

2025-07-13 08:30:00 1535

原创狂揽23.9k stars！超棒的开源LLM资源列表来啦（附教程）

大型语言模型（LLM）已经席卷了NLP社区、AI社区和全世界。以下是关于大型语言模型的精选资源列表，特别是与ChatGPT相关的内容。

2025-07-13 06:45:00 608

原创 10 秒内通过一个简单的命令，微调你的本地大模型！！

今天看到北京大学的一个大佬开源项目，通过一个制定命令微调大模型，不需要你懂太多的技术，只需要你有足够高的电脑配置。

2025-07-12 15:12:08 297

原创零代码！用DeepSeek、Coze打造一个AI“活简历”

还在用PDF简历海投？太Out了！今天教你一个超酷玩法：把你的简历变成能对话的AI助手，嵌在你的个人网页上！

2025-07-12 15:10:01 253

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

博客等级

码龄3年

1521
原创

1万+
点赞

1万+
收藏

9064
粉丝

关注

私信

热门文章

分类专栏

爬虫 132篇
Python 154篇
程序员 134篇
副业 47篇

最新评论

Dify又一神器 - Firecrawl一键爬取网站，打造更丰富的AI知识库！
爱吃烤鱼的猫: 请问，firecrawl 如果网址有权限，类似比如登录之后才能访问的页面，这个在dify 中怎么解决。如果涉及有权限的网址，抓取的都是登录页的信息，并不是我想要的内容。
【Mac用户必看】Mac Mini完美运行LLaMA-Factory！手把手安装教程来了
sinat_29060633: (base) fangzi@fangrenweideMacBook-Pro-2 ~ % pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu Looking in indexes: https://download.pytorch.org/whl/nightly/cpu ERROR: Could not find a version that satisfies the requirement torch (from versions: none) ERROR: No matching distribution found for torch 没有带有支持苹果m系列的PyTorch (Metal)啊，老哥从哪里下载的？
使用DeepSpeed进行大模型推理加速的指南（附教程）
如月恋★Yuki: 是否可以理解为训练和推理的时候都可以通过deepspeed.initialize来导入模型
程序员兼职平台有哪些？一文让你解决这个问题
前进的程序员: 挺有用的！
AI大模型本地部署 | 详细教程，私有化部署体验 Dify！
m0_52236107: 您好，请问daemon.json文件在哪里改

提示

确定要删除当前文章？

取消删除