自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1763)
  • 收藏
  • 关注

原创 大模型电子书学习推荐 | 这份必读书单请收好,大模型时代,应趁风而起!

今天为你精心整理了一份大模型领域的必读书单,覆盖学习的各个阶段,帮你理清重点,精准锁定最核心、最实用的内容,助你快速突破认知和技术瓶颈。

2025-08-06 11:40:42 593

原创 还不知道怎么学大模型?别再闷头瞎学了,看我五分钟,顶你两小时

我虽然没有在大模型的专业领域登峰造极,但也是从零基础一点一点学成的,路上踩过不少坑,中途也划过水,甚至想过放弃,不过最后咬牙坚持了下来,我不敢说自己的建议多专业,只能说接点地气,可操作性强一点。

2025-05-10 16:51:10 1641

原创 构建AI Agents-你一定要知道的10大开源利器,大模型入门到精通,收藏这篇就足够了!

还记得 AI 只是聊天机器人给出刻板回答的时代吗?那已经是过去式了。如今的 AI 代理可以研究、编码、聊天、创造,甚至与其他 AI 代理协作,就像小小的数字联合创始人。

2025-09-14 10:00:00 395

原创 AI LLM 利器 Ollama 架构和对话处理流程解析,大模型入门到精通,收藏这篇就足够了!

Ollama 是一个旨在快速运行大语言模型(LLM)的简便工具。通过 Ollama,用户无需复杂的环境配置,即可轻松与大语言模型进行交互。

2025-09-14 08:45:00 437

原创 LangGraph+MCP+Ollama:打造强大的多智能体聊天机器人,大模型入门到精通,收藏这篇就足够了!

MCP 提供了一个通用的开放标准,使 AI 系统能够以标准化方式连接到各种数据源、工具和服务,减少了为每个数据源构建单独连接器的需求,简化了 AI 集成过程。

2025-09-14 08:15:00 381

原创 使用 Google 的 A2A 协议、ADK 和 MCP 构建多智能体 AI 应用(二)大模型入门到精通,收藏这篇就足够了!

本文探讨了如何在旅行规划场景中使用可复用的 A2A 组件、ADK、LangChain 和 MCP 构建功能齐全的多智能体系统。使用 A2A 动态地发现和调用彼此通过 MCP 以模型友好的方式连接到外部 API利用 ADK 和 LangChain 等现代框架以清晰的任务生命周期和结构化结果进行异步通信相同的原则可以扩展到更多领域,例如零售、客户服务自动化、运营工作流和 AI 辅助企业工具。本文所用的代码,笔者会整理放Github上,会放评论区。敬请期待🎉🚀🚀🚀。

2025-09-13 10:56:39 388

原创 使用 Google 的 A2A 协议、ADK 和 MCP 构建多智能体 AI 应用,大模型入门到精通,收藏这篇就足够了!

Google宣布了代理间 (A2A) 协议——一项强大的开放标准,允许 AI 代理跨组织边界进行通信、协作和协调行动。

2025-09-13 10:55:41 618

原创 一步步将DeepSeek R1微调成一个DeepDoctor(资深医生)大模型入门到精通,收藏这篇就足够了!

DeepSeek-R1 和 DeepSeek-R1-Zero 在数学、编程和逻辑推理任务上与 OpenAI 的 o1 性能相当。但是 R1 和 R1-Zero 都是开源的。

2025-09-13 10:54:19 626

原创 # 363页|大模型应用:从提示工程到AI智能体(讲义版)(附下载)

想入门 AI 大模型却找不到清晰方向?备考大厂 AI 岗还在四处搜集零散资料?别再浪费时间啦!2025 年已整理完毕,从学习路线到面试真题,从工具教程到行业报告,一站式覆盖你的所有需求,现在全部免费分享!​。

2025-09-13 10:53:02 453

原创 LLM大型语言模型脑图 - 开发篇,大模型入门到精通,收藏这篇就足够了!

随着模型性能提升和计算成本降低,LLM将在更多行业中实现深度应用。开发者需要关注技术迭代,结合具体场景优化模型与系统,以实现高效、可靠的解决方案。

2025-09-13 10:50:57 721

原创 LLM大型语言模型脑图 - 应用篇,大模型入门到精通,收藏这篇就足够了!

基于大模型的应用平台是连接用户需求与模型能力的桥梁,旨在通过集成化的开发环境和工具链支持快速构建AI应用。

2025-09-13 10:50:08 477

原创 LLM大型语言模型脑图-基础技术篇,大模型入门到精通,收藏这篇就足够了!

笔者发现大家对LLM基础技术还是比较感兴趣,故根据我现在已有的知识,给大家整理一个脑图;主要梳理了基础技术篇的脑图,后续文章会继续给出开发、应用偏的脑图;辅助小伙伴们对LLM认知。

2025-09-13 10:49:22 397

原创 大模型部署:十分钟安装部署大模型ChatGML-6B,大模型入门到精通,收藏这篇就足够了!

近期大模型可谓是如火如荼,按耐不住也想手动安装部署大模型,近距离接触大模型,废话不多说直接开始安装部署。

2025-09-12 12:01:02 512

原创 本地知识库:如何手撸一个自有知识库的RAG系统,大模型入门到精通,收藏这篇就足够了!

这是一种结合了检索(Retrieval)和生成(Generation)的机器学习模型,通常用于自然语言处理任务,如文本生成、问答系统等。

2025-09-12 12:00:01 695

原创 医疗大模型部署:聊聊心理医疗领域大模型的落地思考,大模型入门到精通,收藏这篇就足够了!

近来,工作偏向于心理医疗领域方面的大模型,仅从领域大模型的落地,聊聊个人的一些思考。

2025-09-12 11:59:09 665

原创 AI大模型:只需三步,本地部署构建自己的AI个人专属知识库,大模型知识库部署入门到精通,收藏这篇就足够了!

本文会手把手教你如何部署本地大模型以及搭建个人知识库

2025-09-12 11:58:18 488

原创 大模型必学微调项目:LLaMA-Factory,大语言模型微调框架,大模型入门到精通,收藏这篇就足够了!

LLaMA-Factory 是一个国内北航开源的低代码大模型训练框架,专为大型语言模型(LLMs)的微调而设计

2025-09-12 11:57:10 852

原创 全网爆火,学AI大模型必备的大模型黑书来了!全网全都在学! (附PDF书籍)

今天给大家推荐一本4月份才新出的大型语言模型(LLM)的权威教程《基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理》!

2025-09-12 11:55:57 567

原创 本地部署知识库:Llama 3 + RAG +大模型开源教程「动手学大模型应用开发」,大模型入门到精通,收藏这篇就足够了!

在本教程中,我们将深入探讨设置开发环境、加载和处理网页数据、创建嵌入和向量存储以及实现 RAG 链以提供卓越用户体验的分步过程。

2025-09-12 11:54:25 796

原创 上海交大动手学大模型教程,快速入门LLM大模型(附PPT课件)大模型入门到精通,收藏这篇就足够了!

就在4月份上交大发布了动手学大模型教程,这份教程来自上海交大 《人工智能安全技术》 课程讲义拓展,教师是是张倬胜教授。

2025-09-12 11:53:10 593

原创 RAG知识库:一文带你速通RAG、知识库和LLM,大模型入门到精通,收藏这篇就足够了!

检索增强生成(Retrieval Augmented Generation,RAG)是一种强大的工具,它通过将企业外部知识整合到生成过程中,增强了大语言模型(LLM)的性能。

2025-09-12 11:46:55 573

原创 小白能看懂的AI大模型系列7-xtuner微调自定义数据集

本篇以魔搭社区上的开放数据集-沐雪(中文)训练集为例进行模型微调(这个模型挺有意思的,回答是萌萌的风格),最终实现模型对话的结果与数据集中的类似。

2025-09-12 07:15:00 874

原创 小白能看懂的AI大模型系列6-模型合并及XTuner框架部署

本篇主要讲2个方面,一个是微调后的权重文件如何与base模型合并;一个是另外一款微调工具XTuner的本地化部署。

2025-09-11 11:36:59 527

原创 小白能看懂的AI大模型系列5-自我认知微调训练(LLAma-Factory)

本篇以llamafactory自带的数据集-identity为例,讲述如何进行微调训练并进行测试。

2025-09-11 11:36:07 719

原创 小白能看懂的AI大模型系列4-模型微调(LLAma-Factory本地安装)

模型微调是针对base模型的一种局部调整,让模型可以按照你想要的输出内容方式输出内容。

2025-09-11 11:35:25 957

原创 小白能看懂的AI大模型系列-本地部署(LMDeploy国产开源工具),大模型入门到精通,收藏这篇就足够了!

这里给大家一款国产的大模型部署框架:LMDeploy,它是由上海人工智能实验室牵头开发的。

2025-09-11 11:34:21 801

原创 小白能看懂的AI大模型系列-本地部署(vllm)大模型入门到精通,收藏这篇就足够了!

目前开源大模型的一大优势就是,它可以本地化部署,只要你的显卡硬件配置能满足要求,你可以在自己的本地部署属于自己的大模型,不用担心数据泄露等问题。

2025-09-11 11:33:28 576

原创 小白能看懂的AI大模型系列一引言,AI大模型是什么?能做什么?

大模型一般是指参数了超过1B的模型,还有一些比较小的模型,比如bert模型,可能总共几百M,算是GPT3.5、qwen、DeepSeek之前的优秀模型了,大家刚开始玩的时候,可以先用bert模型试一试。

2025-09-11 11:31:57 897

原创 基于大模型的 RAG 核心开发——详细介绍 DeepSeek R1 本地化部署流程

DeepSeek 模型从环境准备、模型加载到 RAG 功能集成,每一个环节都体现了大模型与企业私有化场景深度融合的技术潜力。

2025-09-11 11:26:39 722

原创 新手入门 | 搭建 AI 模型开发环境,大模型入门到精通,收藏这篇就足够了!

学习模型开发时,搭建环境可能会碰到很多曲折,这里提供一些通用的环境搭建安装方法,以便读者能够快速搭建出一套 AI 模型开发调试环境。

2025-09-11 11:24:44 693

原创 大模型系列:LLaMA-Factory大模型微调,大模型入门到精通,收藏这篇就足够了!

本次将详细介绍如何使用LLaMA-Factory从零开始微调大模型,帮助大家快速掌握这一技能。

2025-09-11 11:22:59 572

原创 AI大模型微调-LLaMA-Factory,大模型入门到精通,收藏这篇就足够了!

别再浪费时间啦!2025 年 AI 大模型全套学习资料已整理完毕,从学习路线到面试真题,从工具教程到行业报告,一站式覆盖你的所有需求,现在全部免费分享!

2025-09-11 11:19:21 623

原创 月薪已炒到6W?强烈建议大家冲一冲这个新兴领域,大模型入门到精通,收藏这篇就足够了!

想入门 AI 大模型却找不到清晰方向?备考大厂 AI 岗还在四处搜集零散资料?

2025-09-11 11:16:52 636

原创 大模型电子书分享 | 这份必读书单清单请收好(附PDF)

本期书单精心整理了一份大模型领域的必读书籍,覆盖学习的各个阶段,帮你理清重点,精准锁定最核心、最实用的内容,助你快速突破认知和技术瓶颈。

2025-09-10 11:11:39 847

原创 大模型书籍丨Llama大模型实践指南,深入浅出入门大模型(附PDF)

它为你揭开Llama大模型的神秘面纱,无论你是新手还是老手,都能在这里找到深入浅出的讲解和宝贵的实践灵感。

2025-09-10 11:09:47 940

原创 大模型炼丹术(八):干货!手把手教你玩转 LLM 的指令微调

通过指令微调,我们可以打造一个对话机器人,就像你一直在使用的各种大语言模型应用那样 —— 它能够接收用户的自然语言指令,并输出相应的回复。

2025-09-10 11:04:10 371

原创 大模型炼丹术(七):LLM微调实战:训练一个垃圾邮件分类器

本文使用一个垃圾邮件分类的任务,来说明如何基于预训练的GPT2在邮件数据集上进行微调,我们的目标是打造一个垃圾邮件分类器,输入一份邮件的内容,模型给出该邮件是否为垃圾邮件的分类结果。

2025-09-10 11:03:25 213

原创 大模型炼丹术(六):别只会用Greedy!6种主流LLM解码策略全面解析,附适用场景

在使用训练好的LLM进行自回归预测下一个token时,我们会选择预测序列中最后一个token对应的预测tensor,作为解码操作的对象。

2025-09-10 11:02:24 683

原创 大模型炼丹术(五):LLM自回归预训练过程详解

我们已经完成了整个数据流向所需的模块构建,包括tokenizer,embedding,注意力机制,并串联得到了GPT2这个LLM架构。

2025-09-10 11:01:27 306

原创 大模型炼丹术(四):从零开始动手搭建GPT2架构

本文首先搭建GPT架构包含的🧍各个小组件,然后将这些组件串联起来,得到最终的GPT架构。

2025-09-10 11:00:47 660

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除