自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1139)
  • 收藏
  • 关注

原创 DeepSeek超全使用指南(2025最新版)-从入门到精通

在AI工具井喷的2025年,DeepSeek凭借其强大的中文理解能力和场景化解决方案,成为职场人、创作者和开发者的效率神器。本文将手把手教你解锁DeepSeek的全部潜能,让你的生产力实现指数级飞跃。DeepSeek R1正式入驻Azure AI Studio,成为首个直连全球GPU资源池的中国大模型。这记重拳直接击碎"东西方AI生态隔离"的幻想——当华盛顿还在讨论技术封锁法案时,中国AI已用代码轰开微软帝国的大门,聪明的中国用户早已用DeepSeek写完周报、搞定投标书、甚至生成年会相声剧本。

2025-02-06 10:31:45 53505 2

原创 DeepSeek 超全面指南!入门 DeepSeek 必看

最近,AI界出现了一匹黑马——DeepSeek。这个名字可能对很多人来说还比较陌生,但它已经在全球范围内引发了巨大的关注,甚至让一些科技巨头感到了压力。今天,就让我们一起走进DeepSeek的世界,看看它到底有多厉害!DeepSeek(中文名:深度求索)是一款由杭州深度求索人工智能基础技术研究有限公司开发的人工智能模型。它的英文名“DeepSeek”可以读作“深思”(Deep)和“探索”(Seek),寓意着通过深度学习技术探索未知的领域。

2025-02-04 13:38:35 359959 3

原创 2025 年全新大模型 LLM 学习路线重磅来袭,非常详细,收藏我这一篇就够了

ChatGPT的问世掀起全球AI大模型热潮,2023年被视作AI元年,AI大模型正以迅猛之势闯入大众生活。

2025-06-25 11:39:23 206

原创 学习产品经理,不知从哪开始?有哪些推荐的学习路径、书籍、课程或网站?看完少走弯路!

想入行产品经理,却被海量学习资料搞得晕头转向?不知道从哪里开始学?别担心!今天这篇文章,将为你系统梳理学习产品经理的正确路径,推荐超实用的书籍、课程和网站,帮你快速搭建知识体系,少走弯路,高效成长!

2025-06-25 11:37:31 269

原创 大模型训练全解析:预训练、微调、强化学习,一步到位!

2025年初,随着DeepSeek的迅速走红,公众对LLM(大语言模型)的兴趣急剧上升。许多人被LLM展现出的近乎魔法的能力所吸引。然而,这些看似神奇的模型背后究竟隐藏着什么秘密?接下来,我们将深入探讨LLM的构建、训练和微调过程,揭示它们如何从基础模型演变为我们今天所使用的强大AI系统。

2025-06-25 11:36:03 389

原创 大语言模型 LLM 的基础:什么是词嵌入?一文搞懂词嵌入是干什么的!

词嵌入已经成为处理自然语言(如语音或文本)任务的人工智能工具中最常用的工具之一,也是其取得惊人成就的主要驱动力。

2025-06-25 11:21:18 404

原创 字节内部热捧“7种大模型微调的方法笔记”,简直太全了!!

随着 ChatGPT 的爆火,很多机构都开源了自己的大模型,比如清华的 ChatGLM-6B/ChatGLM-10B/ChatGLM-130B,HuggingFace 的 BLOOM-176B。当然还有很多没有开源的,比如 OpenAI 的 ChatGPT/GPT-4,百度的文心一言,谷歌的 PLAM-540B,华为的盘古大模型,阿里的通义千问,等等。

2025-06-24 11:01:53 413

原创 一文拆解:主流大模型微调开源框架怎么选?一招搞定!

随着大型语言模型(LLMs)的快速发展,微调技术成为了让这些模型适应特定领域和任务的关键方法。本报告将分析主流的大模型微调开源框架,比较它们的特性、优劣势和适用场景,从数据并行、模型并行、SFT微调和强化微调等方面展开分析。

2025-06-24 10:59:01 797

原创 大模型Agent入门指南:从概念到实战的全解析(新手必看)

Agent,通常被译为智能体,它是一种能够感知所处环境,并依据所感知到的信息自主做出决策并执行相应行动,以实现特定目标的实体。这一实体可以是软件程序,如手机中的语音助手、电商平台的智能推荐系统;也可以是硬件设备,像自动驾驶汽车中的智能控制系统、工业生产线上的智能机器人;甚至还可以是虚拟的数字存在,例如在线游戏中的非玩家角色(NPC)、虚拟客服等。

2025-06-24 10:54:36 740

原创 取代后端岗,中国又一新兴岗位在崛起!这才是程序员未来3-5年最好的就业方向!

2025年,AI大模型不仅在取代传统CRUD开发模式,也在重构30+程序员的职业命运!

2025-06-24 10:50:23 738

原创 理解什么是AI Agent,看懂这篇就够了

AI Agent(人工智能代理)是一种能够感知环境、自主决策并执行动作的智能实体。与传统AI系统不同,Agent不仅能回答问题,还能主动完成一系列复杂任务。

2025-06-23 11:17:29 577

原创 2025年又一新兴岗位崛起!这才是开发人未来5年最好的就业方向!

2025年伊始,AI技术蓬勃发展的态势愈演愈烈,正以前所未有的力度重塑程序员的职业轨迹:

2025-06-23 11:15:05 945

原创 RAG+AI工作流+Agent:LLM框架该如何选择,全面对比MaxKB、Dify、FastGPT、RagFlow等

MaxKB = Max Knowledge Base,是一款基于 LLM 大语言模型的开源知识库问答系统,旨在成为企业的最强大脑。它能够帮助企业高效地管理知识,并提供智能问答功能。想象一下,你有一个虚拟助手,可以回答各种关于公司内部知识的问题,无论是政策、流程,还是技术文档,MaxKB 都能快速准确地给出答案:比如公司内网如何访问、如何提交视觉设计需求等等

2025-06-23 11:11:20 975

原创 什么是AI大模型?一文给你讲清楚为什么它能“通吃”所有任务?

AI大模型就像一个“超级程序员”,但它不是写代码,而是通过学习海量数据来完成各种任务(比如写文章、看图、翻译)。它的核心特点可以用程序员熟悉的术语来理解:

2025-06-21 11:23:58 684

原创 大模型 AI 时代背景下,中年程序员面对的挑战与机遇

在大模型 AI(如GPT、通用多模态模型)高速发展的当下,软件行业已然步入了新的技术拐点。中年程序员,这一曾经在上一波互联网浪潮、AI早期实现中立下汗马功劳的群体,正面临着前所未有的挑战——AI技术门槛的变化、就业结构的重塑以及技能更新的迫切需求。但与此同时,新的机遇也静悄悄降临:经验与行业洞察,将在大模型时代焕发出全新活力。本文将围绕大模型的核心特征、技术优势,以及它对传统编程技能的冲击和转化,深入探讨中年程序员如何自我定位与进阶。

2025-06-21 11:17:56 525

原创 信息过载时代,如何真正「懂」LLM?从MIT分享的50个面试题开始

最近,MIT CSAIL 分享了一份由工程师 Hao Hoang 编写的 LLM 面试指南,精选了 50 个关键问题,旨在帮助专业人士和AI爱好者深入理解其核心概念、技术与挑战。

2025-06-20 14:19:27 887

原创 作为一个普通的程序员,到底应不应该转型AI大模型?

在程序员圈子中,技术转型近年来一直是热门话题。随着AI技术的迅猛发展,优秀人才短缺,程序员向AI大模型转型似乎成为了一条通往职场先机的路径。但是,这条转型之路是否容易走,成功率又如何呢?作为一个普通的程序员,到底应不应该转型AI大模型?

2025-06-20 11:02:15 1123

原创 一文详解39种Dify常见使用问题报错及解决方案汇总(长文收藏)

Dify 作为一个强大的开源大语言模型(LLM)应用开发平台,其安装、配置和使用过程中可能会遇到各种问题。本指南旨在全面梳理 Dify 用户在安装部署、插件开发、日常运维以及 API 调用等环节中常见的错误类型,提供详尽的报错信息、问题分析、解决方案及相关的官方文档或社区讨论链接,以帮助用户快速定位并解决问题,提升 Dify 使用体验。

2025-06-19 10:59:18 1538 2

原创 大模型小白必读:一份超详细的大模型学习路线图!

GPT-4o、Claude 3 等大语言模型革新内容生产模式,在代码编写、数据分析、创意写作等任务中,效率提升超 10 倍;生成式 AI 工具,如 Stable Diffusion 3、Runway ML,广泛应用于设计、影视、教育等领域,催生出全新的「AI 原生职业」;企业应用场景也迎来爆发,RAG(检索增强生成)重塑知识管理系统,AI Agent(像 AutoGPT)实现业务流程自动化。

2025-06-19 10:40:41 870

原创 AI Agents入门教程:带你从零开始构建Agent,看这一篇就够了!

在本文中,我们将探讨如何使用 Python 从零开始构建一个Agent。该Agent能够根据用户输入做出决策、选择适当的工具并执行相应的任务。让我们开始吧!

2025-06-18 15:55:44 731

原创 强烈推荐:唯一熬夜读完LLM终极指南《LLM 应用开发实践笔记》免费分享

大语言模型(Large Language Model)是一种基于深度学习技术的自然语言处理通用模型,它可以通过学习大规模文本数据的模式和规律,从而实现对自然语言的理解和生成。通用型:在广泛的任务中表现出色,而不是针对一项特定任务,规模大:参数数量在数十亿或更多数量级的深度学习模型。

2025-06-18 11:16:35 180

原创 【大模型基础】一文给你讲清楚什么是知识图谱和AI多模态推理!

大模型与知识图谱结合,构建企业智能知识管理平台,为解决上述难题提供了新的思路:大模型技术能够从海量数据中提取复杂信息,具备学习和推理能力,而知识图谱则通过图形结构,将知识进行有机整合,展示出实体之间的关系和语义信息。两个技术的结合,将实现更加便捷的知识管理、更加精准的智能问答、以及更加可靠的智能决策与分析。

2025-06-18 10:55:18 522

原创 【转型必看】编程到AI,程序员的逆袭秘籍,转行人工智能不再是梦!

在当今科技领域,人工智能(AI)凭借技术的持续进步,已成为备受瞩目的热门话题。众多开发者正考虑从传统软件开发领域,例如Java,迈向人工智能的新天地。今天,让我们一同探讨Java开发者转向人工智能领域的可行性,包括转型带来的优势、薪资水平的对比,以及成功转型所需的知识体系和学习路径。

2025-06-17 11:27:18 1018

原创 【大模型面试】大模型的FunctionCalling如何训练得到?

主要来说,Function Calling 的训练主要涉及数据构造、模型架构适配、多阶段微调等关键环节。

2025-06-17 11:19:18 664

原创 最新最全AI产品经理学习路线图,看这一篇就够了!

在人工智能领域,AI产品经理的角色越来越重要。他们不仅需要理解AI的基本概念和技术,还需要掌握如何将这些技术应用到实际的产品开发中。本文将详细介绍一份AI产品经理的学习路线图。

2025-06-17 11:08:56 574

原创 大模型微调:一文探秘大语言模型的上下文学习与高效微调方法

在快速发展的人工智能领域中,有效地利用大型语言模型(LLM)变得越来越重要。然而,有许多不同的方式可以使用大型语言模型,这可能会让我们感到困惑。实际上,可以使用预训练的大型语言模型进行新任务的上下文学习并进行微调。

2025-06-17 10:59:48 831

原创 大模型开发基础 | 一文带你了解大模型部署及其调用

AI大模型是人工智能领域的一种新型技术范式,指通过海量数据和巨量参数训练形成的通用性基础模型,具备跨任务迁移能力和复杂问题解决能力。

2025-06-16 13:44:14 654

原创 【一文看懂】什么是RAG的原理:让AI学会做笔记,看这一篇就够了!

自2023年GPT爆火全球后,RAG就作为弥补大模型记忆能力短板的关键组件,同时也爆火了。时至今日,RAG仍是大家津津乐道的技术。如果想要充分发挥大模型的潜力,懂一些RAG的基本原理还是非常关键的。今年智能体Agent爆火,RAG技术同样是当前Agent增强记忆能力的关键技术。

2025-06-16 11:57:18 767

原创 AI产品经理必读:掌握「模型、算力、数据」三大要素,打造AI飞轮,实现业务破局

DeepSeek的发布,人工智能技术迅猛发展,各行各业都在尝试将AI应用于实际业务场景。无论是互联网巨头,还是初创企业,都在探寻AI如何带来真正的价值增长。然而,很多企业在落地AI项目时,却常常陷入“概念热闹,实际效果不佳”的困境。要想让AI真正“落地生根”,AI产品经理必须深刻理解模型、算力、数据三大关键要素,以及它们之间如何形成相互促进的飞轮效应。

2025-06-16 11:45:41 632

原创 2025年大模型架构创新研究报告|附30页PDF文件下载

大模型架构历经多阶段演变。早期 RNN 及其变体主导 NLP,但有训练难等弊端。2017 年 Transformer 架构开启新时代,预训练 + 微调成主流,模型路线分化。后参数规模不断突破,可随着模型增大,Transformer 架构及预训练范式遇瓶颈。如今,创新架构探索兴起。其核心痛点在于算力消耗大、端侧部署难、长序列效率低。创新路径上,Transformer 架构改进,如 Attention 机制等创新;非 Transformer 架构涌现,像新型 RNN、CNN 路径及其他受启发路径。架构创新呈现混

2025-06-15 10:00:00 1480

原创 终于搞明白Token是啥?为啥大模型按Token收费?原来这才是学懂开干Transformer的第一步!

你有没有这种感觉?看了很多Transformer 和大语言模型(LLM)文章,却被搞得一头雾水,感觉始终差了那么一点点才能真正理解它们?别担心,你不是一个人!今天,我们将深入探讨 LLM 中一个至关重要的核心概念——Token。对我个人而言,正是彻底搞懂了“词元(Token)”和“分词器”(Tokenizer)的那一刻,才真正迎来了我学习 Transformer 的“第一次顿悟”。这可能是我在整个大模型学

2025-06-15 08:45:00 181

原创 从算力到场景:一套架构图说透AI落地全流程,老板必看的“智能化避坑指南”

在数字化浪潮愈演愈烈的当下,人工智能(AI)早已不是科研实验室里的专属产物,而成为重塑企业生产方式、决策流程和客户体验的核心引擎。然而,要真正让AI释放价值,仅仅靠一个大模型远远不够。一张看似复杂的AI架构图背后,隐藏着从底层算力到上层应用的全链条思考。今天,我们就以一张全栈架构图为起点,逐层拆解,带你读懂AI大模型落地的核心逻辑与实战路径,为你的企业智能化之路提供一套“可视、可用、可落地”的蓝图。

2025-06-13 11:23:20 928

原创 杀疯了!深度解析NLP底层技术—复旦大学《自然语言处理导论》

《自然语言处理导论》是由复旦大学自然语言处理实验室张奇教授、桂韬研究员以及黄萱菁教授,结合自己对相关领域的核心问题的理解,和长期教学、研究以及工程实践经验,系统梳理了自然语言处理领域发展至今的关键知识,历时近三年,完成了初版。

2025-06-13 11:20:27 411

原创 【万字长文】一文讲清大语言模型(LLM)的工作原理

经常关注AI资讯的朋友,可能都有这样的感受:技术更新迭代实在太快,几乎每天都有新名词冒出来,比如智能体、MCP、A2A、Manus、扣子空间、Cursor……让人眼花缭乱、猝不及防。 在这个高速变化的时代,很多人一方面相信AI是未来发展的核心趋势,不愿被落下;另一方面却也常常感到焦虑——刚刚理解了一个概念,更复杂的新名词

2025-06-13 11:14:30 957

原创 多模态LLM是什么?一文讲清楚多模态 LLM 的工作原理!

多模态 LLM 是能够处理多种类型输入的大型语言模型, 多模态 LLM 可以接受不同的输入模态(音频、文本、图像和视频)并返回文本作为输出模态。

2025-06-13 11:09:12 694

原创 5本自学大模型的入门书籍,从入门到精通,都在这里了!

面对市面上学习大模型的图书和课程,很多人不知道如何选择适合自己的书。因此,我为大家整理了一份大模型学习路线图,简单明了无套路,从编程基础入门到大模型应用开发,如果你正在入门,不需要到处 Mark 未经筛选的、五花八门的学习内容,只要从头到尾认真学习这几本书就够了!

2025-06-12 10:57:43 515

原创 产品经理转行 AI产品经理基础教程(非常详细),AI产品经理如何入门,收藏这一篇就够了!

AI发展至今大致按照在产业结构上的分工不同产生了三种类型的公司,我们在转型时最好要先明确自己的优势及兴趣,来判断自己适合着眼于哪个层面的工作,从而进行针对性的学习和提升。

2025-06-12 10:54:57 960

原创 从零开始搭建RAG系统系列:RAG系统性能优化技巧-生成模块优化 (Optimizing Generator)

生成模块优化 (Optimizing Generator)即使检索到了高质量的上下文,LLM生成答案的环节也同样需要优化,以确保最终输出满足用户期望。

2025-06-12 10:43:20 972

原创 RAG是什么?模型RAG技术原理解析,零基础入门到精通,收藏这篇就够了

传统的语言模型,比如 GPT-3,虽然在生成文本方面表现出色,但它们有一个显著的局限性:它们依赖于预训练的参数,无法动态访问外部知识。这意味着这些模型在处理实时信息、领域特定知识或罕见实体时表现不佳。举个例子,在问答任务中,模型可能会生成不准确或过时的答案,因为它无法访问最新的数据。就像你问一个朋友“今天天气怎么样?”,但他只能告诉你去年的天气情况,显然这样的信息对你来说毫无用处。

2025-06-12 10:39:52 857

原创 一文读懂 2025 年检索增强生成 RAG 开发技术栈​

检索增强生成(Retrieval-Augmented Generation,RAG)作为一种融合检索与生成的混合方法,在众多前沿应用中占据核心地位。本文将对构建现代 RAG 系统所需的技术栈进行系统梳理,涵盖从底层模型到数据处理的全方位内容。

2025-06-11 11:36:17 923

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除