- 博客(785)
- 收藏
- 关注

原创 DeepSeek 部署指南 (使用 vLLM 本地部署)
vLLM (https://github.com/vllm-project/vllm) 是一个快速且易于使用的库,用于进行大型语言模型的推理和部署。
2025-02-07 12:03:00
37544
5

原创 deepseek满血版本地最强部署教程!从此告别系统繁忙!
哈喽,大家好,要说当今社会什么东西最火那绝对是AI,在AI界最火的当属deepseek,然而所谓树大招风,由于它太优秀导致被各种攻击,所以就会导致使用是经常系统繁忙,实在影响使用心情,今天就教大家怎么在自己电脑本地部署DeepSeek R1 来解决这个问题。
2025-02-07 11:14:56
9780
1

原创 无需GPU!三步实现DeepSeek开源模型本地化部署。
deepseek和chatGpt最大的区别就在于,它是开源的模型,并且训练成本更低,这使得我们普通人也能够在自己的电脑部署大语言模型,训练自己的AI智能体。我们需要谨记的就是,AI是工具,是为了提高我们的效率,它能够给我们提供更精确,更具逻辑的回答,你再根据自身的需求进行修改和采用。最近Deepseek访问量剧增,导致App时常访问不了,但是不用担心,官方给我们提供了本地部署大模型的方案。
2025-02-05 11:06:52
22510

原创 DeepSeek全攻略:从零基础到精通的终极指南
Deep Seek是一款创新的智能搜索与分析平台,致力于通过先进的人工智能技术,帮助用户高效地从海量信息中提取关键信息。无论是数据挖掘、知识管理,还是市场分析,Deep Seek都能为您提供精准的搜索结果和深入的洞察力。今天,我们将带你深入了解这款工具,从入门到精通,掌握它的核心功能与使用技巧,开启高效智能工作的全新篇章。
2025-02-04 11:33:46
57273
原创 深度解析!一文详解大模型性能测试全指标体系、计算逻辑及优化策略
近一周参与第三方大模型性能测试时发现,在对实时性与稳定性要求严苛的应用场景中,模型性能指标已成为评估其优劣的核心标准。这些指标不仅直接影响用户体验,更决定了模型能否胜任复杂业务需求。
2025-06-18 11:35:08
262
原创 一文彻底讲透大模型原理:小白也能吃透的保姆教程!
早期的大模型定义相对比较单一,一般是指具备 较大规模参数的语言类神经网络模型,主要集中在自然语言处理领域,例如 GPT 或者 BERT 这类模型。现在的大模型概念相对于早期则更加的广泛,不单单是 NLP(自然语言处理) 领域,同时也广泛应用于音频处理、图像处理、多模态任务等多个领域。
2025-06-17 11:55:35
720
原创 开源大模型不求人!一文带你全面入门《开源大模型食用指南》
近年来,随着 ChatGPT 的风靡,大语言模型(LLM)成为人工智能领域的焦点。在海量开源模型涌现的今天,如何快速开始体验、部署、调优这些 LLM,成为众多开发者和研究者的核心问题。而Datawhale倾力打造的《开源大模型食用指南》正是为了解决这一痛点而诞生的宝藏项目。
2025-06-17 11:49:12
481
原创 DPO vs. RLHF:大型语言模型对齐的“简化”与“稳健”之争
大模型应用性能的提升不仅在于其预训练,而微调的作用也非常显著。对于多数从事大模型应用领域的团队而言,微调是一个核心的工作之一,为专门任务完善大模型并确保其产出符合我们的预期。
2025-06-17 11:35:39
546
原创 RAG 革新浪潮来袭:一文讲明白所有RAG概念!附带完整RAG实践过程!
检索增强生成(RAG,Retrieval-Augmented Generation) 作为前沿的人工智能技术框架,创造性地融合了大规模语言模型(LLM)与外部知识源检索功能,致力于提升模型在问答与内容生成方面的表现。它通过从外部知识库提取相关信息,为语言模型输出注入更精准、更具深度的上下文信息,使模型响应更贴合实际需求。从技术内核来看,RAG 的本质是 InContext Learning,可简单理解为 “检索技术 + LLM 提示” 的有机结合。
2025-06-16 14:14:19
581
原创 什么是大模型?大模型零基础入门到精通,收藏这篇就够了
在开始了解大模型之前,我们先理解一些基础概念,掌握这些专业名词的概念,以及概念之间的关系,会有利于你后续阅读和学习任何AI和大模型相关的内容,个人花费了挺多时间去梳理他们之间的关系,所以这部分一定要好好阅读;
2025-06-16 13:58:47
708
原创 一文读懂 AI Agents 与 Agentic AI,看这一篇就够了
人工智能(AI)正在改变我们的生活,从智能助手到自动化工作流,AI的潜力似乎无穷无尽。在AI的众多分支中,AI Agent(人工智能代理或AI智能体) 作为基础,已在诸多领域展现潜力。而在此之上,Agentic AI(代理式人工智能)正作为AI Agent的高级演进形态浮出水面,预示着未来智能系统将具备更高的自主性、协作能力和解决复杂问题的潜力。本文将带你了解AI Agent的起源、Agentic AI的突破,以及推动这一领域的关键技术——MCP和A2A协议。
2025-06-15 08:00:00
747
原创 一文弄懂Dify、Coze、n8n、RPA(影刀RPA为代表)、MCP、Make 的详细介绍及其应用场景
最近各种AI相关的技术名词都出现了,很多读者反应学不过来,完全懵逼,于是整理了 Dify、Coze、n8n、RPA(影刀RPA为代表)、MCP、Make 的详细介绍及其应用场景,结合最新技术动态和实际案例:
2025-06-13 13:49:18
746
原创 下载量34w的爆火神书《深入理解深度学习》中英文版pdf及配套代码、ppt分享
《深入理解深度学习》这本书自发布以来,英文电子版下载量已突破34.4万次,实体书则于去年12月面市,共541页。值得注意的是,电子版内容仍在持续更新。作者在网站上提供了68个Python笔记本练习,旨在帮助读者通过编程实践来加深对深度学习的理解。这本书的目标是以清晰易懂的方式介绍深度学习的基本概念,特别适合初学者理解深度学习的基本原理。读者只需具备本科水平的数学知识,就能跟随书中内容深入学习。
2025-06-13 11:58:52
368
原创 【科普】一文带你搞懂LLM(大语言模型)是如何生成文本
你是不是也曾在朋友面前自信满满地说:“AI我可太熟了!”然后随便丢一句“写篇短文”给大模型,坐等它秒出结果?但你有没有想过,那几秒钟里,AI到底干了什么?从你敲下的几个字,到屏幕上蹦出的流畅句子,这背后可不是什么“魔法”。如果你连LLM(大语言模型)如何生成文本都不清楚,还好意思说自己懂AI?别急,今天我就带你拆开这台“写作机器”,用最直白的方式讲清楚每个步骤,看完你再吹牛,至少底气足点!
2025-06-13 11:51:09
774
原创 深度揭秘:企业级 Agent 分布式部署架构全解读!(建议收藏)
在复杂的 IT 基础设施与日益增长的监控需求面前,企业如何通过高效、稳定、可扩展的 Agent 架构完成对各类系统的精细化监控与管理?本文将带你逐步揭开分布式 Agent 部署的技术细节、逻辑架构与应用实战,助你打通从“理解”到“落地”的最后一公里。
2025-06-13 11:48:06
807
原创 一文讲清楚大模型中6个关键词及原理:LLM、Transformer、Bert、预训练、微调FineTuning、机器学习
大语言模型是一类基于深度学习的人工智能模型,它通过对海量文本数据进行训练,学习到语言的结构、语义、语法等知识,从而能够理解和生成自然语言。这类模型通常具有庞大的参数规模,例如 GPT-3 拥有 1750 亿个参数,使得它们能够捕捉到语言中极其复杂的模式和关系。
2025-06-12 12:00:57
1002
原创 2025年智能分析Agent白皮书:智能分析Agent如何驱动企业科学决策(附PDF下载)
《2025年智能分析Agent白皮书》聚焦智能分析Agent,深入探讨其在企业科学决策中的应用。白皮书首先阐释概念与分类,点明其在企业数字化转型中的关键作用。随后解析技术架构,涵盖感知与交互、认知与决策、任务执行、反馈与进化四大核心层,展现其自主感知、分析、决策的能力。
2025-06-12 11:27:40
605
原创 中国AI医疗大模型七强—辅助诊断大模型
今天和大家来聊聊AI医疗领域实力竞技的赛道——辅助诊断大模型。当“AI医生”开始学习海量医学文献、分析复杂病例,并成为顶尖专家“秒懂助手”时,背后依靠的是基于数据和算法驱动的智慧医疗。
2025-06-12 11:14:13
838
原创 2025风口指南:万字长文带你吃透大模型Agent,涵盖应用、场景与发展
2025年,科技领域暗流涌动,一个神秘而又充满潜力的发力点正悄然崛起——Agent!如今,基础模型的能力正以惊人的速度进化,而今年的AI Agent也毫无悬念地成为了热门话题的“宠儿”。更令人瞩目的是,众多最新的学术研究都紧紧围绕着Agent展开,这背后究竟隐藏着怎样的科技密码和发展机遇?
2025-06-12 11:04:31
707
原创 72 个 RAG 实战场景大公开!从医疗到金融,总有一个戳中你的需求(附开源方案)
在大模型时代,RAG(检索增强生成)就像一把万能钥匙,正在解锁 AI 应用的无限可能。2024 年,从 GraphRAG 的知识图谱创新到多模态 RAG 的视觉突破,从医疗场景的精准诊断到企业级知识库的高效构建,RAG 技术正以「七十二变」的姿态渗透到各个领域。本文精心整理72 个真实场景的 RAG 落地案例,涵盖技术原理、开源项目与实战价值,建议收藏!
2025-06-11 11:48:21
677
原创 不再混淆了!一文揭秘MCP Server、Function Call与Agent的核心区别
搞技术的,不搞技术的,每天都会接触一些新词汇。没办法,现在是终身学习的时代,一天不学习就变成石器时代的古人了。作为输出型学习实践者,我把自己学到的内容总结一下,一文搞懂McpServer、FunctionCall、Agent的关系和区别。
2025-06-11 11:43:49
970
原创 2025年AI智能体平台爆发!一文讲清楚AI智能体自动化的七个开源框架
您是否希望 AI 不仅能回答问题,还能独立思考、规划并行动以实现复杂目标?这并非科幻小说情节,在大语言模型(LLM)蓬勃发展的当下,“自动化智能体(Automated Agents)”正成为焦点,重塑我们与人工智能的交互模式
2025-06-10 13:51:19
867
原创 大语言模型并非一切:你还应该了解这 8 种不同的 AI 模型类型
2023年,如果你说“AI”,大多数人想到的都是“ChatGPT”。快进到2025年,局面看起来完全不同了。虽然LLMs(大型语言模型)可能点燃了AI革命,但现在我们正深入一个专用AI模型的时代,每个模型都设计有特定的超能力。
2025-06-10 12:15:22
871
原创 【精选报告】2025年中国教育行业AI应用专题分析报告(文末附PDF下载)
本报告深入分析了2025年中国教育行业AI应用现状、标杆企业案例及未来趋势。报告指出,AIGC技术正推动教育行业智能化发展,个性化教育需求明显,AI应用在教育领域广泛落地,涵盖口语陪练、教学辅助、解题等功能。标杆企业如学而思、希沃、科大讯飞等通过软硬件结合,提升教学效率与质量。未来,AI教育将更注重日常化、个性化、沉浸式体验,并需关注校内教育需求、安全性及教育公平化。
2025-06-10 11:22:49
931
原创 【RAG实战进阶】给你的AI知识库“喂”点好的:Unstructured + 文本清洗实战教程
我之前的项目就像一个有点“偏食”的孩子,它只能处理 .txt 格式的纯文本文档。但在现实世界中,我们的知识往往散落在各种格式的文件里:人手一份的 PDF 报告、工作交接的 Word 文档、项目展示的 PPT,甚至是网页和邮件。
2025-06-10 11:15:52
1081
原创 ML 4大经典名著之一 李航《机器学习方法》pdf,字节AI实验室总监强推
《机器学习方法》这本书由李航博士撰写,他是字节跳动AI实验室的总监。这本书以其全面和系统的内容,成为了机器学习领域的经典之作。虽然它不是为初学者设计的,但对于任何希望在人工智能领域发展或进行科研工作的人来说,都是一本必读的书籍。书中内容精炼,不拖泥带水,从基础原理出发,为读者提供了清晰的理解。
2025-06-09 14:20:35
960
原创 AI 智能体扣子 (Coze) 助力:【口播数字人视频】工作流搭建的喂饭级攻略
近两年AI数字人火遍全网,相信大家或多或少刷到过数字人制作的视频。那能不能用Coze工作流实现一键生成数字人呢?
2025-06-09 13:58:24
1051
原创 【科普篇】LLM、GPT、AIGC、AI Agent、Agentic AI 到底是个啥?
相信很多走在科技前沿的人已经尝试将 AI 融入到自己的生活和工作的方方面面了,比如办公、编码、写作、搜索等都可以通过 AI 工具来提效,可以说一旦体验过 AI 带来的提效,你将再也离不开它,它将成为你工作和生活中的得力助手。
2025-06-09 12:10:15
1242
原创 北京大学讲座:2025年AIAgent与AgenticAI原理与应用报告(221页PPT)
探源与定义- 探源Agent智能的“是什么”与“为什么”: 探析Agent爆发的技术契机与演进脉络;清晰Agent及Agentic AI的核心定义、关键特征及其与传统AI的界限。
2025-06-07 11:37:57
776
原创 Response指南:为什么90%的多模态RAG,一做就会,一用就废?
近年来,像GPT - 4V、Gemini Pro Vision这类多模态大模型迅速崛起。它们具备对图像、文本、音频等多种数据类型进行统一理解的能力,并且将这种能力拓展到了搜索问答、辅助诊疗、法律检索等更为复杂的任务场景当中。
2025-06-07 11:27:44
1049
原创 ChatGPT 为什么越来越“懂你”?一文解析它背后的记忆机制
今年 4 月,OpenAI 对 ChatGPT 的记忆系统进行了重磅升级:它可以参考用户的全部过往对话来提供更个性化的响应。ChatGPT 不再是那个每次都从零开始、记忆如风的“临时陪聊者”,而正在变成一个真正能“记住你是谁、理解你喜好、回忆你曾说过什么”的“长期陪伴者”。
2025-06-07 11:21:40
926
原创 Qwen3 Embedding:基于基础模型的文本嵌入与重排序技术,附技术报告英中PDF对照版
今天阿里通义千问团队开源了Qwen3 Embedding系列模型,并发布了《Qwen3 Embedding: Advancing Text Embedding and Reranking Through Foundation Models》技术报告,介绍了 Qwen3 Embedding 系列模型。该模型在文本嵌入和重排序领域取得了显著进步,为自然语言处理(NLP)和信息检索应用提供了强大的工具。
2025-06-06 11:29:22
962
原创 RAG是什么?一文讲清楚检索增强生成(RAG)!
检索增强生成(Retrieval-Augmented Generation,RAG)是指对大型语言模型输出进行优化,使其能够在生成响应之前引用训练数据来源之外的权威知识库。大型语言模型(LLM)用海量数据进行训练,使用数十亿个参数为回答问题、翻译语言和完成句子等任务生成原始输出。在LLM本就强大的功能基础上,RAG将其扩展为能访问特定领域或组织的内部知识库,所有这些都无需重新训练模型。这是一种经济高效地改进LLM输出的方法,让它在各种情境下都能保持相关性、准确性和实用性。
2025-06-06 11:23:35
887
原创 Dify+Ollama+Qwen3案例实战:10分钟实现AI业务数据查询
Qwen3是阿里巴巴于2025年4月29日发布的新一代开源大模型系列,作为通义千问(Qwen)家族的最新成员,它在性能、架构设计和应用场景上实现了多项突破。以下是核心特点:
2025-06-06 11:12:52
707
原创 【AI Agents实战项目】一文带你入门LangGraph!
LangGraph是一个专门用于构建任意工作流程(Workflow)和智能体(Agent)的基础设施框架。与许多追求简化操作的No-code或Low-code开发框架不同,LangGraph选择了一条更加透明和可控的道路——它不对提示词或架构进行过度的抽象封装,而是直接为开发者提供三项核心优势:
2025-06-06 10:59:19
1009
原创 2025 年 AI Agent + 医疗行业报告 | 附全文下载
《2025 年 AI Agent + 医疗行业报告》系统分析了 AI 智能体在医疗领域的应用现状与发展趋势。报告指出,AI Agent 通过整合医疗数据、结合大语言模型等技术,可优化院内诊疗流程、提升临床决策效率,解决医疗资源分布不均、误诊率高等核心问题。其应用场景贯穿诊前导诊、诊中辅助诊断及医院行政流程管理,例如讯飞医疗的智能导诊系统、深睿医疗的影像分析工具等已在多家三甲医院落地。政策层面,中国已出台多项文件推动 AI 医疗场景标准化,强化基层医疗能力建设。市场数据显示,2025 年 AI 医疗领域资本
2025-06-05 12:05:00
957
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人