- 博客(1160)
- 收藏
- 关注

原创 LLM大模型学习:LLM大模型推理加速
文 Mia / 叶娇娇 推理优化部署、推理加速技术是现在,尤其在大模型时代背景之下,消费级 GPU 和边端设备仍为主流的状况下。推理加速是实际工程落地的首要考虑因素之一,今天笔者来聊聊涉及到的可以实现大模型推理加速的技术。
2024-09-08 09:15:00
2242

原创 必备收藏!大模型高频面试题汇总及答案解析
在原始 PLM (Pre-trained Language Model) 旁边增加一个旁路,做一个降维再升维的操作,来模拟所谓的 intrinsic rank。训练的时候固定 PLM 的参数,只训练降维矩阵A与升维矩阵B。而模型的输入输出维度不变,输出时将BA与PLM的参数叠加。用随机高斯分布初始化A ,用0矩阵初始化B,保证训练的开始此旁路矩阵依然是 0 矩阵。
2024-08-09 10:49:42
1495

原创 传统产品经理VS现在AI产品经理,你要学习的太多了,超详细收藏我这一篇就够了
传统产品经理想要转行成为AI产品经理,需要经历一系列的学习和实践过程。下面是一份详细的学习路线图,旨在帮助你顺利转型。学习路线图了解AI基础知识AI概览:阅读《人工智能:一种现代的方法》这样的书籍,以获得对AI领域的整体理解。在线课程:通过Coursera、edX等平台上的课程,学习AI的基础概念,例如机器学习、深度学习等。掌握核心技能编程基础:熟悉Python编程,这是AI开发中最常用的编程语言之一。数据处理:学习如何使用Pandas、NumPy等工具处理数据。
2024-08-01 11:51:04
1278

原创 AI大模型入门宝典:全面知识点解析,新手必备干货大全!
当我们提及大模型时,通常指的是大语言模型(Large Language Model,简称LLM),即文字问答模型,其典型代表便是OpenAI的GPT系列。然而,随着技术的日新月异,大模型已经不单单局限于自然语言处理(Natural Language Processing)领域的发光发热,而是逐渐渗透到了其他多个领域。
2024-07-13 10:41:51
1860

原创 清华博士带你掌握 Llama 大模型 40 节课助你涨薪 120%
可能大家都想学习AI大模型技术,也想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
2024-06-07 17:48:23
1761
原创 程序员转行大模型应用开发(非常详细),大模型应用开发入门到精通,收藏这一篇就够了!
在AI快速发展的背景下,Java程序员向大模型领域转型具有独特优势。转型路径包括:1)系统学习机器学习基础;2)掌握TensorFlow/PyTorch等框架;3)提升编程优化能力;4)补足数学基础;5)通过项目实践积累经验。Java开发者的工程化思维对模型部署有重要价值。文章还提供了大模型学习资料包,涵盖书籍、报告、视频等资源,助力开发者把握AI时代的职业机遇。(字数:148字)
2025-05-31 17:32:59
680
原创 一个薪资被严重低估的方向...
2025年AI技术爆发性发展正在重塑程序员职业格局:头部科技公司80%技术岗转向AI相关,大模型开发能力成核心要求。传统开发模式被颠覆,掌握大模型应用、微调、RAG等技能成为职场分水岭,AI人才薪资暴涨150%至百万级。行业转型催生七大学习路径:从系统设计到垂直领域训练,涵盖提示词工程、多模态应用等实战技能。现免费提供全套学习资源包(含路线图、商业案例、教程等),助力开发者抢占AI时代先机。
2025-05-31 17:30:04
366
原创 全网最全!大家经常说的大模型,到底什么是大模型,大模型的具体应用,一文说清楚
最近这几年,大模型这词儿可太火了,感觉不管走到哪儿,都能听到有人在讨论。一会儿是这个公司用大模型搞出了新花样,一会儿又是那个研究机构靠着大模型取得了新突破。可到底啥是大模型呢?它又有哪些神奇的应用?今天咱就来好好唠唠,保证让你一看就懂!
2025-05-31 17:28:28
587
原创 AI Agent专题报告:模型层、中间层、应用层深入分析|40页文件下载
西南证券报告节选结合一线开发者经验,系统梳理AI大模型学习路径。内容涵盖七大进阶阶段:从系统设计、提示词工程到平台开发、知识库构建、领域微调及多模态应用。课程特色包括:全栈工程能力培养、企业级项目实战(电商/物流/健康等场景)、主流框架(LangChain)及云平台(阿里PAI)应用。配套提供完整学习资源包:思维导图、100套商业方案、200本专业书籍
2025-05-31 17:27:03
311
原创 多Agent协同开发范式与应用实践
大模型技术正加速渗透至产业核心场景,成为驱动数字化转型的智能引擎。全球机器学习大会(ML-Summit)聚焦大模型技术的创新突破与产业实践,深入探讨其前沿方向与落地路径。作为AI发展的核心驱动力,检索增强生成(RAG)通过动态知识融合技术突破大模型的静态知识边界;智能体(Agent)借助自主决策与多任务协同能力重构人机协作范式;多模态大模型则依托跨模态语义理解技术解锁复杂场景的落地潜力。三者协同演进,不仅攻克了数据时效性、隐私安全与专业适配等关键难题,更在医疗诊断、金融风控、智能制造等领域催生从效率革新到业
2025-05-31 17:25:13
639
原创 Transformer模型结构详解及代码实现!
Transformer模型发展史:2017年Google提出基于Self-Attention的Transformer架构,开创了自然语言处理的新范式。核心结构包含Encoder和Decoder两部分,通过Multi-Head Attention和Position-wise FeedForward网络实现序列建模。2018年相继诞生GPT(解码器架构)和BERT(编码器架构)两大分支,2019年出现GPT-2、DistilBERT等优化版本。2020年GPT-3展现出强大的零样本学习能力。Transforme
2025-05-31 17:22:45
677
原创 DeepSeek大模型构建智能化矩阵,全面赋能业务发展白皮书”
当前,银行业正面临数字化转型的关键阶段,传统业务模式在效率、成本、客户体验等方面逐渐显现瓶颈。随着人工智能技术的快速发展,大模型在自然语言处理、智能决策、自动化流程等领域的应用潜力日益凸显。然而,银行在引入大模型技术时普遍面临三大挑战:一是技术碎片化导致模型能力无法协同,二是业务场景与模型能力的匹配度不足,三是缺乏规模化落地的工程化路径。某银行2023年内部评估显示,全行已有17个独立AI项目采用不同技术栈开发,重复建设率达40%,模型复用率不足15%,造成年均约2300万元的资源浪费。
2025-05-30 21:30:40
798
原创 【大模型入门必看】AI大模型知识点大梳理:一篇文章带你全面掌握核心概念与技术!
AI大模型是包含数十亿至数万亿参数的深度学习模型,在自然语言处理、计算机视觉等领域取得突破性进展。从ChatGPT、GPT-4到国内文心一言、MOSS等,各大科技公司相继推出大模型产品。其工作原理基于神经网络训练,通过数据预处理、模型构建等步骤实现智能预测。大模型提升了任务准确性,但也面临计算资源消耗大、数据隐私等挑战。AI大模型将深刻影响经济、就业和社会结构,个人应主动拥抱技术变革。本文还提供了AI大模型的学习路线图和免费资源,助力开发者快速掌握相关技能。
2025-05-30 13:44:44
1229
原创 人工智能助力传统制造业升级:路径、挑战与建议全面解析!
传统制造业是我国现代化产业体系的关键基底,传统制造业转型升级的路径选择已成为推进新型工业化过程中需要解决的关键问题,而人工智能是当前引领产业变革的重要变量。因此,探究人工智能赋能传统制造业升级的路径,能够为提升产业竞争力和高质量发展提供有益参考。
2025-05-30 13:41:35
859
原创 企业级智能体应用构建指南:两天AI智能体构建工作坊的实践与感悟!
IBM在上海举办"AI智能体构建工作坊",基于watsonx平台展示了企业级智能体应用构建方案。2025年智能体AI元年,88%企业已开始探索应用,但面临合规性等挑战。IBM推出watsonx Orchestrate(业务部门)和watsonx.ai(IT部门)双平台,提供从预构建智能体到模型训练的完整解决方案。案例展示了采购智能体的多智能体协同工作流程,整合了业务数据分析和自动化决策能力。
2025-05-30 13:38:12
871
原创 【大模型入门】DeepSeek应用场景全览:探索AI技术的多元化应用与未来潜力!
本地化部署deepseek数据模型,建立企业数据、服务数据、需求数据大模型,将现有项目企业及员工数据进行收集、分类、清晰、核对无误后录入deepseek模型中,可实现上述功能。
2025-05-30 13:35:12
614
原创 【保姆级教程】大模型入门,超详细,收藏这一篇就够了!
大模型入门基础与科学家路径本文介绍了学习大型语言模型(LLM)的基础知识和科学家路径。基础部分涵盖机器学习的数学基础(线性代数、微积分、概率统计)、Python编程与数据科学库(NumPy、Pandas)、神经网络(结构、训练、优化)以及自然语言处理(文本预处理、词嵌入、RNN)。科学家路径则涉及Transformer架构、预训练技术(BERT、GPT)、微调方法(LoRA)和评估指标(BLEU、ROUGE)。通过系统学习这些知识,可以逐步掌握大模型的核心原理与应用方法。
2025-05-29 15:43:29
988
原创 AI大模型微调产品经理面试全攻略:详细解读,一篇就够,赶紧收藏!
AI大模型微调产品经理面试指南:技术理解:微调是在预训练模型基础上针对特定任务的优化,如GPT用于智能客服,ResNet用于图像识别关键考量:数据集质量、模型选择、超参数调整、正则化策略及评估指标设定项目经验:以智能客服项目为例,展示需求分析、数据准备、模型优化到产品落地的全流程管理能力数据质量保障:通过数据清洗、专业标注和持续验证确保训练效果
2025-05-29 15:37:10
477
原创 【大模型入门教程】DeepSeek-R1升级全球瞩目:国产最强推理模型,单挑Claude 4,实力对决!
DeepSeek深夜开源升级版R1-0528模型,代码能力惊艳AI圈。该模型在LiveCodeBench榜单跃居第四,超越Gemini2.5Flash,实现"一次生成即完美"的代码输出质量,前端表现优于Claude4Sonnet。其独特的30-60分钟长时思考能力,能精准处理复杂推理题。虽然学术严谨性略逊于Claude4和Gemini2.5Pro,但作为免费开源模型,R1-0528展现了国产AI的突破性进展。开发者社区已掀起测试热潮,而即将发布的R2版本更令人期待。
2025-05-29 15:32:17
771
原创 【AI大模型】Nature子刊重磅:医学AI多模态融合亚型框架,放射、病理、基因组学数据完美融合!
本研究通过整合122例IDH野生型胶质瘤患者的多模态数据(MRI、病理、基因组、转录组和蛋白质组),开发了多模态融合亚型(MOFS)框架,识别出三种具有显著生物学和临床差异的亚型:预后较好的神经前体型(MOFS1)、预后最差的增殖型(MOFS2)以及对免疫治疗敏感的肿瘤微环境富集型(MOFS3)。研究创新性地结合11种算法进行数据融合,发现STRAP可作为MOFS2的预后标志物,并开发了基于MRI的深度神经网络分类器实现无创亚型预测。该成果为胶质瘤精准治疗提供了新思路,相关数据和代码已公开共享。
2025-05-29 15:27:48
576
原创 【大模型入门】2025年代理型AI智能体终极指南:100+企业生成式AI用例,46页PDF文件分享!
【AI大模型学习指南】由互联网资深专家整理的免费学习资源,包含7个阶段系统课程:从模型设计到行业应用开发。内容包括思维导图、视频教程、实战案例等,涵盖Prompt工程、微调开发、多模态应用等核心技能。学成后可掌握大模型全栈开发能力,解决企业实际需求。
2025-05-29 15:23:01
399
原创 36岁程序员亲述:如何用3个月攻克大模型,实现职业二次突围 | 万字转型指南
"各位,经董事会决定,公司未来三年的技术战略将全面转向AI大模型领域......"2023年Q4的某天下午,在西二旗某科技园会议室里,CTO的这句话让在场的30多位老工程师集体陷入沉默。作为在Java后端领域深耕12年的技术主管,我看着自己工位上的《Effective Java》和写满SpringCloud笔记的记事本,突然意识到:那个我们曾经熟悉的互联网技术栈,正在以肉眼可见的速度被大模型重构。
2025-05-28 14:58:55
1059
原创 2025年工业运营前沿技术白皮书:AI智能体(AI Agents)的崛起|附26页文件下载,深度解析!
【AI大模型时代:机遇与学习路径】报告显示大模型技术催生高薪岗位,2025年相关岗位缺口达47万,初级工程师平均月薪28K。报告提出四阶段学习方案:10天掌握基础应用、30天进阶开发、30天模型训练、20天商业落地,90天可实现从零基础到项目实战。包含提示词工程、RAG系统开发等核心技能,并提供大厂案例库、提示词模板等学习资源。报告强调掌握AI工具将获得34%薪资溢价,指出"AI取代的不是人类,而是不会用AI的人"。完整26页报告可免费获取。
2025-05-28 14:56:32
587
原创 李飞飞谈AI未来:当机器智能超越人类,我们将何去何从?
李飞飞博士最近接受PBS采访时间时,从技术、伦理、政策、教育等多维度重申了自己对AI发展的全方位思考。
2025-05-28 14:54:41
668
原创 【大模型面经】大模型面试经验总结:一篇文章足够,非常详细收藏这一篇就够!
大模型面试全攻略:从入门到Offer随着大模型技术爆发,相关岗位需求激增,成为高薪热门选择。本文系统梳理大模型面试全流程:1️⃣ 面试流程:简历筛选→HR初面→技术面→综合面→Offer,技术面为核心环节2️⃣ 技术准备:基础:深度学习/机器学习理论、数学基础、Python编程重点:Transformer架构、自注意力机制、模型优化技巧实战:项目经验梳理、LeetCode算法题(含大模型相关题型)3️⃣ 行为面试:通过STAR法则展现沟通与协作能力,提前准备"Why us"等高频问题4️
2025-05-28 14:39:53
677
原创 AI发展中的就业机遇:这一职业爆火,如何抓住?非常详细收藏这一篇就够!
人工智能人才需求激增,数据标注岗位招聘量同比增超50%,AI训练师月薪达6000-19000元,专业培训供不应求。医疗等垂类大模型需专家参与标注验证,AI人才缺口持续扩大,预计2030年达400万。高校加速AI专业建设,专家建议加强基础研究和应用复合型人才培养。同时,掌握AI工具的从业者薪资溢价显著,行业呼吁加强全民AI技能培训。
2025-05-28 14:36:25
523
原创 面试官问:说一下有哪些 RAG 流程优化策略?
本文探讨了提升检索增强生成(RAG)系统性能的关键策略。在文档分割模块,分析了chunk_size选择的重要性,并提出父文档检索、句子窗口检索等优化技术;在检索模块,介绍了查询重写、混合搜索等方法;还讨论了嵌入模型微调、检索后优化等重要环节。同时,文章指出大模型人才需求激增,并提供了系统化的大模型学习路径:从提示词工程、RAG系统开发到模型训练和商业应用,帮助学习者掌握大模型核心技术。完整学习资料涵盖案例库、模板库等实用资源,适合不同基础的学习者分阶段提升AI能力。
2025-05-28 14:30:10
994
原创 2025年人工智能与能源悖论:平衡挑战与机遇的白皮书|附27页PDF文件下载,深度解析!
人工智能应用正快速发展,73%的企业已将AI应用于业务场景,带来生产力提升和收入增长。AI数据中心电力需求预计年均增长50%,但对全球电力影响仍较小。同时,大模型人才缺口达47万,初级工程师平均薪资28K。报告提出了90天AI学习路径:从提示词工程到模型训练,再到商业应用部署,帮助从业者掌握核心技能。掌握AI工具可提升47%生产效率并获得34%薪资溢价,凸显AI技能的重要性。
2025-05-28 14:28:20
706
原创 2025多模态好发论文的方向!
多模态AI研究正迎来爆发式发展,本文系统梳理了7大前沿方向:多模态大模型、预训练、生成、感知、推理、高效学习和可解释性,并针对每个方向精选了代表性论文与源码资源。同时指出大模型人才市场缺口达47万,初级工程师平均薪资28K,建议通过4阶段90天的系统学习路径(提示词工程→RAG系统→智能体开发→模型训练)快速掌握核心技能。资料包含大厂落地案例、提示词模板库等实战资源,帮助学习者高效进入AI领域。
2025-05-28 14:25:51
664
原创 4大类AI Agent协议框架全面综述
本文系统性地概述了LLM AI Agent通信协议,将其分为上下文导向型(获取外部信息)和代理间通信型(多代理协作)两大类,并进一步细分为通用型和特定领域型。协议的优势包括提升互操作性、标准化交互、增强安全性和降低开发复杂度。通过旅行规划案例,对比了MCP(工具调用)、A2A(企业内协作)、ANP(跨组织协议)和Agora(自然语言转协议)四种协议的应用场景及工作流程。此外,文章指出大模型技术催生高薪岗位(如AI优化岗),并分阶段介绍了从提示工程到模型训练、商业落地的学习路径,强调掌握AI工具对职业竞争力的
2025-05-28 14:23:32
717
原创 AI产品经理学习路线:从零基础到精通,AI产品经理是2025IT职业的新风口!
AI产品经理与传统产品经理的核心差异在于技术驱动思维,需掌握数据+算法能力。文章从三方面展开:1)对比二者异同,AI产品分为toB/toC/硬件三类,重点不同;2)必备技能强调对AI场景、算法效果及数据的理解;3)成长路径建议从应用场景切入,参与数据标注等全流程,掌握评价指标。随着AI技术发展,产品经理需建立技术认知体系,以数据为核心驱动产品设计。
2025-05-27 19:00:53
1155
原创 2025年AI产品经理热潮:零基础转行指南,迈向年薪60万的新职业之路
"985硕士不如培训班出身的AI新人!"北京某大厂HR李敏无奈摇头。2025春招现场,手握大厂offer的竟是28岁转行做AI产品经理的前客服专员,而传统产品经理简历堆积成山无人问津——这场面,正在全国上演。
2025-05-27 18:58:48
911
原创 一口气讲明白大模型:大模型入门,基本概念、技术发展史和业界应用
本文系统介绍了大模型的技术发展和应用现状。首先定义大模型为参数量庞大的机器学习模型,具备处理复杂任务的能力,并分类为语言、图片、音频和视频四类。重点梳理了大语言模型(LLM)从规则驱动(ELIZA)、统计学习(n-gram)到深度学习(GPT系列)的三阶段技术演进历程,详细解析了RNN、LSTM、Transformer等关键技术。最后展示了当前大模型在电商推荐、金融分析、出版审校等领域的实际应用案例,并附赠价值2万元的AI大模型学习资料包,包括学习路线、视频教程和技术文档等资源。文章为大模型初学者提供了完整
2025-05-27 18:56:01
577
原创 高考即将来临!AI监考真的能防作弊?
AI监考的底层逻辑与应用现状三组最新数据,看优点也看盲点常见质疑:误报、隐私、心理压力“三步可落地”行动清单工具/平台推荐与未来展望
2025-05-27 18:53:59
771
原创 中小企业AI应用构建指南:快速上手,实现智能化转型!
AI时代飞速发展,大模型和AI的应用创新不断涌现,面对百花齐放的AI模型,阿里云计算平台大数据AI解决方案总监魏博文分享如何通过阿里云提供的大数据AI一体化平台,解决企业开发难、部署繁、成本高等一系列问题,让中小企业快速搭建AI应用。
2025-05-27 18:51:31
749
原创 详细介绍!RAG 和 GraphRAG:了解何时(When)、如何(How)使用它们
本文对比了传统RAG(检索增强生成)与GraphRAG技术。传统RAG通过向量搜索实现语义检索,但无法捕获数据间关系;GraphRAG利用知识图谱构建实体关系网络,支持多级摘要和社区发现,能提供更深入的上下文理解。文章详细介绍了微软GraphRAG的两阶段实现(实体提取+图谱构建)和三种检索策略(全局/局部/漂移搜索),并通过合同案例展示了技术优势。同时指出GraphRAG存在实时性维护困难等问题,建议根据数据类型选择合适方案或采用混合模式。文章最后还分享了大模型学习资源,包含技术路线、视频教程及行业应用案
2025-05-27 18:48:42
834
原创 走向具身智能:从具身智能大脑展望人形机器人发展|附37页PDF文件下载
本文分享一套完整的大模型学习资源包,包含七大阶段的学习路线图(从系统设计到行业应用)、300多集配套视频教程、数百本技术文档和行业报告,以及LLM面试题合集。该资源适合AI产品经理及开发者系统学习大模型技术,掌握从提示词工程到垂直领域模型训练的全栈技能,并能实际应用于电商、物流、健康等领域。所有资料均可免费获取,帮助学习者提升大模型开发能力和就业竞争力。
2025-05-27 18:46:52
222
原创 IT行业最后的风口就在大模型!五大热门岗位推荐,程序员如何转行大模型?非常详细收藏这一篇就够!
本文介绍了大模型领域三大热门岗位:模型研发工程师负责设计创新模型架构,需掌握深度学习框架和数学基础;算法工程师致力于算法实现与业务结合,需精通机器学习与数据分析;数据科学家运用大模型处理复杂数据问题,需具备统计学和编程能力。各岗位针对不同技术专长,适合对算法设计、业务落地或数据分析感兴趣的程序员转型发展。
2025-05-26 18:49:41
1336
原创 这可能是你见过的最全大模型完整学习路线,从理论到实践,非常详细建议收藏!
大模型学习指南摘要大模型是人工智能领域的核心突破,指具有海量参数(如GPT-3)的预训练模型,通过吸收多模态数据实现语言理解、生成等复杂任务。学习大模型的意义包括:技术前沿:掌握AI领域最新趋势;职业优势:提升就业竞争力,拓展创新应用能力;跨领域价值:推动科研、医疗、教育等行业的智能化发展。应用场景涵盖自然语言处理(自动写作、翻译)、图像识别、数据分析等,正深刻改变社会生活。学习大模型既是技术升级,也是参与未来变革的关键路径。(149字)
2025-05-26 18:47:44
845
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人