程序员一粟-CSDN博客

原创 VSCode AI 编程必装！五款DeepSeek集成插件，每款都让开发效率飙升

前面介绍的5款AI插件都是优秀的产品，各有优势。这些插件与DeepSeek R1模型搭配使用，会使其更加强大。如果你想体验类似于Copilot的丰富代码辅助功能，推荐使用Continue或CodeGPT；如果想快速开发脚本和应用程序，Cline或Roo Code会更合适；如果你对大模型开发感兴趣，AI Toolkit是最佳选择。想体验类似于Copilot的丰富代码辅助功能，推荐使用Continue或CodeGPT；如果想快速开发脚本和应用程序，Cline或Roo Code会更合适；

2025-07-04 19:58:59 517

原创一文详解Character AI：实用指南+ ChatGPT、Gemini对比分析

Character AI是一个基于网络的平台，用户能够在此与人工智能生成的各类角色进行互动，这些角色涵盖虚构形象以及运动员、作家、历史名人等公众人物。每个角色均具备独特的个性特点与语言风格，从而实现模拟特定人物特征的对话交流。与ChatGPT或Gemini等通用型聊天机器人不同，Character AI以基于角色的对话为核心进行架构设计。这种设计模式使得用户能够参与角色扮演、故事创作、问答互动或日常闲聊等多样化场景，且对话内容通常会依据所选角色的个性特点进行定制。

2025-07-04 19:58:16 821

原创 LoRA微调

本征维度的概念在由【论文1】提出。对于一个给定的数据集，先设计网络的结构和选择对应的loss对网络中的参数进行随机的初始化训练网络使得loss越来越低而训练阶段可以认为是在一个固定的目标图（objective landscape）上，寻找出有效的路径。这里解释一下为什么是固定的目标图。因为在数据集和网络结构固定下来后，待优化的问题就已经定义好了，所以目标图也就是确定的了。如下图所示：也就是说可以在训练网络时只更新d维参数，就可以达到该网络应有的效果。那么这个d就是所谓的该模型的本征维度。

2025-07-04 19:57:24 891

原创李飞飞最新访谈：没有空间智能，AGI就不完整

这是“AI教母”李飞飞在最新访谈中对AGI的判断——是的，李飞飞也开始谈论AGI了。。而这，离不开。图片正如她本人所说：我整个职业生涯都在追逐那些极其困难、近乎疯狂的问题。李飞飞如今聚焦于空间智能领域——这个人工智能最艰难的领域之一。她认为对于实现AGI至关重要，并表示：理解三维世界、生成三维世界、推理三维世界、在三维世界中做事，是人工智能的基本问题。她的目标是创建一个超越平面像素、跨越语言障碍、能够真正捕捉三维世界结构和空间智能的。

2025-07-03 18:46:40 1008

原创 AI 人才争夺战：大厂纷纷挖角顶尖 AI 工程师，人才缺口达 400 万

AI 人才争夺战已经全面打响，这场战争不仅关乎企业的生死存亡，更关乎整个行业的发展前景。面对 400 万的人才缺口，企业和政府必须携手合作，共同应对这一挑战。只有这样，才能在 AI 时代立于不败之地，推动科技的进步和社会的发展。

2025-07-03 18:45:37 962

原创 “AI人才荒”来袭！中国急需600万AI高手，缺口竟达400万？

在数字化浪潮席卷全球的当下，人工智能（AI）技术正以前所未有的速度改变着各行各业的发展格局。从智能制造到智慧医疗，从金融科技到自动驾驶，AI的应用场景不断拓展，对专业人才的需求也日益增长。据麦肯锡最新报告显示，到2030年，中国对AI专业人才的需求预计将达到600万，而人才缺口可能高达400万。这一数据不仅凸显了中国AI人才市场的紧迫性，也预示着未来AI产业发展的巨大潜力与挑战。人才缺口现状分析目前，中国AI人才缺口主要体现在以下几个方面：AI领域涉及计算机科学、数学、统计学、神经科学等多个学科的交叉融合，

2025-07-03 18:44:32 981

原创大模型结合python 大模型结合chatbot

AWS上申请带GPU的instance，例如g4dn系列，申请instance后安装CUDA的driver，driver安装完成后，就可以在带gpu的instance上部署开源的大模型了。这里为了能在ChatBot上调用本地模型，使用FastChat进行部署，且启动了大模型的API接口。安装driver后，启动api接口和启动模型的命令如下所示。

2025-07-02 21:04:39 930

原创 ai 大模型 python ai 大模型构建

超前意识：关于人工智能 + 我常和身边的伙伴们说，我们这一代的软件人是非常幸运的，赶上了前所未有的机遇。备案前的准备和注意事项一、选择备案服务商（这里只介绍这两个）　　1. 百度云：　　　　- 可以不用扫法人的脸，只需要找个网站负责人扫脸即可　　2. 阿里云：　　　　- 必须要法人扫脸二、资料准备　百度云备案：　　　　- 准备资金：一个域名约50元，准备5个，一个服务备案号84元，大概274元　　　　　　购买域名和服务器（最便宜的约84元），每个服务器提供5个服务备案号，备案每个域名。

2025-07-02 21:03:45 803

原创 NLP大模型 cv大模型

步骤描述1数据准备，包括数据清洗和格式化2选择合适的模型架构3模型训练4模型评估5部署模型6应用模型。

2025-07-02 21:02:50 1002

原创第三九课：HarmonyOS Next的AI与机器学习实践指南：从功能集成到模型部署

这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。截至目前大模型已经超过200个，在大模型纵横的时代，不仅大模型技术越来越卷，就连大模型相关的岗位和面试也开始越来越卷了。今天贴心为大家准备好了一系列AI大模型资源，包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。大模型时代，企业对人才的需求变了，AIGC相关岗位人才难求，薪资持续走高，AI运营薪资平均值约。NPU加速指令集优化。

2025-07-02 21:01:29 518

原创 HarmonyOS Next模型量化技术与实践

本文旨在深入探讨华为鸿蒙HarmonyOS Next系统（截止目前API12）中的模型量化技术，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。

2025-07-02 21:00:01 730

原创大模型自回归模型

通过双向文本预训练模式，以BERT为代表的基于自编码（autoencoding）的预训练模型在各类任务上表现突出，超越了传统的单向训练的自回归（autoregressive）语言模型。但由于使用mask进行训练，输入与下游任务的fine-tunning不一致，这种不一致使得BERT在生成类任务上相对较弱。综合考虑自编码（autoencoding）模型BERT与自回归（autoregressive）模型transformer-XL的优缺点，作者提出了XLNet。

2025-07-02 20:58:46 913

原创失控到掌控：转型AI产品经理，找回丢失的方向盘

传统软件产品的需求都可以转化为清晰的规则，用户行为会被限制在固定规则内。而AI产品更像一个气象预报员，它基于海量历史数据告诉你“明天有90%的概率下雨”。其行为是“概率性”的，由数据中学习到的模式所决定。以智能招聘为例，业务诉求是提升人岗匹配度传统产品经理：“在现有的支持检索匹配字段基础上，增加院校类型、沟通能力、行业等结构化字段，支持单独和组合检索。” 这是一个非黑即白的功能。AI产品经理：“支持利用大模型识别招聘需求中的关键信息，实现关键信息的向量化存储，与数据库中简历的关键信息匹配。

2025-07-01 21:01:53 825

原创什么是AI产品经理？2025年,成为AI产品经理才是唯一出路吗?

AI产品经理是负责规划、设计和优化以AI技术为核心驱动的产品的管理者。*理解AI技术边界*：熟悉机器学习、深度学习、自然语言处理（NLP）、计算机视觉等技术的基本原理，能评估技术实现的可行性。*定义AI产品价值*：明确AI如何解决用户痛点或创造新体验（如个性化推荐、自动化决策、智能交互等）。*跨职能协作*：与数据科学家、工程师、业务团队紧密合作，确保技术开发与产品目标一致。

2025-07-01 21:00:55 703

原创大模型入门什么是大模型（一）大模型的由来、大模型的特性、大模型的技术、大模型的应用

在人工智能(artificial intelligence, AI)的宏伟画卷上，大模型如同绚烂的星辰，照亮了技术的未来，不仅重塑了人们对技术的认知，更在无数行业中悄然引发变革。然而，这些智能技术并非完美，也存在风险和挑战。在此，我们将揭开大模型的神秘面纱，分享其技术与特点，剖析其发展与挑战，一窥AI时代的风采。大模型例如(generative pre-trained transformer, GPT)系列在。

2025-07-01 20:58:26 833

原创 Python 性能这么差，为什么会在 AI 中大量使用？

主要有两方面的原因：第一，是Python语言本身的天赋，简单易学易入门，有大量第三方库，满足全栈需求，因此Python是大量非科班程序员编程语言的首选。第二，Jupyter Notebook，这个也是我认为最重要的影响因素。Jupyter Notebook是什么？Jupyter Notebook是一个把软件代码、计算输出、解释文档、多媒体资源整合在一起的多功能科学运算平台。在教育界和工业届均有巨大的影响力：目前北美许多顶尖的计算机课程，完全使用Jupyter Notebook作为工具；

2025-06-30 16:44:42 1032

原创不得不说 AI + Python就是最牛的！

说到 Python ，你的第一反应是什么？是其简洁的语法和强大的特性、还是丰富的库和框架。从 2 月初最新公布的 TIOBE 编程语言排行榜可以看出，Python 的受欢迎程度依旧遥遥领先。▲Python稳居编程语言排行榜首位数据来源 TIOBE从长远来看，自 2018 年起，Python 语言的发展势头就逐渐强劲，呈现出指数级的增长。可以说，人工智能的兴起是推动这一趋势的关键因素。

2025-06-30 16:43:19 236

原创这绝对是被严重低估的自动化+智能体工具！

大家好，我是一粟。前段时间 n8n 这个海外的 AI Agent 自动化工具真的太火了，身边搞智能体的朋友几乎都在聊它。刚好，我有一个困扰了我很久的问题：我每天都需要花费大量的时间去浏览各大海外的网站，并从中筛选和阅读收集最新的 AI 新闻资讯。这个过程真的是非常的耗费时间的，且效率十分的低下。那有没有一个平台或者工具能满足我的这个需求呢？最开始我使用的是国内的扣子。但当时它最大的问题就是，没办法访问到国外的一些新闻资讯，然后这个需求就不了了之了。

2025-06-30 16:41:42 761

原创公务员考试-言语表达之选词填空技巧_言语题两个空的选词填空

两个角度：从语境分析；在选项中对比语境分析：找关联，如转折（但是、却、然而，语义要相反）合理假设，小心求证：找搭配（主谓宾：填入的词要搭配哪个，找主体）、找解释，找关联找解释：观点-例子形，那么例子一定是服务于观点注意前后的语句关系（并列（AAA、ABC）、转折，递进：前后的程度不一样）公务员考试言语表达中的选词填空题型，从不同角度可以有以下分类：做公务员考试言语表达选词填空题，可从词语、语境、方法等维度运用以下技巧：以下是一些公务员考试言语表达选词填空题的真题：我只不过是替他_____了几句，说明了事实的

2025-06-27 22:42:57 900

原创深圳首批“AI公务员”上岗；韩国禁止新用户下载DeepSeek；Windows 11最新补丁问题频发极客头条_月之暗面深圳

他表示，长上下文主要做的是长文本输入，有Prefill预填充，有Mooncake加持，成本速度可控，而长思维链是长文本输出，成本高很多，速度也要慢很多。百度方面表示，预计 18 日 0 时将上线，用户可在百度 PC 端首页点击「AI+」进入 AI 搜索，开启框下方「深度思考 R1」按钮即可切换至 DeepSeek R1 模型此外，用户还可在百度 App 输入任意搜索词，完成一轮搜索后，在搜索结果页点击「AI+」进入 AI 搜索，点击下方「去试试“DeepSeek R1”」即可与 DeepSeek 对话。

2025-06-27 22:42:23 783

原创 AI医生也开始“疯狂内卷”起来了？未来医生要失业了吗？

在近年来医疗行业的数字化变革浪潮中，人工智能（AI）技术的迅速发展正成为不可忽视的力量。就在今年9月5日，支付宝在“2024 Inclusion·外滩大会”上重磅发布了“AI健康管家”，这并不是一个传统的医疗智能体，而是一个覆盖诊前、诊中、诊后全流程的智能平台，旨在为患者提供从找医生、陪诊到医保支付等一站式服务。支付宝数字医疗健康事业部总经理张俊杰表示，“AI健康管家”的核心在于整合和升级支付宝的“互联网+医疗健康”布局，再次彰显了互联网大佬们进军医疗界的决心。事实上，从2。

2025-06-26 22:00:53 814

原创人工智能医生会替代人类医生吗？清华即将上线AI医院，首批42位AI医生_清华ai-mdt系统

大家好，我是一粟，今天咱们聊聊新鲜事儿——清华AI医院！你没听错，就是那个学霸云集的清华大学，他们最近搞了个大新闻，上线了一个名为。这个医院可不一般，它是个虚拟的医疗世界，里面住着50万个AI患者，。听起来是不是有点像科幻小说里的情节？但这可是真的！“紫荆AI医生”系统目前正在进行内部测试，**预计在2025年上半年正式向社会大众开放使用。**这个系统的上线标志着人工智能在医疗领域的应用迈出了重要的一步，预示着未来可能实现全自动化医院的可能性。

2025-06-26 22:00:12 734

原创端到端感知决策大模型能够真正实现无人驾驶？深度详解大模型与自动驾驶发展路径_端到端大模型

大模型又被称为基础模型（foudation model），是指具有大规模参数、使用海量数据训练的大型神经网络模型。之所以被称为foundation model，是因为它们可以作为许多下游任务的起点，通过微调来适应特定的应用。简单的说，可以将大模型理解为一个基础，通过不同的训练数据，可以应用于不同的场景。现有大模型多以Transformer架构为基础，采用预训练+微调技术进行参数学习，使之适配不同领域的具体任务，经剪枝压缩后完成最终部署。预训练：是指在大规模没有标注的数据集上进行无监督或自监督的学习。

2025-06-26 21:58:59 887

原创 2025年，AI大模型在企业场景走到哪了？

企业部署人工智能（AI）已从试验性项目转变为战略性行动。AI 预算逐渐常态化，模型选择日益多元化，采购流程也实现了标准化，AI 应用正系统性地落地实施。尽管产业需求和企业需求呈现出碎片化特征，但这种碎片化正是企业积极拥抱的方向。一些关键厂商正在脱颖而出，企业也越来越多地选择成品应用来加速落地。AI 市场的形态正逐渐接近传统软件，但其变化节奏和复杂性却与传统软件完全不同，这是 AI 独有的发展节奏。2025年，AI大模型在企业场景的落地走到哪了？在过去一年中，AI在企业中的地位发生了根本性的转变。

2025-06-25 19:15:26 747

原创企业级AI大模型平台落地解决方案！2025

大模型平台作为推动大模型规模化落地的有力支撑，基于技术门槛低、模型可共享、应用适配易等特点，对推动企业智能化转型、提升业务效率与竞争力具有重要意义。本章首先总结大模型平台建设落地的原则，在此基础上深入剖析落地步骤，并梳理归纳大模型平台通用落地框架。大模型平台落地是指企业通过建设模型开发层、模型服务层、应用开发层，将 AI 模型及其相关能力打包成可重复使用的服务，使企业能够快速高效地构建、部署、监控、调用模型。

2025-06-25 19:14:52 623

原创利用大模型提高工作效率的两个小例子

提到大模型的价值，一般都有提高工作效率，增加客户满意度，加快创新等说法。这两天学习政策法规时，用大模型处理了两个小场景，对提高效率一说有了切实的体验。一个是生成脑图，一个是从图片格式的表格生成excel表格，两个都比较实用。生成《关于加快公共数据资源开发利用的意见》的脑图，直接把政策法规的网址给到Kimi，再给个简单直接的指令：https://mp.weixin.qq.com/s/FKq2nOmzeFpukGGPNnsztg，请根据意见，生成左右结构的脑图。

2025-06-23 20:08:20 1150

原创如何用大语言模型提高工作效率

我不会经常这样做，但有时当我真的卡在bug上时，我会将整个文件或多个文件附加到Copilot聊天中，粘贴错误消息，然后直接问“你能帮忙吗？我不这样做是因为我认为我目前比目前的人工智能模型更擅长bug查找。几乎所有时候，Copilot（或者Claude，对于一些个人项目）都会感到困惑。但如果我真的卡住了，尝试一下还是值得的，以防万一，因为它非常省力。我记得有两三次我只是错过了一些细微的行为，而LLM抓住了，这为我节省了很多时间。因为LLM在这方面还不太擅长，所以我不会花很多时间迭代或试图让LLM摆脱困境。

2025-06-23 20:07:40 895

原创普通人如何使用大模型提高工作效率？（附DeepSeek使用攻略）

根据受众（如某一领域的专家、初学者或青少年等）量身定制LLM的回复，以确保其在特定环境中恰到好处且易于理解。

2025-06-23 20:07:02 862

原创从零炼模型太慢？试试这一招，一晚上搞定大模型微调

训练一个大语言模型从零开始？那简直是“开天辟地”级别的工作，不但费电、费钱，还容易效果拉垮。幸运的是，我们完全可以站在“巨人”的肩膀上，通过微调（Fine-tuning）技术，快速让一个大模型“学会”我们想要它干的事，比如写情书、聊电影、答客户、做医疗问诊等等。这篇文章就带你从最初的传统训练方法聊起，一步步进入深度学习，再到预训练-微调范式的“降维打击”方式，并结合具体的代码配置和实践，告诉你怎么把一个通用大模型变成你专属的“AI小助手”。

2025-06-23 20:06:29 620

原创 AI大模型学习必备：必逛的十大顶级网站推荐，非常详细，值得收藏！_大模型网站

学习AI大模型不仅需要理论知识的积累，还需要通过实践来加深理解。上述十大网站提供了丰富的学习资源和社区支持，能够帮助你在AI大模型的学习之路上走得更远。希望你能充分利用这些资源，提升自己的技能，推动人工智能领域的发展。

2025-06-23 20:03:48 902

原创大模型——MCP快速入门实现

MCP 是一个开放协议，它为应用程序向 LLM 提供上下文的方式进行了标准化。你可以将 MCP 想象成 AI 应用程序的 USB-C 接口。就像 USB-C 为设备连接各种外设和配件提供了标准化的方式一样，MCP 为 AI 模型连接各种数据源和工具提供了标准化的接口。•Hosts是 LLM 应用（如 Claude Desktop 或 IDEs），它们发起连接•Clients在 host 应用中与 servers 保持 1:1 的连接•Servers。

2025-06-23 19:59:22 992

原创做AI产品经理最难的点：召回测试与提示词配置

现在要问做AI产品最难的点是什么，那就是如何在产品设计中引导用户避免生产AI幻觉，并且提升识别准确率以及答案准确率，因为现在任何模型都是有不准的情况。幻觉导致在生产力场景上，无法覆盖，产品经理难以做变现收益，这也是为什么现在几乎AI模型厂商都是在亏钱的本质原因，因为付费的用户还是非常少一部分，并且订阅成本还cover不了成本。反观是涉及到不需要那么细致的情况下，这部分是AI产品可以做收益的，比如你看在娱乐领域的视频、音乐、以及游戏上，AI能力成了很多供应商的必备，很多人就会花钱去采购。

2025-06-21 12:27:12 989

原创 AI 产品经理还能火几年？

这就好比：现在大部分软件都有移动端，但还有人提“移动端产品经理”这个概念吗？这里面的逻辑在于：AI 技术就像移动互联网一样，它会颠覆软件的形态，但并不会颠覆软件的核心设计逻辑。而最终，它只会成为一种基础能力。给大家举个例子：AI 培训。毫无疑问，这个 Agent 产品颠覆了传统的培训软件。以前所谓的在线培训，其实就是看视频、做考卷。枯燥又无用。但是现在，AI 可以模拟真实业务场景，让学员在“练”中学，完全颠覆了过去那种呆板的学习方式。

2025-06-21 12:26:36 844

原创美团AI产品经理offer｜2800字复盘，技术转产品，超优质面经！

REC1、同学在2025年3月加入****辅导****2、整体体验不错，面试官都比较温和，以下是我被问到的问题和我的一些回答思路，希望能帮到准备面试的同学～************简要介绍项目背景我做的项目主要是针对某类用户在XX场景下存在的的问题，基于调研和痛点分析，设计了XXX功能来解决核心需求。是我自主选题的项目。因为在日常生活/实践中发现了这个问题，加上我对这类产品方向比较感兴趣，所以就尝试结合已有资源，自己立项、调研并推进。****

2025-06-21 12:25:55 830

原创 AI大模型底层技术——LoRA微调

是一种针对大型预训练语言模型 (LLMs) 的高效微调技术。它旨在解决全参数微调所带来的计算和存储成本问题。冻结预训练模型的原始参数，并通过引入少量可训练的低秩矩阵来模拟参数更新。这样，在微调过程中，只需要优化这些低秩矩阵的参数，而不需要修改原始模型的参数，从而大大减少了需要训练的参数量。

2025-06-21 12:23:50 685

原创 AI大模型知识点梳理：大模型是什么？大模型发展历程、底层原理、优点和不足、如何学习大模型？

其中大型模型和极大型模型可以被视为AI大模型。**3. 隐私保护：**用于训练大模型的数据往往包含大量的个人隐私数据，如医疗数据、银行账户等，保护这些数据的安全和隐私变得尤为重要。**4. 声音识别：**AI大模型，例如Wav2Vec和Transformer，使语音识别技术取得了更高的准确性，大幅提高了语音识别技术在交互式应用和智能家居领域的应用。**3. 人脸识别：**大模型，例如Facenet和 DeepFace，提高了人脸识别的准确性和鲁棒性，大幅度提升了人脸识别技术在安防、金融、医疗等领域的应用。

2025-06-20 21:31:37 306

原创 AI大模型发展历程探秘：DeepSeek技术溯源，深入解析底层逻辑与技术细节！

随着Deepseek年初的爆火，短短四个月时间，AI大模型的使用频率越来越多，受众也越来越广泛，并延伸到各个行业的不同年龄群体：小学生写作文、中学生解答数学题、大学生毕业设计、职场人日常办公、VLOG博主制作短视频……大模型，到底哪家强？为了帮大家更好地理解大模型、使用大模型，下面通过一些类比方法，并结合个人体会，详细梳理下AI大模型底层逻辑和技术，希望能让大家通俗来理解。文章包含6881字，阅读约15分钟。一、大语言模型（Large Language Modeling，LLM）

2025-06-20 21:30:47 818

原创手撕LLM，从0开始学习大模型底层技术原理！

随着人工智能技术的加速演进，AI大模型已成为全球科技竞争的新高地，发展潜力巨大。我国高度重视人工智能的发展，出台了一系列扶持政策和规划，为AI大模型产业创造了良好的环境。当前，通用大模型、行业大模型、端侧大模型等如雨后春笋般涌现，广泛应用于经济社会多个领域，如金融、医疗、电商、影视、传媒等，打开了通用人工智能的大门，推动了新一轮的科技革命与产业变革。同时，如何学习大模型成为了行业内大量技术人员的困扰。

2025-06-20 21:27:34 889

原创【语言大模型微调】LoRA — 尖端的大模型微调技术_lora微调

直接上干货：大语言模型可以做什么？LoRA的核心思想：随着机器学习的最新发展，对模型性能的期望也在增加，需要更复杂的机器学习方法来满足对性能的需求。在机器学习的早期阶段，构建一个模型并在单次训练中训练它是可行的。训练，在其最简单的意义上。您将一个未经训练的模型，提供给它数据，并获得一个高性能的模型。对于简单问题来说，这仍然是一种流行的策略，但对于更复杂的问题，将训练分为两个部分，即“预训练”和“微调”，可能会很有用。总体思路是在一个大规模数据集上进行初始训练，并在一个定制的数据集上对模型进行优化。

2025-06-20 21:25:26 907

原创 java开发程序员转行可以做些什么？_java改行可以做什么

Java程序员是一个职位，避免不了会出现有人想转行或者被迫转行的情况，有同学想要了解一下Java程序员转行的话都能干什么，这里小编就来给大家介绍几个比较多的，以供大家参考。前排提示，文末有大模型AGI-CSDN独家资料包哦！

2025-06-20 21:24:33 1021

空空如也

空空如也