m0_74825409-CSDN博客

原创深度求索（DeepSeek）：以AI之力重塑医疗未来

当DeepSeek的算法开始理解细胞凋亡的数学表达，当智能体能够模拟药物在血管中的湍流扩散，我们正在见证医疗范式的根本性转变。这不是机器取代医生的故事，而是人类智慧与人工智能的共进化史诗。从三甲医院到偏远村卫生室，从新药实验室到家庭健康终端，DeepSeek持续用技术突破拓展医疗普惠的边界。在这条用代码构建生命防线的道路上，每一次算法的精进，都在为人类健康共同体增添新的希望注脚。

2025-06-05 00:05:58 496

原创大模型：突破AI的边界

大模型是指具有庞大参数数量的机器学习模型。传统的机器学习模型通常只有几百或几千个参数，而大模型则可能拥有数亿或数十亿个参数。这种巨大的模型规模赋予了大模型更强的表达能力和预测能力，可以处理更为复杂的任务和数据。

2025-06-04 23:53:43 810

原创多模态大模型初探索：通过ollama部署多模态大模型

今天和同事聊天，聊到多模态大模型，感觉可以作为2025年的一个新的探索方向。希望和大家一起学习，一起进步。今天也是尝试了我能想到的最基本最快速地本地部署多模态大模型的方式，那便是使用ollama。ollama之前咱安装过，然后现在也是直接使用就好。

2025-06-04 23:40:10 438

大模型通过训练海量数据来学习复杂的模式和特征，具有更强大的泛化能力，可以对未见过的数据做出准确的预测。引申到模型层面，涌现能力指的是当模型的训练数据突破一定规模，模型突然涌现出之前小模型所没有的、意料之外的、能够综合分析和解决更深层次问题的复杂能力和特性，展现出类似人类的思维和智能。ChatGPT对大模型的解释更为通俗易懂，也更体现出类似人类的归纳和思考能力：大模型本质上是一个使用海量数据训练而成的深度神经网络模型，其巨大的数据和参数规模，实现了智能的涌现，展现出类似人类的智能。

2025-06-04 23:27:31 695

原创【网安AIGC专题10.11】①代码大模型的应用：检测、修复②其安全性研究：模型窃取攻击（API和网页接口）

国内外生成式大模型研究现状总结GPT 系列模型的发展历程总结这个工作，效果肉眼可见的差hh。

2025-06-04 23:14:56 797

原创 Playwright + MCP：用AI对话重新定义浏览器自动化，效率提升300%！

Playwright + MCP的结合，标志着自动化领域从“代码驱动”向“AI驱动”的革命性转变。无论是测试工程师、开发人员还是数据分析师，均可借助这一技术栈大幅提升效率。

2025-06-04 23:02:48 771

原创 DeepSeek打破AI天花板：MoE架构+RL推理，效率提升5倍的底层逻辑

MoE架构最早于1991年提出，旨在通过引入多个“专家”模型来提升深度学习模型的性能和效率。传统的MoE架构存在知识混合与冗余问题，导致“专家”的重复工作、浪费计算资源。而DeepSeek的MoE架构则通过一系列创新解决了这些问题。RL推理是通过强化学习来引导模型发展出类人的推理能力，而非单纯的语言生成能力。DeepSeek的RL推理以R1系列为代表，R1并非从零开始训练，而是基于DeepSeek V3 - Base模型通过强化学习（RL）分阶段优化的产物。

2025-06-04 22:48:56 928

原创 AI 模型高效化：推理加速与训练优化的技术原理与理论解析

假设w已存储在存内计算芯片的电阻阵列中return simulate_analog_compute(w, x) # 调用硬件模拟函数存内计算vs传统计算对比表维度传统冯·诺依曼架构存内计算架构数据流向内存总线计算单元（多次搬运）存储单元直接计算（原地处理）能耗占比数据搬运占90%+搬运能耗降低90%算力密度约1.2TOPS/W（GPU）24TOPS/W（存内计算芯片）典型应用云端大模型推理（如GPT-4）边缘AI（智能手表、AR眼镜）

2025-06-04 22:31:43 621

原创什么是大模型？一文读懂大模型的基本概念_看完这篇就足够了~

大模型是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成，拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能，能够处理更加复杂的任务和数据。大模型在各种领域都有广泛的应用，包括自然语言处理、计算机视觉、语音识别和推荐系统等。大模型通过训练海量数据来学习复杂的模式和特征，具有更强大的泛化能力，可以对未见过的数据做出准确的预测。

2025-05-22 00:09:16 741

原创人工智能大模型时代，八种常见的“数据标注”方法

你知道的数据标注都有哪些？数据标注（Data Annotations）是指对收集到的、未处理的原始数据或初级数据，包括语音、图片、文本、视频等类型的数据进行加工处理，并转换为机器可识别信息的过程。矩形框标注是一种的简单处理方式，常用于等。多边形标注是指在静态图片中，使用多边形框，标注出不规则的目标物体，相对于矩形框标注，同时对于不规则物体，也更具针对性。语义分割是指根据物体的属性，，以帮助训练图像识别模型，常应用于自动驾驶、人机交互、虚拟现实等领域。关键点标注模板最大的应用即是。

2025-05-21 23:16:58 604

原创七种大模型微调方法：让你的Offer拿到爽

通过上述七种大模型微调方法，你可以根据具体任务和资源限制选择最适合的微调策略。无论是LoRA的高效微调、QLoRA的量化优化，还是适配器调整的灵活性，都能够帮助你更好地利用预训练模型的优势，从而在求职过程中脱颖而出，让offer拿到爽。希望本文能为你在人工智能领域的求职之路提供有力支持。因为这个行业不同于其他行业，知识体系实在是过于庞大，知识更新也非常快。作为一个普通人，无法全部学完，所以我们在提升技术的时候，首先需要明确一个目标，然后制定好完整的计划，同时找到好的学习方法，这样才能更快的提升自己。

2025-05-21 23:13:15 876

原创一天时间，我用AI(deepseek)做了一个配色网站

最近在开发颜色搭配主题的相关H5和小程序，想到需要补充一个web网站，因此有了这篇文章。

2025-05-21 23:09:35 880

原创【机器学习】音乐与AI的交响：机器学习在音乐产业中的应用

😎 作者介绍：资深程序员，从业10年+、互联网系统架构师，目前专注于AIGC的探索（CSDN博客之星|AIGC领域优质创作者）💘领取三大专属福利：1️⃣免费赠送AI+编程📚500本，2️⃣AI技术教程副业资料1套，3️⃣DeepSeek资料教程1套🔥（限前500人）需要的朋友点击下方👇👇👇【微信名片】，100%免费领取。

2025-05-21 23:05:53 852

原创【Wan2.1开源AI视频生成模型本地部署结合ComfyUI远程使用】

本文主要介绍如何在 Windows 系统电脑本地部署 ComfyUI 并接入通义万相 Wan2.1 模型，轻松实现使用文字指令生成 AI 视频，结合 cpolar 内网穿透工具还能远程在线使用，无需公网 IP 也不用准备云服务器那么麻烦。最近，阿里发布了最新的视频生成开源 AI 大模型——Wan 2.1。这款模型不仅完全免费，还能在普通的家用级配置电脑上离线运行，生成效果媲美目前大多数开源模型的视频质量。其综合实力在 VBench 榜单上得到了充分验证，甚至一些闭源模型也难以望其项背。

2025-05-21 23:02:13 926

原创【AI 大模型】Assistants API 开发 ② ( 核心概念开发流程创建 Assistant 创建 Thread 添加消息运行 Assistant 获取响应 )

OpenAI 的 Assistants API 是为开发者提供的高级工具 , 用于构建基于对话的 AI 应用;在 Assistants 开发过程中涉及到助手 ( Assistant ) 、对话线程 ( Thread ) 、执行过程 ( Run ) 等核心概念;助手 ( Assistant ) 是静态配置的 AI 代理;对话线程 ( Thread ) 是动态的对话上下文 , 与 Assistant 关联;

2025-05-21 22:52:58 953

原创 PyTorch生成式人工智能实战（1）——神经网络与模型训练过程详解

人工神经网络 (ANN) 是一种监督学习算法，其灵感来自人类大脑的运作方式。类似于人脑中神经元连接和激活的方式，神经网络接受输入，通过某些函数在网络中进行传递，导致某些后续神经元被激活，从而产生输出。函数越复杂，网络对于输入的数据拟合能力就越大，因此预测的准确性就越高。有多种不同的ANN架构，根据通用逼近定理，我们总能找到一个足够大的包含正确权重集的神经网络架构，可以准确地预测任何给定输入的输出结果。这意味着，对于给定的数据集/任务，我们可以创建一个架构并不断调整其权重，直到ANN。

2025-05-21 22:49:11 893

原创 NVIDIA Jetson Orin Nano 8G 开发板开箱测评：边缘AI设备的性价比之选

大家好，我是。985院校硕士毕业，现担任算法工程师一职，获得CSDN博客之星第一名，热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委，编写微软OpenAI考试认证指导手册。曾获得多项AI顶级比赛的Top名次，其中包括阿里云、科大讯飞比赛第一名，CCF、开放原子比赛二等奖。在技术创新领域拥有多项授权发明。曾辅导多位非科班出身的同学成功进入算法行业就业。希望和大家一起成长进步。

2025-05-21 22:45:34 1026

原创 LLM（大语言模型）——大模型简介

语言建模的研究始于20世纪90年代，最初采用了统计学习方法，通过前面的词汇来预测下一个词汇。然而，这种方法在理解复杂语言规则方面存在一定局限性。随后，研究人员不断尝试改进，其中在2003年，深度学习先驱Bengio在他的经典论文《A Neural Probabilistic Language Model》中，首次将深度学习的思想融入到语言模型中，使用了更强大的神经网络模型，这相当于为计算机提供了更强大的“大脑”来理解语言。这种方法让模型可以更好地捕捉语言中的复杂关系，虽然这一步很重要，但仍有改进的空间。

2025-05-21 22:41:42 1025

原创 GPUCUDA 发展编年史：从 3D 渲染到 AI 大模型时代（上）

之所以如此设计，是因为标量处理单元对于编译器的实现而言更加容易，标量 SP 的编译器完全支持 C 编程，避免程序员要手工处理矢量寄存器（Vector），为开发上层 CUDA 提供了足够的支撑。如下图所示，G256 在 TNT 的基础上还集成了 T&L（Transform & Lighting Unit，光照变化单元）模块，这是一个固化的 32bits 浮点矢量计算单元，实现了顶点处理和几何变换等功能，而 CPU 只需要负责将 3D Triangles（描述 3D 空间的三角形）。

2025-05-21 22:38:02 725

原创 Applitools与AI图像识别技术在测试中的应用

Applitools是一个领先的视觉测试平台，通过集成强大的视觉验证能力，帮助团队实现跨平台、跨浏览器的UI测试自动化。其核心技术基于AI图像识别，能够模拟人眼的视觉识别过程，从而发现UI中的细微差异，不论这些差异是屏幕分辨率不同，还是在某些特定的浏览器或操作系统中导致的渲染问题。而AI图像识别技术，特别是计算机视觉技术的应用，在视觉测试中提供了前所未有的高效性。传统的视觉比较方法通常依赖于像素级的差异比较，但这种方法难以处理由于不同分辨率或显示设备造成的图像差异。

2025-05-21 22:12:40 620

原创 AI大模型零基础入门教程（适合小白），AI大模型教程入门到精通，非常详细收藏我这一篇就够了

AI大模型是指使用大规模数据和强大的计算能力训练出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力，可以应用于各种领域，如自然语言处理、图像识别、语音识别等。

2025-05-21 21:25:28 519

原创 AI大模型学习

在当前技术环境下，AI大模型学习不仅要求研究者具备深厚的数学基础和编程能力，还需要对特定领域的业务场景有深入的了解。通过不断优化模型结构和算法，AI大模型学习能够不断提升模型的准确性和效率，为人类生活和工作带来更多便利。

2025-05-21 21:22:37 798

原创 AI大模型ms-swift框架实战指南（一）：框架基础篇之全景概览

swift框架，全称为Scalable lightWeight Infrastructure for Fine - Tuning，由魔搭社区精心打造。魔搭社区在人工智能领域积累深厚，开发swift框架旨在解决传统大模型开发中的效率和资源管理难题。其研发团队汇聚了人工智能领域的专家，经过大量调研、实验和优化，推出了这款集高效、灵活、轻量于一体的综合性工具集，整合了大模型开发从数据处理到部署的全流程功能。在本篇章中，我们全面认识了swift框架。

2025-05-21 21:19:36 705

原创 AI 驱动视频处理与智算革新：蓝耘MaaS释放海螺AI视频生产力

在 AI 推动视频处理变革的浪潮中，蓝耘 MaaS 平海螺 AI 视频技术脱颖而出。它凭借云计算、AI 算法和大数据分析，为视频内容的全流程提供智能化方案，解决了传统视频处理在效率、精准度和成本上的难题，成为国内领先的 AI 视频处理平台。如果想快速体验可以点击下面链接注册蓝耘智算平台注册链接。

2025-05-21 21:15:52 940

原创金融大模型到底靠不靠谱？

一个“技术问题”，导致巴菲特的伯克希尔-哈撒韦公司股价暴跌近 100%。想必很多小伙伴已经感受过了这则铺天盖地的消息，所带来的亿点点震撼。而根据事后的消息来看，这个大故障是纽交所的合并报价系统（CTA）在更新软件时出现了问题。许多专家都对此做了分析，有人认为是 CTA 软件在进行版本更新时出现了数据一致性问题；也有人提出最大的问题应该是出现在了数据库。①人工智能/大模型学习路线②AI产品经理资源合集③200本大模型PDF书籍④超详细海量大模型实战项目⑤LLM大模型系统学习教程。

2025-05-18 23:58:43 884

原创蓝耘平台介绍：算力赋能AI创新的智算云平台

蓝耘平台凭借高性能算力、灵活的资源配置及用户友好的设计，成为AI开发者与企业的重要工具。无论是科研探索还是产业落地，其“降本提效”的核心优势显著，适合作为入门级算力平台或企业级算力解决方案。未来随着算力需求的爆发式增长，蓝耘在智算云服务领域的潜力值得期待。

2025-05-18 23:54:42 952

原创终于有人把多模态大模型讲这么详细了

多模态大型语言模型（Multimodal Large Language Models， MLLM）的出现是建立在大型语言模型（Large Language Models， LLM）和大型视觉模型（Large Vision Models， LVM）领域不断突破的基础上的。这里给大家总结了多模态大模型的结构，训练，评估方法以及幻觉问题的解决办法，通俗易懂！！

2025-05-18 23:49:47 608

原创深度求索（DeepSeek）：以AI之力重塑医疗未来

当DeepSeek的算法开始理解细胞凋亡的数学表达，当智能体能够模拟药物在血管中的湍流扩散，我们正在见证医疗范式的根本性转变。这不是机器取代医生的故事，而是人类智慧与人工智能的共进化史诗。从三甲医院到偏远村卫生室，从新药实验室到家庭健康终端，DeepSeek持续用技术突破拓展医疗普惠的边界。在这条用代码构建生命防线的道路上，每一次算法的精进，都在为人类健康共同体增添新的希望注脚。

2025-05-18 23:45:07 555

原创数字人技术的核心：AI与动作捕捉的双引擎驱动（210）

AI 与动作捕捉技术的深度融合，正在重构数字人的 “生命体征”。随着 5G、AR/VR 技术的普及，数字人将从单一功能载体进化为具备自主意识的虚拟生命体，成为连接物理世界与数字空间的超级入口。未来的数字人不仅是技术的集合体，更是人类情感与智慧的数字化延伸。我们正站在一个新的时代起点上，见证着数字人技术带来的变革与创新。在这个虚实共生的新纪元中，数字人将与我们的生活、工作、娱乐深度融合，创造出无限可能的未来。

2025-05-18 23:41:23 1141

原创必须收藏！可能是最完整的全球AI大模型名单

ChatGPT的出现在全球掀起了AI大模型的浪潮。区块链是生产关系的重构，元宇宙是虚拟场景的重构，而互联网则解决了信息流通和生产效率的问题，但这些都是在生产关系范畴内，而ChatGPT的出现则大幅度提升了生产力，让人类可以将电能转换成脑力和通用智力。很多人已经把这次AI浪潮称为“第四次科技革命”。甚至《自然》杂志把非人类的Chat GPT列入“年度科学人物”根据国际数据公司IDC预测，全球AI计算市场规模将从2022年的195.0亿美元增长到2026年的346.6亿美元。

2025-05-18 23:37:27 811

原创如何搭建基于大模型的智能知识库

基于RAG与LLM的知识库作为目前最有潜力的企业端大模型应用之一，从技术角度可以看到，建设方案已经完备；从业务角度，最终的应用效果和业务价值还需要观察，并通过业务侧的反馈不断地促进建设方案的进一步优化，比如增加对多模态知识的处理能力等。让我们共同期待这类应用普及那一天的到来。

2025-05-18 23:25:05 974

原创大模型获取embdding

以qwen为例：本文将使用 Hugging Face 的库来完成这些步骤。这是一个非常流行且功能强大的库，用于处理各种预训练语言模型。

2025-05-18 23:21:08 217

原创大模型的快速部署与高效推理——GGUF格式模型介绍与使用教程

在人工智能领域，大型语言模型的发展日新月异，它们在自然语言处理、机器翻译、智能助手等多个领域展现出了前所未有的能力。然而，随着模型规模的不断扩大，这些庞大的神经网络模型在存储、传输和加载上面临着一系列挑战。传统的文件格式在处理这些庞大的数据集时显得力不从心，不仅效率低下，而且兼容性和扩展性也难以满足日益增长的需求。在这样的背景下，GGUF（GPT-Generated Unified Format）应运而生。

2025-05-18 23:16:41 621

原创大模型实操 ——LoRA、QLoRA微调大模型实战技巧分享

换句话说，Adam优化器在内存中为每个模型参数存储两个附加值，即如果我们正在训练一个7B参数的模型，那使用Adam就能够在训练的过程中跟踪额外的14B参数，相当于在其他条件不变的情况下，模型的参数量翻了一番。另外，值得注意的是，我的实验中包括两个算术基准测试。在之前的实验中，采用的参数是 r=8，alpha=16，这导致了2倍的扩展。可能大家都想学习AI大模型技术，也想通过这项技能真正达到升职加薪，就业或是副业的目的，但是不知道该如何开始学习，因为网上的资料太多太杂乱了，如果不能系统的学习就相当于是白学。

2025-05-18 23:11:55 856

原创大模型+电力预测？

自ChatGPT问世以后，大模型非常的火，不出意外的话，电力系统方向又打算搞事情了。大模型+电力任重道远。最近听说了一些关于大模型+风光功率预测、负荷预测、电价预测的想法，初步分析下，很遗憾的是，个人得出结论是不可行。简单来说，如果强行使用大模型来做电力预测，本质上可能只是一厢情愿的希望大模型去预测一个噪声罢了。

2025-05-18 23:07:28 762

原创解锁AIGC新时代：通义万相2.1与蓝耘智算平台的完美结合引领AI内容生成革命

通义万相2.1作为一个开源的视频生成AI模型，在发布当天便荣登了VBench排行榜的榜首，超越了Sora和Runway等业内巨头，展现出惊人的潜力。模型不仅能够生成1080P分辨率的视频，而且没有时长限制，能够模拟自然动作，甚至还可以还原物理规律，这在AIGC领域中简直堪称革命性突破。通过蓝耘智算平台，我们能够轻松部署这个模型，创建属于自己的AI视频生成工具。今天，我将为大家深入探讨通义万相2.1的强大功能，并分享如何利用蓝耘智算平台快速入门。

2025-05-16 21:32:12 817

原创自己动手在Mac M1上搭建一个大模型聊天机器人

在本地运行开源模型的最有效方法是使用llama.cpp项目，llama.cpp是由机器学习专家Georgi Gerganov开发的开源大模型推理框架，最初是为了在本地运行Meta的Llama大模型，经过开源社区的努力，现在能够支持包括Google的Gemma、国内的通义千问、百川等在内的大模型，该项目在github上当前已有60K star。同样得益于技术社区的努力，一些基础的大模型（如llama 7b）也能够在CPU上运行，只是速度可能稍慢，这对于没有独立显卡的普通PC或笔记本用户来说是一个福音。

2025-05-16 21:28:07 922

空空如也

空空如也