大模型专栏博文汇总和索引

大模型专栏主要是汇总了我在学习大模型相关技术期间所做的一些总结和笔记,主要包括以下几个子专栏:

  1. DeepSeek-R1
  2. AIGC
  3. 大模型实践
  4. Transformer
  5. 多模态
  6. 系统
  7. 视频理解
  8. 对比学习
  9. 目标检测
  10. 目标跟踪
  11. 图神经网络

大模型专栏汇总了以上所有子专栏的论文,目前暂时先按照不同的技术领域划分子专栏,子专栏之间的内容可能会有交集,不完全是独立的。

为了方便查阅相关模块的内容,故以此文章进行汇总与索引。

一、DeepSeek-R1

专栏地址:https://blog.csdn.net/sinat_16020825/category_12901824.html?spm=1001.2014.3001.5482

主要介绍DeepSeek-R1模型涉及的相关技术原理、方法、部署和相关的开源项目。

博文:

  1. DeepSeek-R1大模型相关技术原理介绍
  1. 第1篇:混合专家模型(MoE)
  2. 第2篇:大模型知识蒸馏(Knowledge Distillation)
  3. 第3篇:强化学习(Reinforcement Learning, RL)
  4. 第4篇:本地部署DeepSeek,断网也能畅聊!
  5. 第5篇:DeepSeek-R1微调指南
  6. 第6篇:思维链(CoT)
  7. 第7篇:冷启动
  8. 第8篇:位置编码介绍(绝对位置编码、RoPE、ALiBi、YaRN)
  9. 第9篇:MLA(Multi-Head Latent Attention,多头潜在注意力)
  10. 第10篇:PEFT(参数高效微调——Adapter、Prefix Tuning、LoRA)
  11. 第11篇:RAG原理介绍和本地部署(DeepSeek+RAGFlow构建个人知识库)
  12. 第12篇:分词算法Tokenizer(WordPiece,Byte-Pair Encoding (BPE),Byte-level BPE(BBPE))
  13. 第13篇:归一化方式介绍(BatchNorm, LayerNorm, Instance Norm 和 GroupNorm)
  14. 第14篇:MoE源码分析(腾讯Hunyuan大模型介绍)
  1. 跑通复现DeepSeek-R1的Open R1开源项目,介绍相关的技术原理、方法和源码分析
  1. 系列1:跑通SFT(一步步操作,手把手教学)
  2. 系列2:没有卡也能训模型!Colab跑OpenR1(附源码)
  3. 系列3:基础知识介绍
  4. 系列4:跑通GRPO!
  5. 系列5:SFT源码逐行深度解析
  6. 系列6:GRPO源码结构解析
  7. 系列7:GRPO原理介绍、训练流程和源码深度解析
  8. 系列8:混合精度训练、DeepSpeed、vLLM和LightEval介绍
  9. 系列9:有趣的现象——GRPO训练过程Loss从0开始慢慢变大

二、AIGC

专栏地址:https://blog.csdn.net/sinat_16020825/category_12822758.html

主要是介绍文生图、图生图、文生视频等相关技术。

博文:

  1. Stable Diffusion v3.5开源项目介绍

开源项目地址:https://github.com/Donvink/dive-into-stable-diffusion-v3-5

  1. 第1篇:开源项目正式发布——深入探索SDv3.5模型全参/LoRA/RLHF训练
  2. 第2篇:Stable Diffusion v3.5原理介绍
  1. 技术原理介绍
  1. 【AIGC系列】1:自编码器(AutoEncoder, AE)
  2. 【AIGC系列】2:DALL·E 2模型介绍(内含扩散模型介绍)
  3. 【AIGC系列】3:Stable Diffusion模型原理介绍
  4. 【AIGC系列】4:Stable Diffusion应用实践和代码分析
  5. 【AIGC系列】5:视频生成模型数据处理和预训练流程介绍(Sora、MovieGen、HunyuanVideo)
  6. 【AIGC系列】6:HunyuanVideo视频生成模型部署和代码分析
  1. Stable Diffusion应用介绍
  1. 【Stable Diffusion】入门-01:原理简介+应用安装(Windows)+生成步骤
  2. 【Stable Diffusion】入门-02:AI绘画提示词+参数设置攻略
  3. 【Stable Diffusion】入门-03:图生图基本步骤+参数解读
  4. 【Stable Diffusion】入门-04:不同模型分类+代表作品+常用下载网站+使用技巧

三、大模型实践

专栏地址:https://blog.csdn.net/sinat_16020825/category_12834983.html

主要介绍一些实践的开源大模型项目。

博文:

  1. 预训练语言模型微调和部署——《动手学大模型》实践教程第一章
  2. 大模型提示学习与思维链——《动手学大模型》实践教程第二章
  3. 大模型知识编辑——《动手学大模型》实践教程第三章
  4. 大模型水印——《动手学大模型》实践教程第四章
  5. 大模型安全和越狱攻击——《动手学大模型》实践教程第五章
  6. 多模态大语言模型——《动手学大模型》实践教程第六章
  7. 大模型智能体安全——《动手学大模型》实践教程第七章
  8. 【LLaMa2入门】从零开始训练LLaMa2
  9. 【多模态大模型实战】使用LoRA微调Qwen2.5-VL

四、Transformer

专栏地址:https://blog.csdn.net/sinat_16020825/category_12822715.html

主要介绍Transformer相关的模型结构和应用。

博文:

  1. Transformers在计算机视觉领域中的应用【第1篇:ViT——Transformer杀入CV界之开山之作】
  2. Transformers在计算机视觉领域中的应用【第2篇:MAE——BERT的CV版本】
  3. Transformers在计算机视觉领域中的应用【第3篇:Swin Transformer——多层次的Vision Transformer】

五、多模态

专栏地址:
https://blog.csdn.net/sinat_16020825/category_12822761.html

主要是介绍多模态大模型相关技术原理和应用。

博文:

  1. 【CLIP系列】1:CLIP【多模态领域开山之作】
  2. 【CLIP系列】2:如何用多GPU训练大模型(数据/模型/流水线/张量并行、MoE、混合精度训练、压缩、激活重新计算)
  3. 【CLIP系列】3:语义分割(LSeg、GroupViT)
  4. 【CLIP系列】4:目标检测(ViLD、GLIP)
  5. 【CLIP系列】5:CLIP图像生成——CLIPasso
  6. 【CLIP系列】6:视频(CLIP4CLIP、Action CLIP)、语音(audio CLIP)及其他(CLIP-ViL、PointCLIP、DepthCLIP)
  7. 【多模态大模型】系列1:Transformer Encoder——ViLT、ALBEF、VLMO
  8. 【多模态大模型】系列2:Transformer Encoder-Decoder——BLIP、CoCa、BEITv3
  9. 【多模态大模型实战】使用LoRA微调Qwen2.5-VL

六、系统

专栏地址:https://blog.csdn.net/sinat_16020825/category_12822756.html

主要是介绍系统相关的论文和技术,例如并行技术等。

博文:

  1. 如何用多GPU训练大模型(数据/模型/流水线/张量并行、MoE、混合精度训练、压缩、激活重新计算)

七、视频理解

暂无更新。


八、对比学习

暂无更新。


九、目标检测

专栏地址:https://blog.csdn.net/sinat_16020825/category_12822763.html

主要是介绍目标检测领域相关论文、技术原理和代码分析等。

博文:

  1. YOLO系列论文综述(从YOLOv1到YOLOv11)
  1. 【第1篇:概述物体检测算法发展史、YOLO应用领域、评价指标和NMS】
  2. 【第2篇:YOLO系列论文、代码和主要优缺点汇总】
  3. 【第3篇:YOLOv1——YOLO的开山之作】
  4. 【第4篇:YOLOv2——更好、更快、更强】
  5. 【第5篇:YOLOv3——多尺度预测】
  6. 【第6篇:YOLOv4——最优速度和精度】
  7. 【第7篇:YOLOv5——使用Pytorch框架、AutoAnchor、多尺度预训练模型】
  8. 【第8篇:YOLOv6——更高的并行度、引入量化和蒸馏以提高性能加速推理】
  9. 【第9篇:YOLOv7——跨尺度特征融合】
  10. 【第10篇:YOLOv8——集成检测、分割和跟踪能力】
  11. 【第11篇:YOLO变体——YOLO+Transformers、DAMO、PP、NAS】
  12. 【第12篇:YOLOv9——可编程梯度信息(PGI)+广义高效层聚合网络(GELAN)】
  13. 【第13篇:YOLOv10——实时端到端物体检测】
  14. 【第14篇:YOLOv11——在速度和准确性方面具有无与伦比的性能】
  15. 【第15篇(完结):讨论和未来展望】

十、目标跟踪

暂无更新。


十一、图神经网络

暂无更新。


十二、其他

  1. 深度学习论文精读【持续更新中】

确实存在一些专门收集整理大模型及相关领域学习资源的网站,这类平台通常不仅限于电子书,还会包含课程、教程、项目实践案例等内容。以下是一些值得推荐的资源汇总型网站: 1. **Awesome系列GitHub仓库**: - GitHub上有很多由社区维护的“Awesome”列表,例如[Awesome-Transformers](https://github.com/ncoop57/awesome-transformers) 或者 [Awesome-NLP](https://github.com/keon/awesome-nlp),它们汇集了大量的自然语言处理(包括大模型)相关的工具、库、论文其他教育资源。 2. **Model Zoo (模型动物园)**: - Hugging Face提供的[Models页面](https://huggingface.co/models)是一个非常著名的大型预训练模型集合地,这里除了可以直接加载各种先进的Transformer架构外,还附带详细的文档说明以及示例代码,非常适合希望深入了解如何应用这些模型的学习者。 3. **教育平台与MOOCs**: - Coursera、edX等在线教育平台上有许多针对深度学习特别是大规模神经网络设计的专项课程,如DeepLearning.AI推出的[Natural Language Processing Specialization],涵盖从基础理论到实际操作的所有内容。 4. **专业技术博客个人主页**: - 许多专家会在个人博客或者专栏里分享自己的研究成果、心得体验甚至完整的教学材料,像周志华老师的《机器学习》一书配套的教学视频就深受学生喜爱;还有李沐博士在其个人网页上的公开讲义也是不可多得的好资源。 5. **论坛与问答社区**: - CSDN本身就是一个很好的例子,它不仅是程序员们解决问题的地方,也有大量的文章介绍了最新技术趋势。此外Reddit下的r/MachineLearning板块也有很多热心网友积极贡献优质帖子。 6. **中文社区特供**: - 针对中国用户的特殊需求,国内也有一些不错的集成式知识分享平台,比如知乎、掘金小册等都设有专区讨论最前沿的技术话题,并且经常会邀请行业内知名人士开设讲座或撰写指南。 通过上述途径之一或多条结合使用,能够帮助你在浩瀚的信息海洋中有针对性地筛选出适合自己水平发展目标的大模型学习资料。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值