没显卡也能微调大模型，手把手ChatGLM-6B微调实例教程，AutoDL云平台部署

爬呀爬的水滴

于 2025-05-26 10:09:29 发布

阅读量907

点赞数 31

分类专栏： AI大模型应用开发入门文章标签： chatglm autodl 大模型微调 fine tuning

本文链接：https://blog.csdn.net/wml731/article/details/148167511

版权

历时12个小时的调试，终于把流程完整跑通。
本教程通过AutoDL云平台部署，微调大模型，手把手带你感受微调，采用云平台的学术加速，可以下载github和huggingface的代码、模型、数据集

一、ChatGLM-6B介绍

智谱清言的开源双语对话语言模型

chat地址：https://chatglm.cn/main/alltoolsdetail?lang=zh

代码地址：https://github.com/THUDM/ChatGLM-6B

二、创建实例

2.1 租借实例

打开AutoDL，租借显存24G的3090或4090，原来我用的python3.12的问题很多，就换到3.10

三、准备数据

3.1 复制学术加速代码

source /etc/network_turbo

3.2 下载代码仓

进入数据盘，设置学术加速，下载代码仓库

cd autodl-tmp/
source /etc/network_turbo
git clone https://github.com/THUDM/ChatGLM-6B.git

3.3 下载ChatGLM-6B模型

3.3.1 安装git-lfs

Hugging Face 使用 Git LFS 来管理大文件（如模型权重、数据集等），而 Git LFS 会用这种指针文件代替真实文件，以节省 Git 仓库的空间。安装lfs可以下载真实文件

curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | sudo bash
sudo apt-get install git-lfs
git lfs install

3.3.2 下载权重文件

训练的时候会下载一份到roo

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

爬呀爬的水滴

关注关注

31
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

大模型的实践应用4-ChatGLM-6b大模型的结构与核心代码解读，最全的ChatGLM模型架构介绍与源码解读

微学AI的博客

10-24

9333

大家好，我是微学AI，今天给大家介绍一下大模型的实践应用4-ChatGLM大模型的结构与核心代码解读，最全的ChatGLM模型架构介绍与源码解读，本文介绍将ChatGLM-6B的模型结构，与设计原理。

人工智能_大模型012_租用GPU安装_ChatGLM大模型001_ChatGLM-6B-int4/int8/6B测试_微调_人民币的味道---人工智能工作笔记0148

添柴程序猿的专栏

03-02

517

找到以后,然后下面有镜像,可以选择一下基础镜像,我就选择了一个pytorch选择一个版本就行了,先进去系统再说。可以看到有个(1/13544)等,左边的1就是表示有1个可以用的,可以看到还是非常紧张的。可以看到右边也有,用户名密码,还有SSH,可以把这个点击一下复制,复制下来,我们用本地的。然后走到AutoDL的控制台,找到自己的服务器,然后右边自定义访问有个,点开,然后。点击租用新实例,然后我们,找个便宜的.自己找吧从这里面找可用的,很多不可用,

参与评论您还未登录，请先登录后发表或查看评论

ChatGLM-6B (介绍相关概念、基础环境搭建及部署)

王亮的博客

04-04

2万+

chatglm-6b详细部署步骤

（二）ChatGLM-6B模型部署以及ptuning微调详细教程

西风瘦马

04-09

2万+

ChatGLM-6B模型训练，ptuning微调，大语言模型，LLM

AutoDL 部署GLM大模型-简单实例讲解

最新发布

qq_40650634的博客

05-07

940

使用AutoDL 本地部署ChatGLM3-6B（智谱清言大模型），并简单的进行一个多轮对话的调用。

ChatGLM-6B (介绍以及本地部署)

qq128252的博客

03-17

2万+

ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型，基于架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需 6GB 显存）。ChatGLM-6B 使用了和ChatGLM相同的技术，针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练，辅以监督微调、反馈自助、人类反馈强化学习等技术的加持，62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。

ChatGLM2-6B、ChatGLM-6B 模型介绍及训练自己数据集实战

dream_home8407的博客

04-12

5万+

ChatGLM2-6B 模型介绍及训练实战

autodl部署chatglm3-6b踩坑记录

2301_78005925的博客

05-31

935

注意requirements.txt里面标明了各个依赖需要的版本号范围，如果后面出现module类的错误，可以根据里面的版本号来重新安装对应的版本。这里踩坑：如果按照官网的教程用git去clone到auto-tmp的话，99%可能会超时，因为autodl服务器本身没法科学上网。修改/ChatGLM3/basic_demo/web_demo_gradio.py中的模型路径，将路径改为第三步中的本地模型路径。设置gradio的参数，server_port=6006，然后点击控制台面的自定义服务，就可以了。

LLMs之ChatGLM-3：解读ChatGLM3-6B模型微调(多卡全量微调/单卡P-Tuning v2微调)所有sh脚本文件(finetune_ds.sh /finetune_pt.sh、fine

头部AI社区如有邀博主AI主题演讲请私信—心比天高，仗剑走天涯，保持热爱，奔赴向梦想！低调，专注，谦虚，自律，反思，成长，还算比较正能量的博主，公益免费传播…内心特别想在AI界做出一些可以推进历史进程影响力的技术(兴趣使然，有点小情怀，也有点使命感呀

12-07

810

LLMs之ChatGLM3：解读ChatGLM3-6B模型微调(多卡全量微调/单卡P-Tuning v2微调)所有sh脚本文件(finetune_ds.sh /finetune_pt.sh、finetune_ds_multiturn.sh/finetune_pt_multiturn.sh)—实现基于PyTorch框架分布式训练并采用混合精度训练+梯度累积等技术微调训练大型语言模型目录 1、基于简单输入/输出数据集的微调ChatGLM3-6B 2、基于多轮对话数据集的微调ChatGLM3-6

ChatGLM3-6B FastApi部署调用

weixin_40280870的博客

12-23

513

在autodl平台中租一个3090等24G显存的显卡机器，如下图所示镜像选择PyTorch–>1.11.0–>–>11.3接下来打开刚刚租用服务器的JupyterLab，并且打开其中的终端开始环境配置、模型下载和运行demo。pip换源和安装依赖包。

ChatGLM-6B部署和微调实例

weixin_45734379的博客

01-17

2085

ChatGLM-6B是本人尝试使用和微调的第一个大语言模型，自我感觉该模型很适合作为大语言模型的入门级选手，无论是部署配置还是推理微调都十分方便。本文主要介绍如何配置部署ChatGLM-6B，以及ChatGLM-6B推理和P-tuning v2微调基本步骤，希望可以帮助大家使用ChatGLM-6B。

清华 ChatGLM-6B 中文对话模型部署简易教程

热门推荐

小白的成长

03-20

6万+

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型，基于 General Language Model (GLM) 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需 6GB 显存）。 ChatGLM-6B 使用了和 ChatGPT 相似的技术，针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练，辅以监督微调、反馈自助、人类反馈强化学习等技术的加持，62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。

ChatGLM-6B微调与部署

dzysunshine的博客

05-05

1万+

ChatGPT所展现出的强大能力，足以使许多行业发生翻天覆地的变化，而通过微调及部署较小的模型，在一些垂直领域达到和ChatGPT相近的效果，显得尤为重要。本文从模型参数，中文，微调难度等多角度考虑，选取了ChatGLM-6B模型来进行实验，主要分为3个部分：基于ChatGLM-6B的部署，基于peft框架的LoRA微调ChatGLM-6B，基于P-Tuning v2微调ChatGLM-6B（官方）。

ChatGLM-6b本地安装手把手教学

csdn570566705的博客

06-27

1360

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型，基于 General Language Model (GLM) 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需 6GB 显存）。ChatGLM-6B 使用了和 ChatGPT 相似的技术，针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练，辅以监督微调、反馈自助、人类反馈强化学习等技术的加持，62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。

ChatGLM-6B的安装和使用最全面细节讲解

月亮的博客

06-01

5807

ChatGLM-6B是一个基于General Language Model (GLM)架构的开源对话语言模型，支持中英双语。该模型使用了和ChatGPT类似的技术进行优化，经过1T标识符的中英双语训练，同时辅以监督微调、反馈自助和人类反馈强化学习等技术，共有62亿参数。

weixin_43815222的博客

06-19

2853

ChatGPT的爆火让许多公司和个人都想要开发自己的大型语言模型，但是，由于算力和语言模型开发能力等诸多方面的限制，许多人最终都只能在开发的早期阶段止步不前。然而，近期清华大学知识工程和数据挖掘小组（Knowledge Engineering Group (KEG) & Data Mining at Tsinghua University）发布了对话机器人ChatGLM-6B的开源版本，这一切都变得更加容易了。这个中英文语言模型拥有千亿参数规模，并且对中文进行了优化。

ChatGLM-6B：颠覆聊天AI的全新模型

AIGC搞起

03-31

7160

ChatGLM-6B是一个基于GPT-3的生成式对话模型。它由清华大学的研究团队开发，旨在改进聊天机器人的生成质量和对话逻辑。ChatGLM-6B采用了全新的训练方法，通过在大规模对话数据集上进行预训练，提升了模型的生成能力和对话质量。

大模型开源：ChatGLM-6B (介绍以及本地部署)

2301_81888214的博客

09-14

1963

ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型，基于 General Language Model (GLM) 架构，具有 62 亿参数。

ChatGLM2-6B 部署与微调

qq_56591814的博客

09-22

7742

此时为INT4 量化模型，且每次训练会以 1 的批处理大小进行 16 次累加的前后向传播（batch_size=1，累积16次才进行梯度回传，更新参数），等效为 16 的总批处理大小，此时最低只需 6.7G 显存。若想在提升训练效率，可在二者乘积不变的情况下，加大。该大语言模型基于之前提出的GLM(General Language Model)，在Norm处理、激活函数、Mask机制等方面进行了调整，目的是训练出开源开放的高精度千亿中英双语稠密模型，能够让更多研发者用上千亿模型。

chatglm3-6b部署微调 autodl

01-28

### 如何在AutoDL平台上部署和微调ChatGLM3-6B大语言模型 #### 准备工作为了顺利进行后续操作，在`autodl-tmp`文件夹下创建一个新的名为`models`的文件夹用于存储下载的模型权重文件[^1]。 ```bash mkdir -p ~/autodl-tmp/models/ cd ~/autodl-tmp/models/ ``` #### 获取模型资源通过Git命令从Hugging Face仓库克隆`chatglm3-6b`的相关参数、配置以及预训练好的权重文件到本地环境中[^2]： ```bash git clone https://huggingface.co/THUDM/chatglm3-6b ``` 这一步骤确保了拥有最新的官方版本，同时也方便日后更新维护。 #### 部署API服务对于希望快速搭建起能够提供对外接口的服务而言，可以考虑利用现有的硬件设施——例如配备有RTX 4090 GPU的机器来加速整个过程。具体来说，就是先按照正常流程启动相应的Python应用程序，并监听特定端口等待外部请求的到来[^4]。 ```python from transformers import AutoModelForCausalLM, AutoTokenizer import torch tokenizer = AutoTokenizer.from_pretrained("path_to_your_model_directory") model = AutoModelForCausalLM.from_pretrained("path_to_your_model_directory").to('cuda') def generate_response(prompt_text): inputs = tokenizer(prompt_text, return_tensors="pt").input_ids.to('cuda') outputs = model.generate(inputs) response = tokenizer.decode(outputs[0], skip_special_tokens=True) return response ``` 请注意替换上述代码中的路径变量为实际保存位置。 #### 数据准备与模型微调针对具体的任务需求收集整理一批高质量的数据集作为输入给定至算法内部参与迭代优化的过程当中去；这里以广告文案生成为例说明如何基于已有的基础之上进一步提升性能表现。首先获取所需语料库并将其转换成适合框架读取的形式之后再执行正式的学习环节。 ```bash # 假设已经获得了AdvertiseGen数据集压缩包advertise_gen.zip unzip advertise_gen.zip -d ./data/ # 使用transformers库提供的工具类处理原始文本序列使之成为可用于训练的有效样本 python preprocess.py --dataset_path=./data/ --output_dir=./processed_data/ ``` 接着定义好超参设置后就可以正式启动finetune程序啦！ ```bash CUDA_VISIBLE_DEVICES=0 python run_clm.py \ --train_file=./processed_data/train.json \ --validation_file=./processed_data/dev.json \ --do_train \ --do_eval \ --per_device_train_batch_size=8 \ --learning_rate=5e-5 \ --num_train_epochs=3 \ --save_steps=500 \ --output_dir=./results/ ``` 最后当一切就绪以后便可以通过简单的CLI交互方式来进行效果评估测试了。 ```bash echo "请描述一款科技感十足的新产品..." | python cli_inference.py --checkpoint_path=./results/checkpoint-best/ ```