联想Y7000+4060显卡+16G内存+ubuntu22.04微调Qwen2.5-VL-2B

最新推荐文章于 2025-08-03 11:35:19 发布

铮铭

最新推荐文章于 2025-08-03 11:35:19 发布

阅读量1k

点赞数 5

CC 4.0 BY-SA版权

文章标签： transformer 深度学习 pytorch

本文链接：https://blog.csdn.net/hzm8341/article/details/144857099

主要参考的链接：https://juejin.cn/post/7439169215133597759

遇到的坑：

1、我的电脑是CUDA12.4，此时需要用python3.10，torch的安装用下面的命令：

conda install pytorch==2.5.0 torchvision==0.20.0 torchaudio==2.5.0 pytorch-cuda=12.4 -c pytorch -c nvidia

2、训练时，由于显存不够，需要修改配置参数：

val_config = LoraConfig(
    task_type=TaskType.CAUSAL_LM,
    target_modules=["q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj"],
    inference_mode=True,  # 训练模式
    r=4,#64,  # Lora 秩
    lora_alpha=1,#16,  # Lora alaph，具体作用参见 Lora 原理
    lora_dropout=0.05,  # Dropout 比例
    bias="none",
)

如上面所示修改，需要修改train.py中的2个地方，还有下面的部分

# 设置SwanLab回调
swanlab_callback = SwanLabCallback(
    project="Qwen2-VL-finetune",
    experiment_name="qwen2-vl-coco2014",
    config={

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

铮铭

关注关注

5
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-Gradio快速体验（十四）

以微薄之力，予他人些许温暖.

09-20

2万+

Qwen2.5-7B-Instruct集成Gradio和vLLM

DeepSeek-VL2实战指南：一步步构建您自己的智能视觉问答系统！

SJJS_1的博客

02-07

3987

DeepSeek-VL2，这是一系列先进的大型混合专家 (MoE) 视觉语言模型，其显著改进了其前身 DeepSeek-VL。DeepSeek-VL2 在各种任务中都表现出卓越的能力，包括但不限于视觉问答、光学字符识别、文档/表格/图表理解和视觉基础。我们的模型系列由三个变体组成：DeepSeek-VL2-Tiny、DeepSeek-VL2-Small 和 DeepSeek-VL2，分别具有 1.0B、2.8B 和 4.5B 激活参数。

参与评论您还未登录，请先登录后发表或查看评论

部署及运行Qwen2.5-VL-7B-4bit

CJK's Blog

04-16

653

【代码】部署qwen2.5-VL-7B。

llamafactory报错：双卡4090GPU，训练qwen2.5:7B、14B时报错GPU显存不足（out of memory），轻松搞定~~~

Ven%的博客

12-27

2765

使用llamafactory进行微调qwen2.5 7B和14B的大模型时，会出现out of memory的报错。尝试使用降低batch_size（原本是2，现在降到1）的方式，可以让qwen2.5:7B跑起来，但时不时会不稳定，还是会报这个错误；微调14B的话，直接就报错了，根本跑起来。（显卡配置为两张23G的4090显卡，显存一共46G）目测lora微调显存的大小是模型本身大小的3倍以上，才能正常跑起来。注: 若不知道这个配置的代表什么含义的话，可以看这一篇。

Ubuntu22.04本地部署qwen模型、jupyterlab开发环境、LoRA微调全流程

weixin_42118737的博客

05-18

3546

这段时间在自己的Win11系统上部署了chatGLM以及Qwen模型，进行对话、推理以及工具调用都没有问题，但是在尝试进行微调的时候发现好像并不能成功，因此花费了很大的力气，又分别在ubuntu桌面版、windows子系统WSL2 Ubuntu上部署了Qwen模型，并尝试进行LoRA的微调实践。由于过程比较多，步骤较为繁琐，我可能会分几个部分进行叙述。首先介绍一下我的两个环境（平民玩家，勿喷）：一台笔记本安装的Ubuntu22.04桌面版：显卡是1070M 8G。

DINOv2+Qwen2.5-VL-2B+LoRA实现image caption的微调

hzm8341的博客

01-06

1115

本文的打算是一步步的实现Diffusion VLA的论文思路，之前用ResNet50提取图像特征，现在换成了DINOv2。

基于Qwen2.5-7B-Instruct的大模型微调实战指南

11-18

内容概要：本文档详细介绍了如何使用Qwen2.5-7B-Instruct大模型进行微调的具体步骤。主要内容包括环境搭建、预训练模型下载、微调准备工作、具体微调流程以及如何启用外部记录面板等。通过本文档，读者可以逐步掌握...

Ubuntu 22.04部署Qwen2.5-VL-7B-Instruct-GGUF

03-18

引用[2]提到用户之前使用过联想Y7000配置的机器，安装了4060显卡、16G内存和Ubuntu 22.04，微调过Qwen2.5-VL-2B模型。现在用户想部署7B的GGUF版本，可能需要类似的环境配置。首先，安装GGUF模型通常需要llama.cpp...

ollama-qwen2.5-vl 千问大模型图片推理GUI窗口程序

05-17

ollama-qwen2.5-vl 千问大模型图片需要使用代码构架推理过程，不太方，于是写了个GUI界面工具，需要提前装好ollama和qwen2.5vl 模型，即可使用此ui界面，推理了，阿弥陀佛。

Qwen2.5-VL多模态大模型windows11+RTX4060本地部署推理教学

weixin_42120140的博客

03-31

773

qwen2.5-vl 有3B/7B/32B/72B模型，Qwen/Qwen2.5-VL-3B-Instruct指的是下载3B模型，目前单张RTX4060的8G显存只支持3B的模型推理，如果有多张显卡可以考虑大点的模型，显存参考：显存>2。主要是torch安装的为cpu版本，如果pip安装不了cuda版本的torch，需要手动下载安装，解决方法有两种，1手动下载安装包，2.pip安装指定官网地址。2.Qwen2.5-vl支持高清图片，图片输入尺寸太大，导致显存溢出，需要缩小图片大小。问题主要是显存大小不够，

从零开始本地部署Qwen-vl-chat-7B

UCAS_HMM的博客

12-27

358

硬件设备 CPU：i5-12400F MEM：16GB 3200Hz SSD：1TB GPU：RTX 4060Ti 8GB

Unsloth微调Qwen2.5-vl-3B-4bit版本

weixin_58447899的博客

03-22

1782

记录微调 Qwen2.5-vl-3B-4bit的过程，使用windows的WSL-Ubuntu22.04部署。

多模态理解-Qwen-VL系列：Qwen-VL, Qwen2-VL, Qwen2.5-VL

u012374012的专栏

03-10

2538

Qwen-VL基于预训练好的Qwen-7B，支持等功能。

深度学习踩坑记录（持续更新ing）

芒果不茫的博客

03-12

2544

记录博主调试代码过程中碰到难以解决的bug

超乎想象的精准—探索Qwen2.5-vl的识别魔法

烤鸭的世界我们不懂的博客

03-17

1505

大家好，我是烤鸭：今天写一篇使用开源的视频模型来进行图像/视频识别，使用的是千问模型qwen-vl-2B。

离线部署视觉模型Qwen2.5-VL方案【企业应用级】

A15216110998的专栏

03-17

4830

公司网络是有严格限制，所有涉及境外服务器的网站都无法访问，包括docker等镜像源。本教程，是在提前下载或构建好资源，通过上传到服务器后，做离线部署。

使用yolo11训练饮料瓶盖缺陷检测质量检测数据集VOC+YOLO格式1432张5类别步骤和流程