Qwen3-1.7B 本地部署微调

### 本地部署与微调 Qwen3-1.7B 模型的方法 #### 环境配置在开始部署和微调 Qwen3-1.7B 模型之前，需要确保环境已正确配置。首先安装必要的库，包括 `unsloth`, `bitsandbytes`, `accelerate`, `xformers`, `peft`, `trl`, `triton`, `cut_cross_entropy`, `unsloth_zoo` 等工具包，以及 `sentencepiece`, `protobuf`, `datasets`, `huggingface_hub`, `hf_transfer` 等依赖库[^2]。 ```bash !pip install unsloth bitsandbytes accelerate xformers==0.0.29.post3 peft trl==0.15.2 triton cut_cross_entropy unsloth_zoo !pip install sentencepiece protobuf datasets huggingface_hub hf_transfer ``` #### 加载模型加载预训练的 Qwen3-1.7B 模型及其分词器，并使用 4-bit 量化版本以减少显存占用。设置最大序列长度为 2048，启用 4-bit 量化并禁用 8-bit 量化，同时采用 LoRA 方式进行微调。 ```python from unsloth import FastLanguageModel import torch model, tokenizer = FastLanguageModel.from_pretrained( model_name="unsloth/Qwen3-1.7B-unsloth-bnb-4bit", max_seq_length=2048, load_in_4bit=True, load_in_8bit=False, full_finetuning=False, # 使用 LoRA 方式微调 ) ``` #### 数据集准备为了微调模型，需要准备一个特定领域的数据集。例如，在构建猫娘角色时，可以创建包含用户输入和对应回复的数据集。每个样本应包含角色（user 或 assistant）和内容（具体的文本信息）。 ```json [ {"role": "user", "content": "我不爱你了！哼！"}, {"role": "assistant", "content": "喵~你真的不爱你了吗？那我可要伤心了哦..."} ] ``` #### 模型微调使用 Hugging Face 的 `Trainer` 类来执行微调任务。定义训练参数，如学习率、批量大小、训练轮数等，并指定输出目录和其他选项。通过将模型包装成 `get_peft_model` 来应用 PEFT（Parameter Efficient Fine-Tuning）技术，从而仅调整部分参数而保持大部分不变。 ```python from transformers import TrainingArguments, Trainer from peft import get_peft_model # 定义训练参数 training_args = TrainingArguments( output_dir="./results", learning_rate=1e-4, per_device_train_batch_size=8, num_train_epochs=3, weight_decay=0.01, ) # 应用 PEFT 技术 peft_config = LoraConfig(task_type="CAUSAL_LM", r=8, lora_alpha=16, target_modules=["q_proj", "v_proj"], lora_dropout=0.1) model = get_peft_model(model, peft_config) # 创建 Trainer 并开始训练 trainer = Trainer( model=model, args=training_args, train_dataset=train_dataset, data_collator=lambda data: dict(tokenizer.pad(data, padding=True, return_tensors="pt")), ) trainer.train() ``` #### 模型导出与部署完成微调后，将模型保存至指定路径以便后续使用或部署。可以通过 `save_pretrained` 方法将模型和分词器分别保存下来。此外，还可以利用 Hugging Face Hub 提供的功能将模型上传至云端供他人下载和使用。 ```python # 保存模型和分词器 model.save_pretrained("./fine_tuned_qwen3") tokenizer.save_pretrained("./fine_tuned_qwen3") # 上传至 Hugging Face Hub model.push_to_hub("my-fine-tuned-qwen3") tokenizer.push_to_hub("my-fine-tuned-qwen3") ``` #### 推理测试最后，可以在本地环境中加载经过微调的模型并对新输入进行预测。根据实际应用场景选择合适的解码策略（如贪婪搜索、束搜索等），并通过简单的接口调用来获取结果。 ```python # 加载微调后的模型 model, tokenizer = FastLanguageModel.from_pretrained( model_name="./fine_tuned_qwen3", max_seq_length=2048, load_in_4bit=True, ) # 进行推理 input_text = "我不爱你了！哼！" inputs = tokenizer(input_text, return_tensors="pt").to("cuda") outputs = model.generate(**inputs, max_new_tokens=50) response = tokenizer.decode(outputs[0], skip_special_tokens=True) print(response) ```

阅读全文

Qwen3-1.7B 本地部署微调

相关推荐

基于Qwen2.5-7B-Instruct的大模型微调实战指南

qwen2.5-7b vllm部署

Qwen-VL 远程GPU服务器部署实战

qwen3-1.7b微调

qwen2-72b本地部署

qwen2.5-72b本地部署

qwen2-0.5b本地部署怎么使用gpu

qwen2.5-7b本地部署微调

qwen2-7b本地部署微调

qwen2-VL的本地部署

Qwen2.5-VL的部署和微调

Qwen2-72B大模型微调入门实战（完整代码）

在对Qwen2.5-1.5B进行lora微调时如何设置目标模块

Qwen2-VL-2B如何微调

qwen2.5-vl本地cpu部署

Qwen2.5-0.5B-Instruct本地部署

qwen2.5-vl-32B的微调需要多大显存？

DeepSeek-R1-Distill-Qwen-1.5B本地部署教程

qwen-vl-chat 本地部署

QWen-Omin-7b本地部署

大家在看

KAD 只能脱机门禁管理系统.zip

CCF-CSP必学知识

开心小闹钟 V2.8 Beta 3 注册版

《OpenGL ES 3.x游戏开发 上卷》源码

松下kxp1121打印机驱动 官方最新版_支持win7

最新推荐

Linux入门上机实操.ppt

吉林大学Windows程序设计课件自学指南

STM32F10x ADC_DAC转换实战：精确数据采集与输出处理

麒麟系统编译动态库

Struts框架中ActionForm与实体对象的结合使用

STM32F10x定时器应用精讲：掌握基本使用与高级特性

stm32f407 __HAL_TIM_DISABLE(__HANDLE__)函数

PSP转换工具：强大功能助您轻松转换游戏文件

STM32F10x中断系统深入理解：优化技巧与高效处理机制

直线感应电机等效电路相量图

《OpenGL ES 3.x游戏开发上卷》源码

松下kxp1121打印机驱动官方最新版_支持win7

stm32f407 __HAL_TIM_DISABLE(HANDLE)函数