BitDelta开源项目教程-CSDN博客

本文链接：https://blog.csdn.net/gitblog_00040/article/details/147361564

BitDelta开源项目教程

BitDelta 项目地址: https://gitcode.com/gh_mirrors/bi/BitDelta

1. 项目介绍

BitDelta是一个旨在减少GPU内存需求的开源项目，它通过将微调模型的权重变化压缩至1 bit，从而实现高效的模型多租户服务。这种技术不仅揭示了微调过程中信息添加的潜在冗余性，而且对于模型的存储和服务有着重要的意义。BitDelta能够将GPU内存需求减少10倍以上，这对于多租户环境下的生成延迟提升尤为关键。该项目已成功应用于Llama-2和Mistral模型家族，并在高达70B参数的模型上进行了验证，展现了在所有测试设置中极小的性能下降。

2. 项目快速启动

环境准备

首先，您需要克隆BitDelta仓库并设置环境：

git clone https://github.com/FasterDecoding/BitDelta.git
cd BitDelta
conda create -yn bitdelta python=3.9
conda activate bitdelta
pip install -e .

模型压缩示例

以下是一个模型压缩的示例，我们将使用lmsys/vicuna-7b-v1.5模型和meta-llama/Llama-2-7b-hf基础模型：

CUDA_VISIBLE_DEVICES=0,1 python \
bitdelta/train.py \
--base_model meta-llama/Llama-2-7b-hf \
--finetuned_model lmsys/vicuna-7b-v1.5 \
--save_dir $MODEL_SAVE_DIR \
--batch_size 4 \
--num_steps 200 \
--save_full_model True

请确保您已经设置了$MODEL_SAVE_DIR变量，以指定压缩模型的保存目录。

性能验证

压缩完成后，您可以通过以下命令验证压缩模型的困惑度（Perplexity）：

CUDA_VISIBLE_DEVICES=0 python \
bitdelta/eval_ppl.py \
--base_model meta-llama/Llama-2-7b-hf \
--dataset_name wikitext \
--subset wikitext-2-raw-v1 \
--save_dir $PPL_SAVE_DIR \
--num_eval_samples 100 \
--model_diff $MODEL_SAVE_DIR/diff.pt

确保您已经设置了$PPL_SAVE_DIR变量，以指定困惑度结果的保存目录。