【项目实战】AI大模型微调指南:情绪对话模型的数据工程深度解析(含代码),超详细,小白也能看懂!

AI大模型的微调每个步骤都学完后了,做一个实际的小项目来巩固学习内容,串联下知识点,学以致用。本文最后将微调的所有教程都免费分享给大家,有兴趣的同学可以看看。

一、整体流程

  1. 需求分析

  2. 数据方案

  3. 模型选择

  4. 模型训练、评测

  5. 模型部署

二、需求分析

确定任务类型

确定微调的具体目标,如文本分类、情感分析、问答系统等。明确项目的业务需求和预期效果。

三、数据方案

1、明确数据集的来源

  • a、甲方提供;

  • b、自己收集(成本较高,难度较大);

    数据的获取方式:手动采集、爬虫、数据接口、AI生成;

2、数据清洗、标注 

标注:自动化标注,人工处理;

3、指定数据集格式

一般为QA文档形式。

4、本项目的数据来源 

基于现有开源数据,让AI实现情绪数据制作;

安装一些依赖包:

# 智普AI接口pip install zhipuai# 加载Embeddingmodelpip install sentence_transformers# 魔塔社区pip install modelscope

具体的实现代码如下:《AI数据标注脚本.py》

import jsonimport timeimport randomfrom zhipuai import ZhipuAIfrom sentence_transformers import SentenceTransformerimport numpy as np
"""示例数据:# 用户输入库(可自定义扩展)    user_inputs = [        "今天心情不太好", "推荐个电影吧", "怎么才能早睡早起",        "养猫好还是养狗好", "工作压力好大", "最近总是失眠"    ]"""# 初始化模型client = ZhipuAI(api_key="你自己的key")  # 替换为你的API Key#加载Embeddingmodelstyle_model = SentenceTransformer(r"D:\Test\LLMTrain\day15\embedding_model\zy\text2vec-base-chinese-sentence")
#===============================#1.风格模板配置(修正消息格式)#================================style_config = {    "温柔":{        "system_prompt":"你是一个温柔体贴的聊天助手,说话时总是充满关怀,使用以下特征:\n1. 包含'呢、呀、啦'等语气词\n2. 使用🌸💖😊等温暖表情\n3. 主动询问用户感受",        "examples": [            {"role": "user", "content": "今天好累啊"},            {"role": "assistant", "content": "辛苦啦~ 要给自己泡杯热茶放松一下吗?🌸"},            {"role": "user", "content": "考试没考好..."},            {"role": "assistant", "content": "没关系的呀~ 下次一定会更好!需要我陪你聊聊吗?😊"}        ],     "temperature": 0.3    },    "毒舌":{        "system_prompt":"你是一个喜欢用犀利吐槽表达关心的朋友,需满足:\n1. 使用网络流行语(如'栓Q''退退退')\n2. 包含夸张比喻('你这速度堪比树懒')\n3. 结尾隐藏关心",        "examples": [            {"role": "user", "content": "又胖了5斤!"},            {"role": "assistant", "content": "好家伙!你这是要把体重秤压成分子料理?🏋️"},            {"role": "user", "content": "游戏又输了"},            {"role": "assistant", "content": "菜就多练练!需要给你推荐《从零开始的电竞之路》吗?🎮"}        ],     "temperature": 0.7    },}
#========================#生成函数(修正消息的结构)#========================
def generate_style_data(style_name, num_samples=50):    config = style_config[style_name]    data = []
    # 构建消息上下文(包含系统提示和示例对话)    messages = [        {"role": "system", "content": config["system_prompt"]},        *config["examples"]  # 直接展开示例对话    ]
    # 用户输入库(可自定义扩展)    user_inputs = [        "今天心情不太好", "推荐个电影吧", "怎么才能早睡早起",        "养猫好还是养狗好", "工作压力好大", "最近总是失眠"    ]
    for _ in range(num_samples):        try:            # 随机选择用户输入            user_msg = random.choice(user_inputs)
            # 添加当前用户消息            current_messages = messages + [                {"role": "user", "content": user_msg}            ]
            # 调用API(修正模型名称)            response = client.chat.completions.create(                model="glm-3-turbo",                messages=current_messages,                temperature=config["temperature"],                max_tokens=100            )
            # 获取回复内容(修正访问路径)            reply = response.choices[0].message.content
            # 质量过滤(数据审核)            if is_valid_reply(style_name, user_msg, reply):                data.append({                    "user": user_msg,                    "assistant": reply,                    "style": style_name                })
            time.sleep(1.5)  # 频率限制保护
        except Exception as e:            print(f"生成失败:{str(e)}")
    return data
def is_valid_reply(style, user_msg, reply):    """质量过滤规则(添加空值检查)"""    # 基础检查    if not reply or len(reply.strip()) == 0:        return False
    # 规则1:回复长度检查    if len(reply) < 5 or len(reply) > 150:        return False
    # 规则2:风格关键词检查    style_keywords = {        "温柔": ["呢", "呀", "😊", "🌸"],        "毒舌": ["好家伙", "栓Q", "!", "🏋️"]    }    if not any(kw in reply for kw in style_keywords.get(style, [])):        return False
    # 规则3:语义相似度检查    try:        ref_text = next(msg["content"] for msg in style_config[style]["examples"]                        if msg["role"] == "assistant")        ref_vec = style_model.encode(ref_text)        reply_vec = style_model.encode(reply)        similarity = np.dot(ref_vec, reply_vec)        return similarity > 0.65    except:        return False
#=============================#3.执行生成(添加容错)#============================if __name__ == '__main__':    all_data = []
    try:        print("开始生成温柔风格数据...")        gentle_data = generate_style_data("温柔", 50)        all_data.extend(gentle_data)
        print("开始生成毒舌风格数据...")        sarcastic_data = generate_style_data("毒舌", 50)        all_data.extend(sarcastic_data)
    except KeyboardInterrupt:        print("\n用户中断,保存已生成数据...")    finally:        with open("style_chat_data.json", "w", encoding="utf-8") as f:            json.dump(all_data, f, ensure_ascii=False, indent=2)        print(f"数据已保存,有效样本数:{len(all_data)}")

 这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

代码说明

(1)Embding模型 text2vec-base-chinese-sentence

用到“语义相似度检查”,使用Embding模型text2vec-base-chinese,需要从魔塔社区下载到本地。下载的代码:​​​​​​​

# 魔塔社区地址:https://modelscope.cn/models/thomas/text2vec-base-chinese#模型下载from modelscope import snapshot_downloadmodel_dir = snapshot_download('thomas\text2vec-base-chinese',cache_dir=r"D:\Test\LLMTrain\day15\embedding_model")

再进行归一化处理,《model_convert.py》​​​​​​​

import numpy as npfrom sentence_transformers import SentenceTransformer,models
model_path = r"D:\Test\LLMTrain\day15\embedding_model\thomas\text2vec-base-chinese"bert = models.Transformer(model_path)pooling = models.Pooling(bert.get_word_embedding_dimension(),                        pooling_mode='mean')
# 添加缺失的归一化层normalize = models.Normalize()
# 组合完整模型full_model = SentenceTransformer(modules=[bert, pooling, normalize])print(full_model)
save_path=r"D:\Test\LLMTrain\day15\embedding_model\zy\text2vec-base-chinese-sentence"full_model.save(save_path)
# 加载修复后的模型model = SentenceTransformer(r"D:\Test\LLMTrain\day15\embedding_model\zy\text2vec-base-chinese-sentence")
# 验证向量归一化text = "测试文本"vec = model.encode(text)print("vec:", vec)  # 输出向量print("修正后模长:", np.linalg.norm(vec))  # 应输出≈1.0

(2)生成的结果

结果会生成到 style_chat_data.json中,截取部分数据如下:​​​​​​​

[  {    "user": "推荐个电影吧",    "assistant": "当然可以呀!你想看什么类型的电影呢?是想要放松一下看看喜剧,还是想要沉浸在一个深刻的剧情里呢?🎬💖",    "style": "温柔"  },{    "user": "最近总是失眠",    "assistant": "哎呀,失眠真的很困扰人呢。是不是压力太大或者是有什么烦心的事情呢?我们可以一起想想办法缓解一下失眠的症状哦。💖",    "style": "温柔"  },{    "user": "养猫好还是养狗好",    "assistant": "这还用问吗?当然是养猫好啊!猫咪简直就是家里的小太阳,温柔、独立、还会自己上厕所,简直就是现代都市丽人的完美宠物!相比之下,狗狗就是个“四脚麻烦精”,天天黏人、破坏家具,还要定期遛弯,简直就是养了个“大型儿童”!栓Q了,我还是继续吸猫吧!😹",    "style": "毒舌"  }

注意:运行《AI数据标注脚本.py》生成的数据,确认下是否能够符合需求,若可行的话,项目就可以接着做,若不可行,则AI生成数据的方式行不通。

确定AI数据标注脚本的可行性后,还需要确定原始数据input_data ,该数据可以从开源的中文语料库中筛选,以下为开源语料库的说明。

3、开源的中文会话语料库

推荐大型清洁汉语会话语料库(LCCC),其中包含:LCCC-base 和 LCCC-large。为了保证语料库的质量,设计了严格的数据清洗流水线。该管道涉及一组规则和几个基于分类器的过滤器。诸如攻击性或敏感词、特殊符号、表情符号、语法错误的句子和不连贯的对话等噪音都会被过滤掉。

github地址:

https://github.com/thu-coai/CDial-GPT/tree/master

魔塔社区上下载:

https://modelscope.cn/datasets/OmniData/LCCC/files

该语料库里有很多数据,我们可以挑选1000条左右具有代表性的数据存入json里,再调整《AI数据标注脚本.py》,将json里的数据赋值给 user_inputs 变量即可。

四、大模型选型方案

1、大模型选型

(1)根据需求,需要大模型在中文的理解、对话方面有较强的能力。所以首选国内开源的大模型,比如DeepSeek,QWen,ChatGLM等。综合比较能力强弱: DeepSeek > QWen >ChatGLM,但是DeepSeek太大,不便微调和部署,所以选择 QWen系列。

(2)QWen系列的NPL大模型有几种,结尾带-Instruct、 -Chat 等。带这2种后缀是基于基础模型, 进一步训练以增强其在具体应用场景中的表现,特别是对于需要理解并执行人类语言指令的任务。如果你的应用场景涉及到与用户交互或需要模型理解复杂的指令来完成特定任务,那么选择带有 -Instruct或-Chat 后缀的版本可能会更加合适。

综合考虑,我们先选择 Qwen/Qwen2.5-3B-Instruct 和Qwen/Qwen1.5-4B-Chat 作为候选大模型 。

2、客观评估

当前任务为日常聊天对话模型,主要要求模型的中文理解能力,因此这里以 CLUE (中文理解)数据进行 评测。在安装了opencompass的环境中执行命令查询CLUE相关数据集。​​​​​​​

(opencompass) /project/opencompass# python tools/list_configs.py clue
# 结果有删减+-----------------------------+------------------------------------------------------------------------------+| Dataset                     | Config Path                                                                  ||-----------------------------+------------------------------------------------------------------------------|| CLUE_C3_gen                 | opencompass/configs/datasets/CLUE_C3/CLUE_C3_gen.py                          || CLUE_C3_gen_8c358f          | opencompass/configs/datasets/CLUE_C3/CLUE_C3_gen_8c358f.py                   || CLUE_C3_ppl                 | opencompass/configs/datasets/CLUE_C3/CLUE_C3_ppl.py                          || CLUE_ocnli_gen_51e956       | opencompass/configs/datasets/CLUE_ocnli/CLUE_ocnli_gen_51e956.py             || FewCLUE_bustm_gen           | opencompass/configs/datasets/FewCLUE_bustm/FewCLUE_bustm_gen.py              || FewCLUE_bustm_gen_634f41    | opencompass/configs/datasets/FewCLUE_bustm/FewCLUE_bustm_gen_634f41.py       || FewCLUE_bustm_ppl           | opencompass/configs/datasets/FewCLUE_bustm/FewCLUE_bustm_ppl.py              || FewCLUE_bustm_ppl_4b16c0    | opencompass/configs/datasets/FewCLUE_bustm/FewCLUE_bustm_ppl_4b16c0.py       || FewCLUE_csl_gen_28b223      | opencompass/configs/datasets/FewCLUE_csl/FewCLUE_csl_gen_28b223.py           || FewCLUE_csl_gen_87f4a8      | opencompass/configs/datasets/FewCLUE_csl/FewCLUE_csl_gen_87f4a8.py           || FewCLUE_csl_ppl             | opencompass/configs/datasets/FewCLUE_csl/FewCLUE_csl_ppl.py                  || FewCLUE_csl_ppl_769f8d      | opencompass/configs/datasets/FewCLUE_csl/FewCLUE_csl_ppl_769f8d.py           || FewCLUE_csl_ppl_841b62      | opencompass/configs/datasets/FewCLUE_csl/FewCLUE_csl_ppl_841b62.py           || FewCLUE_ocnli_fc_gen        | opencompass/configs/datasets/FewCLUE_ocnli_fc/FewCLUE_ocnli_fc_gen.py        || FewCLUE_ocnli_fc_gen_f97a97 | opencompass/configs/datasets/FewCLUE_ocnli_fc/FewCLUE_ocnli_fc_gen_f97a97.py || FewCLUE_ocnli_fc_ppl        | opencompass/configs/datasets/FewCLUE_ocnli_fc/FewCLUE_ocnli_fc_ppl.py        || FewCLUE_tnews_gen           | opencompass/configs/datasets/FewCLUE_tnews/FewCLUE_tnews_gen.py              || FewCLUE_tnews_gen_b90e4a    | opencompass/configs/datasets/FewCLUE_tnews/FewCLUE_tnews_gen_b90e4a.py       || FewCLUE_tnews_ppl           | opencompass/configs/datasets/FewCLUE_tnews/FewCLUE_tnews_ppl.py              || FewCLUE_tnews_ppl_fff486    | opencompass/configs/datasets/FewCLUE_tnews/FewCLUE_tnews_ppl_fff486.py       |+-----------------------------+------------------------------------------------------------------------------+、

当前任务大多是短语对话,可以选择 FewCLUE_bustm_gen (短文本分类)、FewCLUE_ocnli_fc_gen(自然语言推理)对预期模型进行评估。

注意:若不清楚到底使用哪个数据集评估,可以将搜索:比如 (1)我想做一个法律类的大模型评判,开源的数据集有哪些?(2)我是做新闻分类的大模型评判,开源的数据集有哪些?

我们将上一步选择的那2个大模型和这2个数据集进行OpenCompass评测,使用“命令行”方式,步骤如下:

  • (1)将2个大模型下载到本地;

  • (2)调整这2个大模型在OpenCompass里的配置文件,主要调整path值为本地目录;

  • (3)执行评测命令:

python run.py \--models hf_qwen2_5_3b_instruct hf_qwen1_5_4b_chat \--datasets FewCLUE_bustm_gen FewCLUE_ocnli_fc_gen \--debug

评估的结果如下:​​​​​​​

dataset        version    metric    mode      qwen2.5-3b-instruct-hf    qwen1.5-4b-chat-hf-------------  ---------  --------  ------  ------------------------  --------------------bustm-dev      5cc669     accuracy  gen                        63.75                 54.37bustm-test     5cc669     accuracy  gen                        64.22                 53.61ocnli_fc-dev   51e956     accuracy  gen                        50.62                 61.25ocnli_fc-test  51e956     accuracy  gen                        46.47                 65.99

综合来看,qwen1.5-4b-chat的效果更好一些。

注意:

(1)gen(生成类)的数据集得分越高越好,ppl(困惑度)的数据集得分越低越好。

(2)对比大模型,一般分类 几种:

  • 相同大模型、相同版本,不同参数量大小;

  • 相同大模型、不同版本;

  • 不同大模型;

(3)模型参数量的大小如何选择?

  • 服务器的配置(成本预算);

  • 任务的复杂度(需求、特点);

五、大模型微调训练

1、大模型微调训练的框架选型

大模型微调训练的框架有 LLama Factory 和 XTuner 。

(1)微调过程中,我们的这个项目的结果偏向于主观的评测(对话风格没有标准答案)XTuner在微调过程中就提供了主观评测,所以推荐使用XTuner来微调训练。

(2)若偏向于客观(指标)评测,可以使用LLama Factory 。LLama Factory 在微调过程中,只能看到loss曲线数据,看不到主观的 评测数据。

2、制作XTuner微调的数据集

将《数据方案》中生成的对话数据集style_chat_data.json 转成XTuner支持的格式。无需写代码,直接让AI工具帮我们转。比如,使用ChatGPT的提示词:​​​​​​​

你按照以下步骤转换一个json文件:-读取附件里的json文件;-转成一个新的json文件,新json文件的格式如下:[{    "conversation":[        {            "system": "xxx",            "input": "xxx",            "output": "xxx"        }    ]}] ,-源user节点对应input节点;-assistant节点等于style节点\n再加上output节点;  -源json中style节点若为“温柔”,则新json中system的值为“你是一个温柔体贴的聊天助手,说话时总是充满关怀,使用以下特征:\n1. 包含'呢、呀、啦'等语气词\n2. 使用🌸💖😊等温暖表情\n3. 主动询问用户感受” ;源json中style节点若为“毒舌”,则新json中system的值为“你是一个喜欢用犀利吐槽表达关心的朋友,需满足:\n1. 使用网络流行语(如'栓Q''退退退')\n2. 包含夸张比喻('你这速度堪比树懒')\n3. 结尾隐藏关心”;-下载新的json文件

3、XTuner大模型微调

3.1 修改配置文件

修改配置文件:

 qwen1_5_4b_chat_qlora_alpaca_e3.py

  • (1)大模型本地地址;data_files路径;

  • (2)max_length:216;

  • (2)batch_size:10;

  • (3)max_epochs:3000

  • (4)验证数据:从数据集中选至少5条,并且每条问题要有多种风格场景(温柔+毒舌),这样才更加便捷的判断微调的效果;

  • (5)qlora:改为8位的;

  • (6)lora-r:64,lora-alpha=128;(2倍关系)

  • (7)dataset:path=json

3.2 微调什么时候可以停止?(收敛)

在微调初期,需要观察loss的值一定要是下降趋势,观察期大概20分钟左右,至少走1个完整的步长。微调停止的校验有2条:

  • (1)几条验证数据必须要完全与预期的效果一致(与数据集基本一样)后才可以停止。

  • (2)loss的变化率很小,大概0.5左右就可以停止了。

实测情况:

(1)使用一张RTX 4090(24G)显卡,跑了1个小时多,loss从3.1下降到0.5左右,检查那几条验证数据,基本符合要求(拟合/收敛),就可以停下来了。我服务器配置如下:

(2)我们需要能够看懂执行的输出日志!

(3)验证对话中若发现,相同问题,问多次每次的答案都是一样的,则说明过拟合了。

3.3 微调训练、模型合并和转换

 执行微调训练的命令,显卡4090的服务器跑了1个小时左右。

nohup xtuner train  qwen1_5_4b_chat_qlora_alpaca_e3.py &

执行模型合并命令

xtuner convert pth_to_hf ./qwen1_5_4b_chat_qlora_alpaca_e3.py /root/autodl-tmp/project/xtuner/work_dirs/qwen1_5_4b_chat_qlora_alpaca_e3/iter_23500.pth  /root/autodl-tmp/llm/hf 

执行模型转换命令

xtuner convert merge  /root/autodl-tmp/llm/Qwen/Qwen1.5-4B-Chat /root/autodl-tmp/llm/hf   /root/autodl-tmp/llm/Qwen1.5-4B-Chat-hf

完成后,我们微调出来的大模型就成功诞生了。新的大模型保存的目录是 /root/autodl-tmp/llm/Qwen1.5-4B-Chat-hf  。

 这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

六、验证模型效果

微调训练好的大模型,需要使用推理框架验证其效果。推理框架一般有 LMDeploy、vLLM、SGLang、 Xinference等。

需要特别注意的是,微调训练的框架XTuner使用的对话模型与推理框架并不一致,因为在使用推理框架的时候,需要与XTuner对话模型对齐。

1、如何对齐对话模版?

一般我们会在推理框架运行微调后的大模型命令中指定对话模版,该对话模版就是从XTuner内置的对话模版转换来的。

2、XTuner对话模版转LMDeploy支持的json格式

思路:可以使用大模型来帮我们写实现代码,推荐使用DeepSeek来写代码。

LMDeploy的自定义对话模版的官方文档地址:

https://lmdeploy.readthedocs.io/zh-cn/latest/advance/chat_template.html

根据DeepSeek提供的代码写一个python文件,chat_tmpl_json_gen.py​​​​​​​

import json
# 原始对话模板配置,根据自己选择的大模型,取xtuner/xtuner/utils/templates.py里找对应的内容qwen_chat = dict(    SYSTEM="<|im_start|>system\n{system}<|im_end|>\n",    INSTRUCTION="<|im_start|>user\n{input}<|im_end|>\n<|im_start|>assistant\n",    SUFFIX="<|im_end|>",    SUFFIX_AS_EOS=True,    SEP="\n",    STOP_WORDS=["<|im_end|>", "<|endoftext|>"])
# 转换逻辑converted = {    "model_name": "qwen-chat",    "system": qwen_chat["SYSTEM"].split("{system}")[0],          # 提取系统起始标记    "meta_instruction": "You are a robot developed by LMDeploy.",# 默认系统指令    "eosys": qwen_chat["SYSTEM"].split("{system}")[1].strip(),   # 提取系统结束标记    "user": "<|im_start|>user\n",                               # 用户起始标记    "eoh": "<|im_end|>\n",                                      # 用户结束标记    "assistant": "<|im_start|>assistant\n",                     # 助理起始标记    "eoa": qwen_chat["SUFFIX"],                                 # 助理结束标记    "separator": qwen_chat["SEP"],    "capability": "chat",    "stop_words": [qwen_chat["STOP_WORDS"][0]]                  # 只保留第一个停止词}
# 保存为JSON文件with open("qwen_chat_template.json", "w", encoding="utf-8") as f:    json.dump(converted, f, indent=4, ensure_ascii=False)
print("转换完成!生成的JSON文件已保存为 qwen_chat_template.json")

LMDeploy运行大模型时指定该json文件

lmdeploy serve api_server /root/autodl-tmp/llm/Qwen1.5-4B-Chat-hf --chat-template ./qwen_chat_template.json

3、XTuner对话模版转vLLM支持的jinja2格式​​​​​​​

import re
# 原始对话模板配置,根据自己选择的大模型,取xtuner/xtuner/utils/templates.py里找对应的内容original_qwen_chat = dict(    SYSTEM=("<|im_start|>system\n{system}<|im_end|>\n"),    INSTRUCTION=("<|im_start|>user\n{input}<|im_end|>\n" "<|im_start|>assistant\n"),    SUFFIX="<|im_end|>",    SUFFIX_AS_EOS=True,    SEP="\n",    STOP_WORDS=["<|im_end|>", "<|endoftext|>"],)
# 转换函数def convert_template(template):    converted = {}    for key, value in template.items():        if isinstance(value, str):            # 将 {variable} 格式转换为 {{ variable }}            converted_value = re.sub(r'\{(\w+)\}', r'{{ \1 }}', value)            converted[key] = converted_value        else:            converted[key] = value    return converted
# 执行转换jinja2_qwen_chat = convert_template(original_qwen_chat)print(jinja2_qwen_chat)

将打印的内容保存到jinja格式的文件中,vLLM运行大模型时候指定该jinja文件。

vllm serve /root/autodl-tmp/llm/Qwen1.5-4B-Chat-hf --chat-template ./qwen-chat-template.jinja

4、LMDeploy运行和验证微调后的大模型

第3步使用LMDeploy命令启动微调后的大模型后,写个代码调用大模型的对话功能。创建chat_to_llm.py文件。​​​​​​​

#多轮对话from openai import OpenAI
#定义多轮对话方法def run_chat_session():    #初始化客户端    client = OpenAI(base_url="http://localhost:23333/v1/",api_key="token-abc123")    #初始化对话历史    #chat_history = []    #启动对话循环    while True:
        chat_history = []        #获取用户输入        user_input = input("用户:")        if user_input.lower() == "exit":            print("退出对话。")            break        #更新对话历史(添加用户输入)        chat_history.append({"role":"user","content":user_input})        #调用模型回答        try:            chat_complition = client.chat.completions.create(messages=chat_history,model="/root/autodl-tmp/llm/Qwen1.5-4B-Chat-hf")            #获取最新回答            model_response = chat_complition.choices[0]            print("AI:",model_response.message.content)            #更新对话历史(添加AI模型的回复)            #chat_history.append({"role":"assistant","content":model_response.message.content})        except Exception as e:            print("发生错误:",e)            breakif __name__ == '__main__':    run_chat_session()

对话效果如下:

七、Streamlit搭建前端交互

1、Streamlit定义

Streamlit 是一个基于 Python 的开源 Web 应用程序框架,专为数据科学家和机器学习工程师设计,用于快速创建数据可视化应用。它的主要优势在于简单性和快速迭代,用户可以使用几行代码创建交互式应用,无需深入了解前端技术如 HTML、CSS 等。

2、Streamlit 特点

  • 易于使用:Streamlit 的设计哲学是简洁性,它允许用户通过简单的 Python 脚本快速构建 Web 应用。

  • 即时预览:Streamlit 应用在编写代码时可以实时预览,这使得开发过程更加高效。

  • 强大的交互性:Streamlit 提供了多种交互组件,如按钮、滑块、文本输入等,使得创建交互式应用变得简单。

  • 数据可视化:支持多种图表库,如 Matplotlib、Altair 等,方便进行数据可视化。

  • 适用于快速原型设计:适合快速开发和展示数据分析结果,特别适用于个人或小团队。

3、编写代码

上面已经使用LMDeploy将微调后的大模型运行起来了。我们可以使用Streamlit搭建一个前端站点与该大模型进行交互。

pip install streamlit

创建文件 chat_app.py​​​​​​​

import streamlit as stfrom openai import OpenAI
# 初始化客户端client = OpenAI(base_url="http://localhost:23333/v1/", api_key="suibianxie")
# 设置页面标题st.title("项目一效果演示")
# 初始化session状态(仅用于显示历史)if "messages" not in st.session_state:    st.session_state.messages = []
# 显示历史消息for message in st.session_state.messages:    with st.chat_message(message["role"]):        st.markdown(message["content"])
# 获取用户输入if prompt := st.chat_input("请输入您的问题,或输入exit退出"):    # 处理退出命令    if prompt.lower() == "exit":        st.info("退出对话。")        st.stop()
    # 添加用户消息到显示历史    st.session_state.messages.append({"role": "user", "content": prompt})    with st.chat_message("user"):        st.markdown(prompt)
    try:        # 发起API请求(每次只发送当前消息)        response = client.chat.completions.create(            messages=[{"role": "user", "content": prompt}],  # 每次只发送当前问题            model="/root/autodl-tmp/llm/Qwen1.5-4B-Chat-hf"        )
        # 获取模型回复        model_response = response.choices[0].message.content
        # 添加AI回复到显示历史        st.session_state.messages.append({"role": "assistant", "content": model_response})        with st.chat_message("assistant"):            st.markdown(model_response)
    except Exception as e:        st.error(f"发生错误:{e}")

执行命令

streamlist run chat_app.py

 当你运行上述命令后,Streamlit 会自动在默认的 Web 浏览器中打开应用页面。 

效果还是不错滴!至此实战全部完成!其中细节还需要多多揣摩!

 大模型&AI产品经理如何学习

求大家的点赞和收藏,我花2万买的大模型学习资料免费共享给你们,来看看有哪些东西。 

 这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

 

1.学习路线图

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。


2.视频教程

网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。

(都打包成一块的了,不能一一展开,总共300多集)

因篇幅有限,仅展示部分资料,需要点击下方图片前往获取

3.技术文档和电子书 

这里主要整理了大模型相关PDF书籍、行业报告、文档,有几百本,都是目前行业最新的。



4.LLM面试题和面经合集


这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。



👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集***

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序员辣条

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值