ChatGLM-6B LLM大模型使用;P-Tuning微调;prompt角色扮演history;web streamlit交互页面

本文介绍了ChatGLM-6B大模型的使用,包括安装环境、API多进程高并发的实现,以及P-Tuning v2微调的详细步骤。在微调过程中遇到的问题及解决方案,并分享了如何通过gradio和streamlit创建交互式web页面进行对话体验。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。

本机显卡只有6G(GTX 1660 Ti),所以刚好可以使用,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存),可以去下面参考链接下载对应模型

参考:https://huggingface.co/THUDM/chatglm-6b-int4
https://github.com/THUDM/ChatGLM-6B

安装环境

1、安装对应cuda 版本的torch包

在这里插入图片描述
** CUDA 11.3

pip install torch==1.12.1+cu113 torchvision==0.13.1
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

loong_XL

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值