自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_40777649的博客

原创防火墙设置

1.centos 防火墙设置。1.centos 防火墙设置。2、iptables防火墙。设置完成后要重新加载防火墙。二、iptables防火墙。查看防火墙已经开放的端口。

2025-03-21 09:30:53 166

原创 deepseek-glm4-grpo训练

1.grpo 重新训练已经微调的glm4模型。1.grpo 重新训练已经微调的glm4模型。1.2 遇到问题及解决。

2025-02-21 14:49:38 657

原创 deepseek-glm4-grpo训练

1.grpo 重新训练已经微调的glm4模型。1.grpo 重新训练已经微调的glm4模型。1.2 遇到问题及解决。

2025-02-20 17:16:09 746

原创 trl + 大模型reward训练

1.强化学习-reward训练2.reward 模型重新加载与训练。

2025-02-16 15:18:33 507

原创 trl+DPO 算法

1.数据集格式2.损失函数3. 模型训练demo4. 模型加载与合并。

2025-02-16 14:26:25 581

原创 unsloth使用教程-grpo算法为例

1.使用unsloth 进行强化学习训练grpo2.训练后加载推理3. 训练后模型+lora 合并。

2025-02-16 14:22:21 1128 3

原创 trl-强化学习训练-grpo训练为例

1.trl + lora+ transformers 训练模型2.部署与预测3.模型合并4.vllm 部署4. 代码讲解5. trl 训练器参数讲解。

2025-02-16 14:18:45 2283

原创 GRPO强化学习训练

理解GRPO算法GRPO 工作步骤奖励的理解目标函数的理解trl 源码中代码讲解。

2025-02-16 14:12:28 793

原创 git命令报错Could not resolve host: socks5

解决：取消设置代理。

2025-02-11 09:22:53 593

原创 ValueError: check_hostname requires server_hostname

问题： ValueError: check_hostname requires server_hostname。python 安装包遇到host报错。

2025-02-09 08:54:16 175

原创 vs code 使用教程

多行注释vs 找不到上层文件路径选择或创建python 虚拟环境git 远程克隆及推送。

2025-02-06 09:02:28 226

原创 ubuntu 安装显卡驱动gpu-cuda

1.系统查看2.安装驱动3.安装cudn4.安装cudnn5.安装nccl6.安装docker7.安装torch8.测试cudn9.测试cudnn10.测试nccl。

2025-01-21 09:44:34 1171

原创 /tmp/tmp2ynwcnmz/main.c:5:10: fatal error: Python.h: 没有那个文件或目录

vllm 部署多卡遇到的问题：/tmp/tmp2ynwcnmz/main.c:5:10: fatal error: Python.h: 没有那个文件或目录。sudo apt-get install python-dev # 对于 Python 2.x。sudo apt-get install python3-dev # 对于 Python 3。

2025-01-17 15:49:52 187

原创 docker离线安装

离线安装方式1离线安装方式2。

2024-12-04 09:49:39 786 1

原创 /onnxruntime_src/onnxruntime/core/session/provider_bridge_ort.cc:1193 onnxruntime::Provider& onnxrun

【代码】/onnxruntime_src/onnxruntime/core/session/provider_bridge_ort.cc:1193 onnxruntime::Provider& onnxrun。

2024-11-29 10:55:16 405

原创 Failed to create CUDAExecutionProvider. Require cuDNN 9.* and CUDA 12.*.

解决：去查看https://onnxruntime.ai/docs/execution-providers/CUDA-ExecutionProvider.html#requirements，选择对应版本。如 pip install onnxruntime-gpu==1.17。

2024-11-29 09:39:21 450

原创 docker 创建Dockerfile

1.用Dockerfile 创建镜像。2.设置自启动方式二：3.容器自启动4.glm4 容器部署案例。

2024-11-28 17:57:18 440

原创 sentence_transformers转onnx

记录一次sentence_transformers 转onnx。

2024-11-28 17:38:58 213

原创 onnx报错解决-bert

https://huggingface.co/docs/transformers/main_classes/onnx#transformers.onnx.FeaturesManager代码：改正后：原因： input_names 名字顺序与模型定义不一致导致。为了避免错误产生，应该标准化。如下2所示。标准化：全部：无任何警告产生转transformers 模型到onnx 接口解读 Huggingface:导出transformers模型

2024-11-28 17:34:25 635

原创 sentence_transfomers TypeError: compute_loss() got an unexpected keyword argument num_items_in_batc

解决：修改sentence-transformers 版本，改为4.44 可以运行。

2024-11-23 12:21:03 680

原创 sentence-transformers

BERT的本质是一种文本表征（context representation），做的是一个文本->矩阵（max length× \times×hidden size）或者文本->向量(1× \times×hidden size)，word2vec也可以做到同样的事，但是word2vec是静态的，而BERT是动态的，因为BERT是将输入考虑语序后经过transformer输出的。架构：由bert 衍生而来，选择不同的损失函数，则准备不同的数据集，从而训练不同的任务。4 选择不同损失函数的原因。

2024-11-20 17:15:11 807

原创 pandas修改单元格底色

【代码】pandas修改单元格底色。

2024-11-20 16:27:51 379

原创大模型qwen2.5研究

1.架构是什么2.如何初始化的3.tie_word_embeddings 了解4.语言模型类型有哪些？5.qwen、qwen1.5、qwen2、qwen2.5 不同之处6. 分词器粒度的优缺点？7. 数据有什么特点？

2024-11-18 15:44:39 1601

原创 WARNING: Running pip as the ‘root‘ user can result in broken permissions and conflicting behaviour w

问题：解决：忽略权限。

2024-11-15 09:59:44 553

原创 windows基础操作-连网异常

更改代理设置—>关闭代理。点击各项进行内存清理。

2024-11-14 09:20:22 279

原创 gpu-V100显卡相关知识

torch attention注意力接口学习V100 架构是什么？

2024-11-13 17:20:54 1796

原创 llama-cpp模型轻量化部署与量化

定义配置环境遇到的问题，交互模式下模型一直输出，不会停止模型量化Qwen1.5-7B 案例demo。

2024-11-13 10:48:24 709

原创 Python3报错处理：UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 0-1: ordinal not i

【代码】Python3报错处理：UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 0-1: ordinal not i。

2024-11-04 11:26:18 191

原创 gpu性能

相关网址相关显卡算力对比浮点计算性能测试FLOPS 与FLOPs 的区别A100 文档阅读A800 文档阅读显卡系列知识。

2024-10-14 09:15:54 1075 1

原创 onnx底层入门

架构报错onnx 模型调试pytorch 成功转换为onnx 模型的条件案例：缺少映射关系案例：缺少映射关系案例：自定义torch 算子案例： debug 每一层，判定前后精度是否损失。

2024-10-11 17:18:29 2282

原创 onnx代码解读

torch.jit.trace 相关代码解读onnx 内部实现3 查看是否为aten 算子aten 算子实现torch.autograd.Functions 算子实现自定义算子实现查找未实现的节点一次性发现所有的未实现 aten 算子。

2024-10-11 17:12:54 462

原创 FAIL : Failed to load library libonnxruntime_providers_cuda.so with error: libcublasLt.so.11: cannot

安装： conda install cudatoolkit。

2024-09-26 14:13:30 979

原创 1Torch was not compiled with flash attention. (Triggered internally at C:\actions-r unner_work\pytor

改为：　pip install torch。解决：降低torch版本，

2024-09-25 16:32:28 3153 1

原创 ImportError: DLL load failed while importing onnx_cpp2py_export :动态链接库（DLL）初始化历程失败

解决：先说解决办法:将1.16.2版本的onnx降级为1.16.1。

2024-09-19 17:44:04 2481

原创 OpenAI 使用教程

openAI 使用教程。

2024-09-14 13:50:09 604

原创 UnicodeEncodeError: ‘latin-1‘ codec can‘t encode characters in position 41-44: Body (‘学术快报‘) is not

需要修改json 的编码方式。

2024-09-13 10:58:28 537

原创 ValueError: check_hostname requires server_hostname

这种时候可能是你开了vpn连接了外网，关掉vpn即可。

2024-09-12 10:46:13 315

原创 flask下https教程

linux 下flask https 协议。

2024-09-09 19:02:30 717

原创文本文件完整性判断-加密

文件加密。

2024-09-03 16:36:23 351

原创 flask文件下载

【代码】flask文件下载。

2024-09-03 16:32:59 893

docker离线安装文件

docker离线安装包

2024-12-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除