- 博客(154)
- 收藏
- 关注
原创 防火墙设置
1.centos 防火墙设置。1.centos 防火墙设置。2、iptables防火墙。设置完成后要重新加载防火墙。二、iptables防火墙。查看防火墙已经开放的端口。
2025-03-21 09:30:53
166
原创 deepseek-glm4-grpo训练
1.grpo 重新训练已经微调的glm4模型。1.grpo 重新训练已经微调的glm4模型。1.2 遇到问题及解决。
2025-02-21 14:49:38
657
原创 deepseek-glm4-grpo训练
1.grpo 重新训练已经微调的glm4模型。1.grpo 重新训练已经微调的glm4模型。1.2 遇到问题及解决。
2025-02-20 17:16:09
746
原创 unsloth使用教程-grpo算法为例
1.使用unsloth 进行强化学习训练grpo2.训练后加载推理3. 训练后模型+lora 合并。
2025-02-16 14:22:21
1128
3
原创 trl-强化学习训练-grpo训练为例
1.trl + lora+ transformers 训练模型2.部署与预测3.模型合并4.vllm 部署4. 代码讲解5. trl 训练器参数讲解。
2025-02-16 14:18:45
2283
原创 ValueError: check_hostname requires server_hostname
问题: ValueError: check_hostname requires server_hostname。python 安装包遇到host报错。
2025-02-09 08:54:16
175
原创 ubuntu 安装显卡驱动gpu-cuda
1.系统查看2.安装驱动3.安装cudn4.安装cudnn5.安装nccl6.安装docker7.安装torch8.测试cudn9.测试cudnn10.测试nccl。
2025-01-21 09:44:34
1171
原创 /tmp/tmp2ynwcnmz/main.c:5:10: fatal error: Python.h: 没有那个文件或目录
vllm 部署多卡遇到的问题:/tmp/tmp2ynwcnmz/main.c:5:10: fatal error: Python.h: 没有那个文件或目录。sudo apt-get install python-dev # 对于 Python 2.x。sudo apt-get install python3-dev # 对于 Python 3。
2025-01-17 15:49:52
187
原创 /onnxruntime_src/onnxruntime/core/session/provider_bridge_ort.cc:1193 onnxruntime::Provider& onnxrun
【代码】/onnxruntime_src/onnxruntime/core/session/provider_bridge_ort.cc:1193 onnxruntime::Provider& onnxrun。
2024-11-29 10:55:16
405
原创 Failed to create CUDAExecutionProvider. Require cuDNN 9.* and CUDA 12.*.
解决: 去查看https://onnxruntime.ai/docs/execution-providers/CUDA-ExecutionProvider.html#requirements, 选择对应版本。如 pip install onnxruntime-gpu==1.17。
2024-11-29 09:39:21
450
原创 onnx报错解决-bert
https://huggingface.co/docs/transformers/main_classes/onnx#transformers.onnx.FeaturesManager代码:改正后:原因: input_names 名字顺序与模型定义不一致导致。为了避免错误产生,应该标准化。如下2所示。标准化:全部:无任何警告产生 转transformers 模型到onnx 接口解读 Huggingface:导出transformers模型
2024-11-28 17:34:25
635
原创 sentence_transfomers TypeError: compute_loss() got an unexpected keyword argument num_items_in_batc
解决: 修改sentence-transformers 版本,改为4.44 可以运行。
2024-11-23 12:21:03
680
原创 sentence-transformers
BERT的本质是一种文本表征(context representation),做的是一个文本->矩阵(max length× \times×hidden size)或者文本->向量(1× \times×hidden size),word2vec也可以做到同样的事,但是word2vec是静态的,而BERT是动态的,因为BERT是将输入考虑语序后经过transformer输出的。架构:由bert 衍生而来,选择不同的损失函数,则准备不同的数据集,从而训练不同的任务。4 选择不同损失函数的原因。
2024-11-20 17:15:11
807
原创 大模型qwen2.5研究
1.架构是什么2.如何初始化的3.tie_word_embeddings 了解4.语言模型类型有哪些?5.qwen、qwen1.5、qwen2、qwen2.5 不同之处6. 分词器粒度的优缺点?7. 数据有什么特点?
2024-11-18 15:44:39
1601
原创 WARNING: Running pip as the ‘root‘ user can result in broken permissions and conflicting behaviour w
问题:解决: 忽略权限。
2024-11-15 09:59:44
553
原创 Python3报错处理:UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 0-1: ordinal not i
【代码】Python3报错处理:UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 0-1: ordinal not i。
2024-11-04 11:26:18
191
原创 onnx底层入门
架构报错onnx 模型调试pytorch 成功转换为onnx 模型的条件案例:缺少 映射关系案例: 缺少映射关系案例: 自定义torch 算子案例: debug 每一层,判定前后精度是否损失。
2024-10-11 17:18:29
2282
原创 onnx代码解读
torch.jit.trace 相关代码解读onnx 内部实现3 查看是否为aten 算子aten 算子实现torch.autograd.Functions 算子实现自定义算子实现查找未实现的节点一次性发现所有的未实现 aten 算子。
2024-10-11 17:12:54
462
原创 FAIL : Failed to load library libonnxruntime_providers_cuda.so with error: libcublasLt.so.11: cannot
安装: conda install cudatoolkit。
2024-09-26 14:13:30
979
原创 1Torch was not compiled with flash attention. (Triggered internally at C:\actions-r unner_work\pytor
改为: pip install torch。解决: 降低torch版本,
2024-09-25 16:32:28
3153
1
原创 ImportError: DLL load failed while importing onnx_cpp2py_export :动态链接库(DLL)初始化历程失败
解决:先说解决办法:将1.16.2版本的onnx降级为1.16.1。
2024-09-19 17:44:04
2481
原创 UnicodeEncodeError: ‘latin-1‘ codec can‘t encode characters in position 41-44: Body (‘学术快报‘) is not
需要修改json 的 编码方式。
2024-09-13 10:58:28
537
原创 ValueError: check_hostname requires server_hostname
这种时候可能是你开了vpn连接了外网,关掉vpn即可。
2024-09-12 10:46:13
315
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人