会员
众包
新闻
博问
闪存
赞助商
Trae
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Dechin的博客
研究兴趣: 分子动力学模拟、量子计算与量子算法、Python编程与深度学习
博客园
首页
新随笔
联系
订阅
管理
2025年2月21日
DeepSeek本地性能调优
摘要:
对于本地模型的加载来说,除了使用KTransformer等工具进行指令集层面的优化之外,还可以调整模型加载层数,做一个简单的优化。这里提供了一个num_gpu和num_ctx参数调整的策略,实测Tokens性能最大可优化10倍左右。
阅读全文
posted @ 2025-02-21 10:53 DECHIN
阅读(2607)
评论(0)
推荐(0)
公告