会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Dechin的博客
研究兴趣: 分子动力学模拟、量子计算与量子算法、Python编程与深度学习
博客园
首页
新随笔
联系
订阅
管理
2025年6月25日
PyTorch中实现开立方
摘要:
本文介绍了在PyTorch中直接使用幂次函数计算有可能导致的计算结果异常的问题。由于PyTorch中并未像Numpy和MindSpore一样直接支持cbrt开立方函数,因此这里也提供了一个在PyTorch中计算开立方的函数。
阅读全文
posted @ 2025-06-25 17:56 DECHIN
阅读(16)
评论(0)
推荐(0)
2025年6月23日
conda环境部署脚本
摘要:
本文简单的介绍了一下在空白的Ubuntu Linux中安装conda的方法和脚本,其中包含了CUDA部分的安装。
阅读全文
posted @ 2025-06-23 10:16 DECHIN
阅读(22)
评论(0)
推荐(0)
2025年6月20日
tensor_scatter_add算子异同点
摘要:
本文介绍了MindSpore中的tensor_scatter_add算子的用法,可以对一个多维的tensor在指定的index上面进行加和操作。在PyTorch中虽然也有一个叫scatter_add的算子,但是本质上来说两者是完全不一样的操作。
阅读全文
posted @ 2025-06-20 15:49 DECHIN
阅读(66)
评论(0)
推荐(0)
2025年6月18日
gather算子大不同
摘要:
本文通过2个实际的案例,演示了一下gather算子在MindSpore框架下PyTorch框架下的异同点。两者的输入都是tensor-axis-index,一个是输入顺序上略有区别,另一个是对于输入的张量索引维度的要求。在PyTorch中,如果我们要实现类似于MindSpore中的gather功能,需要手动对输入索引的维度操作一下。
阅读全文
posted @ 2025-06-18 15:06 DECHIN
阅读(21)
评论(0)
推荐(0)
2025年6月16日
MindSpore中的ReduceMax和max操作的区别
摘要:
本文介绍了在pytorch和mindspore中两种计算张量最大值的算子,如果直接使用max算子,两者的输出都是最大值元素和最大值索引。但是mindspore中额外的支持了ReduceMax算子,可以允许我们只输出最大值而不输出最大值索引。
阅读全文
posted @ 2025-06-16 14:52 DECHIN
阅读(10)
评论(0)
推荐(0)
2025年6月11日
PyTorch中的求余
摘要:
本文通过几个示例,介绍了在Python、Numpy和PyTorch三个不同的框架下,对于求余数函数的定义。比较特殊的是pytorch中的fmod函数,并不符合数学上的求余数方法,而是需要使用remainder函数。
阅读全文
posted @ 2025-06-11 15:50 DECHIN
阅读(16)
评论(0)
推荐(0)
2025年6月3日
Python中的cls变量
摘要:
本文介绍了在Python的classmethod装饰的类方法的cls变量的意义,通过几个不同的示例对比,凸显cls变量在Python编程中的应用场景。对于大多数的场景来说,使用普通的Python类和函数定义即可。如果需要在类的外部使用类的内部函数,但是可能有多个不同初始化的类输入,那么可以使用staticmethod进行装饰。如果只有一个类,而有多种不同的输入场景下,可以使用classmethod进行装饰。
阅读全文
posted @ 2025-06-03 17:50 DECHIN
阅读(210)
评论(2)
推荐(1)
2025年4月25日
解决Cupy相关报错
摘要:
本文记录了一些使用python-cupy的过程中有可能的遇到的一些问题,一部分是环境配置问题,还有一部分是运行输入问题。
阅读全文
posted @ 2025-04-25 15:53 DECHIN
阅读(82)
评论(0)
推荐(0)
2025年4月22日
QUBO建模
摘要:
这篇文章算是对Fred Glover的一篇综述的解读,添加了一些方便直观理解的示例具体的建模过程。对于不同的场景,可以使用不同的惩罚项进行QUBO建模,从而可以使用求解器或者Ising机进行求解。
阅读全文
posted @ 2025-04-22 15:17 DECHIN
阅读(200)
评论(0)
推荐(0)
2025年3月12日
KTransformers实战DeepSeek-R1-1.58bit量化模型
摘要:
本文介绍了国产的大模型推理工具KTransformers在本地成功运行的一个案例,在容器化部署的基础上,结合Open WebUI做了一个用户友好的大模型服务。
阅读全文
posted @ 2025-03-12 15:34 DECHIN
阅读(1420)
评论(0)
推荐(1)
2025年3月10日
Ollama+DeepSeek+SlackBot
摘要:
本文介绍了一种使用Slack聊天工具中的机器人SlackBot的API接口,实现本地化部署Ollama的DeepSeek大模型的远程通讯方案。相比于调用公网的API接口,数据隐私稍微好一点点。最终的方案应该是自建加密聊天工具+Ollama本地化部署,但是这个时间成本有点高,用户可以自行尝试。
阅读全文
posted @ 2025-03-10 10:33 DECHIN
阅读(771)
评论(1)
推荐(1)
2025年3月5日
Cython与CUDA之Add
摘要:
本文介绍了使用CUDA和Cython来实现一个CUDA加法算子的方法,并介绍了使用CUDA参数来估算性能极限的算法。经过实际测试,核函数部分的算法性能优化空间已经不是很大了,更多时候可以考虑使用Stream来优化Host和Device之间的数据传输。
阅读全文
posted @ 2025-03-05 09:59 DECHIN
阅读(190)
评论(0)
推荐(0)
2025年3月3日
Cython与CUDA之BatchGather
摘要:
以学习CUDA为目的,接上一篇关于Cython与CUDA架构下的Gather算子实现,这里我们加一个Batch的维度,做一个BatchGather的简单实现。
阅读全文
posted @ 2025-03-03 15:54 DECHIN
阅读(150)
评论(0)
推荐(0)
2025年2月28日
DeepSeek满血版测试
摘要:
本文收集了一些目前为止仅有DeepSeek满血版可以正确答复的“简单问题”,以供测试和验证自己所使用的模型是满血版DeepSeek还是残血版的DeepSeek。有两点需要提示:各大厂商模型可以联网更新,本问题集有一定的时效性;部分数学和推理类问题,跟temperature参数的设定有关,temperature参数设置的越低,回答越严谨。
阅读全文
posted @ 2025-02-28 16:34 DECHIN
阅读(2147)
评论(0)
推荐(0)
CUDA时长统计
摘要:
这篇文章主要介绍了一个CUDA入门的技术:使用CUDA头文件写一个专门用于CUDA函数运行时长统计的宏,这样就可以统计目标Kernel函数的运行时长。可以直接在CUDA中打印相应的数值,也可以回传到Cython或者Python中进行打印。
阅读全文
posted @ 2025-02-28 09:45 DECHIN
阅读(253)
评论(0)
推荐(0)
下一页
公告