Depth-wise Convolution keras 运行时间缓慢原因

最新推荐文章于 2026-03-27 11:32:06 发布

原创

最新推荐文章于 2026-03-27 11:32:06 发布 · 2.2k 阅读

·

2

·

文章标签：

#深度学习 #tensorflow #机器学习

本文对比了标准卷积与深度可分离卷积(depth-wise conv2D)在参数量与计算复杂度上的显著差异，深度剖析了深度可分离卷积如何减少参数量及计算量，同时也讨论了其在实际应用中可能遇到的性能瓶颈，尤其是在IO读取次数上的增加导致的运行速度降低。

提到depth-wise conv2D 大家都如数家珍，这里我就简单的介绍一下，用两张图就可以概述出来了，大家想要看具体的介绍可以看

A Basic Introduction to Separable Convolutions 这篇文章介绍的很清楚。

上图是一个正常的卷积操作，是一个12×12×3的特征图经过256个卷积核大小为5×5×3的卷积得到了一个8×8×256的特征图。这是正常的卷积。参数量为256 x 5 x 5 x 3 = 19200，乘法次数为256 x 5 x 5 x 3 x 8 x 8 = 1228800。

上图就是一个depthwisie-conv2D 卷积了。可以看到它采用了3个5×5×1的卷积核来操作得到3个8×8 ×3的特征图。其参数量

3 x 5 x 5 x 1 乘法次数为3 x 5 x 5 x 1 x 8 x 8。我们可以看到参数量核乘法次数大大降低了。下面是一个 Point-wise Conv.的操作。这两个加起来就是一个Separable Conv 了。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。