双流卷积网络提升RGB-D图像检测效率

PDF文件

机器视觉

RGB-D

卷积神经

联合检测

9.69MB | 更新于2024-08-30 | 59 浏览量 | 举报 4 收藏

立即下载

"该文提出了一种基于双流卷积神经网络的RGB-D图像联合检测方法，旨在解决传统卷积网络在处理RGB图像和深度图像时效率不高的问题。通过将RGB图像和深度图像分别输入两个共享权重的卷积网络，提取各自独立的特征后在卷积层进行融合，然后继续利用卷积核提取融合特征，最终通过全连接层得到输出结果。与早期融合和后期融合方法相比，在检测时间和效率接近的情况下，双流卷积网络能提高检测的准确率和成功率，分别提升4.1%和3.5%。该研究主要涉及机器视觉、RGB-D图像处理、卷积神经网络、多模态信息和深度学习等领域。" 本文介绍了一种用于RGB-D图像联合检测的新方法，即双流卷积神经网络。在传统的卷积神经网络(CNN)中，RGB图像和深度图像的信息融合通常发生在早期或后期阶段，但这种方法可能没有充分利用两种模态数据的独立性和相关性。为此，研究者设计了一个双流结构，其中RGB图像和深度图像分别输入两个相同的、权重共享的卷积网络。这种设计允许两种模态的特征独立地被提取，之后在卷积层进行最优权值融合，确保了两种信息的有效结合。卷积网络首先通过多次卷积操作提取RGB和深度图像的特征，这些特征分别反映了两者的独特属性。然后，融合后的特征进一步通过卷积核进行处理，以便捕捉更高级别的语义信息。最后，全连接层接收这些融合特征并生成最终的检测结果。实验表明，与传统的融合策略相比，双流卷积网络在保持相近检测速度的同时，能够显著提高检测的准确率和成功率，这证明了其在处理多模态图像数据方面的优越性。 RGB-D图像联合检测在机器视觉领域具有广泛的应用，如机器人导航、目标识别和场景理解等。深度信息的加入为物体检测和识别提供了额外的维度，有助于克服仅依赖RGB图像时的不确定性。双流卷积网络的设计思路为多模态信息融合提供了一种新的途径，尤其是在深度学习框架下，它能够更好地处理和利用不同模态的数据，提高模型的性能。此外，深度学习是近年来在计算机视觉领域发展迅速的技术，它在图像识别、物体检测和模式分析等方面展现出了强大的能力。本文提出的双流卷积网络是深度学习在多模态数据处理中的一个实例，它展示了深度学习如何通过优化网络结构来适应特定任务的需求，从而提升模型的效能。这项工作对于理解和改进RGB-D图像的处理方法具有重要意义，不仅提升了检测效率，还为未来在其他多模态数据处理任务上的应用提供了启示。随着硬件技术的发展和更多数据集的可用性，类似的深度学习模型有望在更广泛的领域内实现突破。

激光与光电子学进展





(



)

Laser&O

toelectronicsPro

ress







中国激光

杂志社

基于双流卷积神经网络的

RGBＧD

图像联合检测

刘帆

刘鹏远

张峻宁

徐彬彬

军械工程学院

河北石家庄



摘要



当前卷积神经网络结构未能充分考虑



图像和深度图像的独立性和相关性

针对其联合检测效率不高

的问题

提出了一种新的双流卷积网络

将



图像和深度图像分别输入到两个卷积网络中

两个卷积网络结构

相同且权值共享

经过数次卷积提取各自独立的特征后

在卷积层根据最优权值对两个卷积网络进行融合

;

继续使

用卷积核提取融合后的特征

最后通过全连接层得到输出

相比于以往卷积网络对

󰁒

图像采用的早期融合

和后期融合方法

在检测时间相近的情况下

双流卷积网络检测的准确率和成功率分别提高了



和



关键词



机器视觉

;

󰁒

;

卷积神经网络

;

多模态信息

;

联合检测

;

深度学习

中图分类号



文献标识码

 doi

．

LOP．

JointDetectionofRGBＧDIma

esBasedonDoubleFlow Convolutional

NeuralNetwork

Liufan LiuPen

uan Zhan

Junnin

XuBinbin

MechanicalEn

ineerin

Colle

Shi

iazhuan

Hebei



China

Abstract

























    











󰁒



 

















          



 



  



























































  











 











words󰁒













OCIScodes



收稿日期

󰁒󰁒

;

收到修改稿日期

󰁒󰁒

基金项目

国家自然科学基金

(





)

作者简介

刘帆

(



—),

男

硕士研究生

主要从事计算机视觉方面的研究

󰁒







导师简介

刘鹏远

(



—),

男

博士

副教授

硕士生导师

主要从事增强现实维修方面的研究

󰁒









(

通信联系人

)



引



言

红绿黄彩色图像和深度

(

󰁒

)

图像是当前计算

机视觉领域新的研究热点

[



]

主要由深度相机获得

包

括红绿黄彩色

(



)

图像和对应的深度图像



图

像包含所拍摄物体的表面颜色和纹理等信息

而深度

图像包含物体的空间形状等信息

两种图像对彼此都

是一个很好的补充

因此

有效利用



信息和深度

信息能显著提高场景中物体识别检测的准确率

当

前

󰁒

图像的联合检测方法有基于人工设计特征

的提取表达法和自动特征学习法

[



]

两种

基于人工设计特征的提取表达法是指根据先验

知识设计特定的特征

如尺度不变特征变换

(



)、

加速稳健特性

(



)、

方向梯度直方图

(



)

等

󰁒

下载后可阅读完整内容，剩余8页未读，立即下载

weixin_38557670

粉丝: 3

双流卷积网络提升RGB-D图像检测效率

pytorch-two-stream-CNN-master.zip

Motion & Spatial 双流网络Win环境下调试通过

卷积神经网络-源代码.rar

基于单流递归卷积神经网络的RGB-D图像显着目标检测

基于双流卷积神经网络的人体行为识别方法.pdf

基于双流卷积神经网络的改进人体行为识别算法.pdf

基于双流2D卷积神经网络

双流卷积神经网络matlab

详细解释双流卷积神经网络

基于双流快速区域卷积神经网络改进的人体动作识别算法

最新资源