1. MMDetection3d 三大坐标系
目前,在 MMDetection3D 支持的算法中,有三大坐标系,他们是——
- 深度坐标系(Depth),此坐标系主要被用于通过深度相机采集的数据集, 大多是室内场景点云检测。
- 激光雷达坐标系(LiDAR),顾名思义,是适用于室外场景点云检测普遍采用的激光雷达设备的坐标系。
- 相机坐标系(Camera),该坐标系在室内室外场景的点云检测均有使用,代表彩色相机的常用坐标系,一般用于数据格式的转换。在多模态或者单目 3D 的检测器中,相机坐标系是三维点云与二维图像之间的桥梁。
请注意,其实此语境下的坐标系并不只是坐标系本身,它还包括如何定义 包围框的长宽高和旋转角。
2. 关于batch_data_samples:批数据采样
batch_data_samples是Det3DDataSample类型的dict,固其中的属性信息均位于/mmdetection3d/mmdet3d/structures/det3d_data_sample.py
class Det3DDataSample(DetDataSample):
-`proposal``(InstanceData):在两阶段中使用的区域建议探测器
-``ignored_instances``(InstanceData):在训练/测试期间要忽略的实例
-`gt_instances_3d``(InstanceData):3d实例的gt注释
-`gt_instances``(InstanceData):2D实例的gt注释
-`pred_instances _3d``(InstanceData):模型的3d实例预测
3. MMDetection中3Dkitti数据集的使用
官方说明文档:
3D 目标检测 KITTI 数据集 — MMDetection3D 1.0.0rc4 文档3D 目标检测 KITTI 数据集 — MMDetection3D 1.0.0rc4 文档
1)先生成pkl文件
先运行tools/create_data.py,生成pkl文件
再运行tools/dataset_converters/update_infos_to_v2.py,更新info
4. MMDetection3D中CameraInstance3DBoxes说明
kitti datasets label.txt: h、w、l、x、y、z、ry
1. .tensor:x、y、z、l、h、w、ry (其中xyz与kitti一样为底部中心,)
2. .yaw : 偏航角(对应kitti label中的ry
3. .local_yaw:alpha角
4. .gravity_center:真正的中心点
4. .bottom_center:底部中心点,对应.tensor中的xyz