kitty数据集标签
时间: 2025-07-06 11:55:44 浏览: 15
### KITTI 数据集标签说明
在 KITTI 数据集中,`label` 文件提供了目标物体的详细描述。每一行代表一个检测到的对象,并包含了多个字段来定义该对象的各种属性。
#### 标签文件结构
每个 `label` 文件中的每一行对应于场景中的单个物体实例。这些行按照固定格式排列,具体如下:
- **第1列:类别**
类别名称指示了所识别的目标类型,可能取值有 `'Car'`, `'Van'`, `'Truck'`,`'Pedestrian'`, `'Person_sitting'`, `'Cyclist'`, `'Tram'`,`'Misc'` 或者 `'DontCare'`[^3]。其中,“Don't Care”区域指的是那些虽然可以通过摄像头看到但是由于距离过远而无法被激光雷达有效捕捉到的部分。
- **后续各列:几何参数和其他特征**
| 列索引 | 描述 |
|--------|-------------------------------|
| 第2列 | 截断程度 (0=完全可见, 1=部分遮挡, 2=大部分隐藏, 3=未知) |
| 第3列 | 难度级别 (-1表示未指定; 0=简单, 1=适中, 2=困难) |
| 第4至7列 | 边界框坐标(左上角x,y 和右下角x,y) |
| 第8列 | 物体高度 |
| 第9列 | 物体宽度 |
| 第10列 | 物体长度 |
| 第11列 | 位置X轴 |
| 第12列 | 位置Y轴 |
| 第13列 | 位置Z轴 |
| 第14列 | 方向角度(沿逆时针方向相对于相机坐标系正前方的角度) |
| 第15列 | Yaw angle (绕着垂直轴旋转的角度) |
上述信息共同构成了对每个检测对象全面细致的描绘,使得研究人员能够利用这些丰富的元数据来进行更深入的研究工作。
```python
def parse_kitti_label(label_file_path):
labels = []
with open(label_file_path, 'r') as f:
lines = f.readlines()
for line in lines:
items = line.strip().split(' ')
obj_info = {
"class": items[0],
"truncated": float(items[1]),
"occluded": int(items[2]),
"alpha": float(items[3]),
"bbox": list(map(float, items[4:8])),
"dimensions": [float(x) for x in items[8:11]],
"location": [float(x) for x in items[11:14]],
"rotation_y": float(items[14])
}
labels.append(obj_info)
return labels
```
阅读全文
相关推荐


















