交通标志识别学习指南

### 交通标志识别学习指南 #### 1. 理解GTSRB数据集 GTSRB数据集包含超过50,000张属于43个类别的交通标志图像。该数据集在2011年国际神经网络联合会议（IJCNN）的分类挑战中被专业人士使用。它非常适合用于我们的任务，因为它规模大、组织有序、开源且带有标注。虽然实际的交通标志不一定是正方形，也不一定位于每张图像的中心，但数据集附带了一个标注文件，该文件指定了每个标志的边界框。在进行任何机器学习任务之前，了解数据集的特性和挑战是个不错的主意。可以手动查看数据，了解其特征；如果页面上有数据描述，阅读它以确定哪种模型可能效果最佳。以下是一段来自`data/gtsrb.py`的代码，它加载训练数据集的随机15个样本并进行绘图，重复100次，这样你就可以分页查看数据： ```python if __name__ == '__main__': train_data, train_labels = load_training_data(labels=None) np.random.seed(75) for _ in range(100): indices = np.arange(len(train_data)) np.random.shuffle(indices) for r in range(3): for c in range(5): i = 5 * r + c ax = plt.subplot(3, 5, 1 + i) sample = train_data[indices[i]] ax.imshow(cv2.resize(sample, (32, 32)), cmap=cm.Greys_r) ax.axis('off') plt.tight_layout() plt.show() np.random.seed(np.random.randint(len(indices))) ``` 另一个好策略是从43个类别中分别绘制15个样本，观察每个类别的图像变化。从这个小数据样本中可以明显看出，对于任何分类器来说，这都是一个具有挑战性的数据集。标志的外观会因视角（方向）、观看距离（模糊度）和光照条件（阴影和亮点）而发生巨大变化。有些标志，即使对人类来说，也很难立即判断其正确的类别标签。 #### 2. 解析数据集 GTSRB数据集有21个文件可供下载。我们选择使用原始数据，以获得更多的学习机会。我们下载官方训练数据（Images and annotations (GTSRB_Final_Training_Images.zip)）用于训练，以及在2011年IJCNN竞赛中使用的官方训练数据集（Images and annotations (GTSRB-Training_fixed.zip)）用于评分。我们选择分别下载训练和测试数据，而不是从一个数据集中构建自己的训练/测试数据。因为在探索数据后发现，通常有30张来自不同距离的同一标志的图像看起来非常相似。将这些图像放在不同的数据集中会使问题产生偏差，即使模型的表现很好，也可能无法很好地泛化。以下是一个从哥本哈根大学数据存档下载数据的函数： ```python ARCHIVE_PATH = 'https://sid.erda.dk/public/archives/daaeac0d7ce1152aea9b61d9f1e19370/' def _download(filename, *, md5sum=None): write_path = Path(__file__).parent / filename if write_path.exists() and _md5sum_matches(write_path, md5sum): return write_path response = requests.get(f'{ARCHIVE_PATH}/{filename}') response.raise_for_status() with open(write_path, 'wb') as outfile: outfile.write(response.content) return write_path ``` 这段代码接受一个文件名，检查文件是否已经存在（如果提供了md5sum，还会检查其是否匹配），避免重复下载，节省带宽和时间。然后下载文件并将其存储在包含代码的文件所在的同一目录中。标注格式可在[此处](http://benchmark.ini.rub.de/?section=gtsrb&subsection=dataset#Annotationformat)查看。下载文件后，我们编写一个函数，使用数据附带的标注格式来解压缩和提取数据，步骤如下： 1. 打开下载的.zip文件（可以是训练数据或测试数据），遍历所有文件，只打开包含每个图像目标信息的.csv文件。 ```python def _load_data(filepath, labels): data, targets = [], [] with ZipFile(filepath) as data_zip: for path in data_zip.namelist(): if not path.endswith('.csv'): continue # Only iterate over annotations files ... ``` 2. 检查图像的标签是否在我们感兴趣的标签数组中。然后创建一个`csv.reader`来遍历.csv文件的内容。 ```python ... # Only iterate over annotations files *dir_path, csv_filename = path.split('/') label_str = dir_path[-1] if labels is not None and int(label_str) not in labels: continue with data_zip.open(path, 'r') as csvfile: reader = csv.DictReader(TextIOWrapper(csvfile), delimiter=';') for img_info in reader: ... ``` 3. 提取图像路径，读取数据并将其转换为NumPy数组。通常，这些样本中的对象没有被完美裁剪，而是嵌入在周围环境中。我们使用存档中提供的边界框信息裁剪图像，并将标志

最低0.47元/天解锁专栏

买1年送3月

继续阅读点击查看下一篇

400次会员资源下载次数

300万+ 优质博客文章

1000万+ 优质下载资源

1000万+ 优质文库回答

复制全文

交通标志识别学习指南

相关推荐

专栏目录

交通标志识别学习指南

相关推荐

基于深度学习的交通标志识别.pdf

基于深度学习的交通标志识别研究综述.pdf

基于深度学习的路面交通标志识别.pdf

Java源码-springboot+vue280基于旅游推荐系统设计与实现+mysql完整资料.zip

Java源码-springboot+vue328在线骑行网站+mysql完整资料.zip

【轨道】基于matlab轨道推扫帚立体成像系统的特征匹配算法自动评估平台【含Matlab源码 14164期】.zip

ip2region-2.7.0.jar中文-英文对照文档.zip

An Open Source Study App that developed with Flask and MiniP

aws-java-sdk-opensearch-1.12.780.jar中文-英文对照文档.zip

高度仿写百思不得姐项目，实现精华，新帖，发布，关注，我的五大功能模块，运用了很多技术。使用技术：MVC设计模式，使用纯代码和Xib混合开发，使用Masonry.zip

【scratch2.0少儿编程-游戏原型-动画-项目源码】小猫操场跑步.zip

专栏目录

最新推荐

Crestron Toolbox IR_串口学习模拟技巧：设备控制协议逆向工程详解

毫米波雷达设计新思路：PO方法在车载雷达中的5大应用场景解析

二维码与图片打印进阶：C#开发汉印D35BT的高级技巧

AI训练系统Spillover管理：GPU内存溢出与重调度实战指南

SAfER：更安全的工作设计方法

对无私自我的渴望与匿名性的其他矛盾

Intel I219-V MAC修改失败？这10个常见问题你必须知道

爬虫机制大揭秘：Xenu Link Sleuth高效抓取百万级链接的底层逻辑

Matlab实现GPS信号捕获：PMF-FFT核心代码架构全揭秘（附完整源码思路）

构建可扩展DSDIFF Decoder插件架构：核心设计模式深度解析