[论文阅读]EMNIST: an extension of MNIST to handwritten letters

最新推荐文章于 2024-12-27 11:58:12 发布

千瞱

最新推荐文章于 2024-12-27 11:58:12 发布

阅读量1.7k

点赞数 1

分类专栏：机器学习文章标签： EMNIST 手写字母数据集神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_26822029/article/details/103963818

版权

机器学习专栏收录该内容

19 篇文章

订阅专栏

论文阅读

EMNIST: an extension of MNIST to handwritten letters

/ 2020-01 Howard wonanut

最近遇到一个问题，需要识别手写字母，这个问题本身没啥难度，难在如何找到训练数据集，因为之前做过手写数字的识别，知道有个MNIST手写数字数据集，可这手写字母数据集还真没注意过。第一个映入眼帘的手写字母数据集是Chars74k数据集,里面的EnglishHnd即为手写数字数据集，不过数据量比较少，每个字母只有55个图片数据。
在这里插入图片描述

直到今天，在kaggle上看到了EMNIST数据集，真的是发现了一个宝藏，所以整理一下这个论文：
论文下载地址：EMNIST: an extension of MNIST to handwritten letters

产生背景

众所周知，MNIST是一个权威的手写数字数据集，而且一直有一个手写数字+大小写字母数据集NIST，只不过由于NIST数据集使用起来不太方便，而且没有像EMNIST将训练集和测试集划分，因此在使用以及对比结果的时候很不方便，从而有了ENMIST（extension of MNIST）。

数据集划分

该数据集基于NIST Special Database 19产生。论文作者已经将数据按照不同的划分方法进行了划分，而且都已经划分了训练集和测试集：

By_page：里面含有未经处理的整页的字符黑白扫描
By_Author: 里面根据不同的书写者，将属于同一个人的所有字符都归成一类
By_Field: 分成字母，数字，可以用于字母或者数字分割
By_Class: 按类别，即数字 10 类[0-9]，26 类 [a-z]，26 类 [A-Z]，共 62 类
By_Merge: 因为有的因为字母，大小写手写体基本很难分辨，所有这里将这些字母大小写合并，又构成一个新的分类，被合并的字母有 15 类 [C,I,J,K,L,M,O,P,S,U,V,W,X,Y,Z]，所以最后最剩下 47 类

EMNIST数据集的部分划分结果如下图：

在这里插入图片描述

banchmark结果

不太重要，略

（完）

博客等级

码龄10年

208
原创

1060
点赞

4507
收藏

2366
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 机器学习之分类算法应用篇

下一篇：: [论文阅读]Factorization Machines

最新评论

openmpi入门1-安装与测试
MrParadox: 应该是export PATH=/usr/local/bin:$PATH吧？
U盘文件全变快捷方式解决办法
黑茶妹妹: 我这样也试了，没有反应了
Vue3使用Sass完全教程
2401_84010433: 22年就已经说了废弃node-sass了吧
C++中构造函数的两种写法
Fi_34999647: 因此理论上使用方法一的成员初始化列表（member initialization list）方式的效率更高，因为比起先调用default构造函数然后再调用copy assignment操作符，单只调用一次copy构造函数是比较高效的。也就是说采用方法二的话，构造函数本体实际上不需要有任何操作，因此效率更高。 ———————————————— 菜鸟看不懂了，那种效率高啊？
迷宫生成算法总结
Adminstrator　: 圆形迷宫：能不能使用普通算法生成一个梯形迷宫（为了不压缩靠里的迷宫），再把两边闭合为一个圆？

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。