写在最前面,兜兜转转小论文总算接收了,现在我也把我找到的数据库和手动标的R点(真的标的眼睛都要瞎了)发出来(虽然我完全没用到这些数据库)
——————————————————————————分割线————————————
找了好久无需申请的数据库,现在就把链接和对应的优缺点贴上来吧,想要用五分钟心电信号做睡眠分期,想要结果精确度要求很高,一直不得入门,也希望做这方面研究的大佬同好们多多指教(鞠躬
1.这是一个2018年的竞赛的数据库,优点是无需申请,直接下载,下载速度就那样,还可以。以及数据量很大,真的很大,几百G。
缺点是里面睡眠标签比较杂,几乎找不到连续5分钟同一时间的的标签,如果只做30秒的可以入手。没有检查过数据咋样,还有下载有点麻烦,要一个一个点击。
你打盹你就赢了:2018 年心脏病学挑战赛 v1.0.0 的 PhysioNet/计算
2.这算是一个很经典的数据库吧,很老,很多文章都有用到,优点是:标注了R点,这一点真的省了很多事情(后面我有时间再写写怎么读这个数据库的标注),缺点是:太少了数据量,总共18条数据,16个人,并且都不是整晚的数据,实在不适合我用来做训练集,可能适合30秒识别的朋友。
链接:麻省理工学院-BIH 多导睡眠图数据库 v1.0.0 (physionet.org)
3.这个数据集也就是我现在使用的,优点是数据量大一共采集151人,也有成段的同阶段睡眠标签;缺点是:数据有的真的太乱了,想要完成R点标注需要花费很多功夫。要是最后我可以做出成果,我可以把我已经标注好R点的数据发出来(可能性不大)
Haaglanden Medisch Centrum 睡眠分期数据库 v1.1 (physionet.org)
4.这个数据集也是我目前使用的,优点是数据量很大,一共有100多人,也有同阶段的睡眠标签,还有数据比较整齐,R点标注也很容易,(同样的,如果我完成了研究,可以把已经标注好的发出来)缺点是:我怀疑这个数据集的标签可能不是太准确,就目前的识别率来看,专家可能或许大概emmm
我后面几天再按照数据库的不同把读取方式和代码贴上去,今天累了哈哈哈