awesome public data sets
github上边超过35k star的开源项目,其中包含了金融、医学、能源、时间序列等领域的公共数据集的集合。
链接:https://github.com/awesomedata/awesome-public-datasets
UCI machine learning repository
UCI数据集是加州大学欧文分校(University of Californialrvine)提出的用于机器学习的数据库。
链接:https://archive.ics.uci.edu/ml/datasets.php
具体的文件介绍也可以参考 UCI数据集整理(附论文常用数据集)
UCR time series classification archive
UCR数据集是专门用于时间序列分类的,也被称作时间序列界的“Imagenet”。2015年之后之前的就网站就不再更新了,到了18年又对数据集进行了更新和扩充。
旧版链接:http://www.cs.ucr.edu/~eamonn/time_series_data/
新版链接:https://www.cs.ucr.edu/%7Eeamonn/time_series_data_2018/
后续继续更新