大数据分析进阶之python财经数据抓取
-
Python常用数据分析包:
Pandas:数据分析
Nltk:自然语言处理
Scikit:人工智能和机器学习
Numpy/scipy:矢量数据和科学计算
Sympy:符号计算
Gpu:并行超速运算
Opencv:图像视频处理
TVTK/mayavi:可视化
-
财经数据接口包
-
Pandas
Python Data Analysis Library 或 是基于NumPy 的一种工具,是python的一个数据分析包。
Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。
Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)。
-
-
TuShare
TuShare是一个免费、开源的python财经数据接口包。
主要实现对股票等金融数据从数据采集、清洗加工到数据存储的过程,能够为金融分析人员提供快速、整洁和多样的便于分析的数据,为他们在数据来源方面极大地减轻了工作量,使他们更加专注于策略和模型的研究与实现上。
接口简单易懂,返回的数据格式规整,非常便于处理分析!
-
数据挖掘实验室
持续追踪大数据和数据新闻前沿,通过自然语言处理、机器学习、R等大数据处理手段和D3、Echarts等数据可视化方法,玩转大数据驱动新闻。