一、NumPy
NumPy 是Numerical Python的简称,一直以来都是Python 中数值计算的基石,它提供了大多数Python数据科学计算所需要的数据结构和算法。对它的特性做以下介绍:
1.它有一个运算快速高效的多维数组对象ndarray。
2.NumPy库有用于对数组执行元素计算或数组之间的数学运算的函数或方法。
3.具备从磁盘读取数据集或将数据集写入磁盘的工具。
4.具备线性代数运算、傅里叶变换和随机数生成的能力。
5.对于数值数据,NumPy 数组比Python内置的数据结构更高效的存储和操作数据(后面代码验证)。
二、pandas
pandas库提供了高级数据结构和函数,使得结构化和表格数据的处理变得直观和灵活。有了pandas库的加持,Python 具备了一个强大而高效的数据分析环境。pandas具有两个主要的对象一个是DataFrame,它是一种表格式的、面向列的数据结构,具有行和列标签;另一个是Series,它是一个一维标记的数组对象。
pandas 将 NumPy 的数组计算思想与电子表格和关系数据库(如 SQL)中的各种数据操作功能相结合。它提供了方便的索引