【pandas】（二）读写数据

最新推荐文章于 2024-09-22 10:20:07 发布

醉糊涂仙

最新推荐文章于 2024-09-22 10:20:07 发布

阅读量2.5k

点赞数 2

CC 4.0 BY-SA版权

分类专栏： python.pandas

本文链接：https://blog.csdn.net/u010916338/article/details/105375311

python.pandas 专栏收录该内容

6 篇文章

订阅专栏

一、读数据

1.1 pandas.read_csv

（1）filepath_or_buffer : 路径 URL 可以是http, ftp, s3, 和 file.

（2）sep: 指定分割符，默认是’,’

（3）delimiter: 同sep

（4）header: 指定第几行作为列名(忽略注解行)，如果没有指定列名，默认header=0; 如果指定了列名header=None

（5）names 指定列名，如果文件中不包含header的行，应该显性表示header=None。当header=0时，是将原始列名替换。

（6）index_col: 默认为None 用列名作为DataFrame的行标签，如果给出序列，则使用MultiIndex（复合索引）。如果读取某文件,该文件每行末尾都有带分隔符，考虑使用index_col=False使panadas不用第一列作为行的名称。

（7）usecols：默认None 可以使用列序列也可以使用列名，如 [0, 1, 2] or [‘foo’, ‘bar’, ‘baz’]

（8）prefix:默认为none, 当header =None 或者没有header的时候有效，例如’x’ 列名效果 X0, X1, …

（9）skiprows: list-like or integer or callable, default None 忽略某几行或者从开始算起的几行

（10）skipfooter: 从底端算起的几行，不支持C引擎

（11）nrows： int 读取的行数

二、写数据

2.1 pandas.to_csv

（1）path_or_buf：字符串，放文件名、相对路径、文件流等

（2）sep：字符串，分隔符，跟read_csv()的一个意思

（3）na_rep：字符串，将NaN转换为特定值

（4）columns：列表，指定哪些列写进去

（5）header：默认header=0，如果没有表头，设置header=None，表示列名不写入csv

（6）index：关于索引的，默认True,写入索引

一、读数据

以kaggle竞赛，Titanic数据为例

1.1 pandas.read_csv

pandas.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression='infer', thousands=None, decimal=b'.', lineterminator=None, quotechar='"', quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, doublequote=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None）