十万条数据的csv文件 有多大_数据分析从零开始实战 | 基础篇(二)

本文介绍了如何使用Python的pandas库读写CSV和TSV文件,以及利用csv和json模块进行文件操作。通过示例代码展示了读取和写入TSV文件的过程,并详细解释了pandas的read_json和to_json函数参数。同时,提到了使用json的loads和dumps方法读写JSON文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

上节补充

CSV

逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。

TSV

TSV 是Tab-separated values的缩写,即制表符分隔值。
Python的csv模块准确的讲应该叫做dsv模块,因为它实际上是支持范式的分隔符分隔值文件(DSV,delimiter-separated values)的。
   delimiter参数值默认为半角逗号,即默认将被处理文件视为CSV。
   当delimiter='\t'时,被处理文件就是TSV。

零 写在前面

上一篇文章中带大家了解了数据分析基础,配置好了数据分析的基本环境,以及利用pandas模块读写csv文件,在本文开头,我也补充了csv与tsv的基本介绍与区别,意在更好的让大家理解相关知识点,本文将带大家继续学习文件读取。

点击查看第一篇文章:数据分析从零开始实战 | 基础篇(一)

一 基本知识概要

1.利用pandas读写tsv文件
2.利用pandas读写json文件

二 开始动手动脑

1.利用pandas读写tsv文件

在文章开头我已经说明了csv与tsv的差别,相信部分看过第一篇文章的读者应该知道怎么处理tsv文件了。

csv与tsv只是内容的分隔符不一样,前者是,,后者是\t,python读取这两类文件都使用csv模块,也可以直接利用pandas,这里我们讲利用pandas读取方式,使用的函数read_csv()to_csv()在上一篇 文章中有详细介绍,这里我直接上案例代码。

(1) 读取tsv文件代码

import pandas as pdimport os# 获取当前文件父目录路径
father_path = os.getcwd()# 原始数据文件路径
rpath_tsv = father_path+r'\data01\city_station.tsv'# 读取数据
tsv_read = pd.read_csv(

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值