pandas读csv文件某一列并另存为csv文件

最新推荐文章于 2024-04-02 21:59:57 发布

mengsi55

最新推荐文章于 2024-04-02 21:59:57 发布

阅读量551

点赞数 2

CC 4.0 BY-SA版权

文章标签： pandas

本文链接：https://blog.csdn.net/weixin_52740785/article/details/136262832

本文详细介绍了如何使用Python的pandas库处理CSV文件，包括读取文件、处理无命名列头的情况，以及如何将特定列单独保存为新的CSV文件，以便于知识图谱节点的创建。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

背景：

在制作知识图谱的过程中，我们经常会遇到一个很复杂的csv文件，这个时候就需要我们先将每列的数据单独获取另存为一个新的csv文件，方便我们制作知识图谱的节点

具体步骤：

pandas读取csv文件操作

import pandas as pd

path = 'xxx.csv'
data = pd.read_csv(path, encoding='utf-8')

如果csv文件列表头没有命名，只是如

，，，

我们可以先命名列表头再读取：

import pandas as pd

path = 'xxx.csv'
cols_name = ['a','b','c','d']
data = pd.read_csv(path, encoding='utf-8', names=cols_name, header=None)

注意cols_name列表长度应和csv文件列数一致

现在我想将第三列单独存入一个新的csv文件中

import pandas as pd

store_path = 'c.csv'
c = pd.DataFrame(data[['c']], columns=['c'])
c.to_csv('c.csv')

这样我们就完成了单独存储某一列的操作

将所有列都单独存储

import pandas as pd

path = 'xxx.csv'
cols_name = ['a','b','c','d']
data = pd.read_csv(path, encoding='utf-8', names=cols_name, header=None)
for s in cols_name:
    store_path = f'{s}.csv'
    tmp = pd.DataFrame(data[[f'{s}']], columns=['s'])
    tmp.to_csv(store_path)