【pandas】DataFrame 数据处理方法汇总

读取csv文件:

data2 = pd.read_csv('data2(1).csv',encoding='gbk')

读取Excel文件:

dm = pd.read_excel(path+ "2021MCM_ProblemC_ Images_by_GlobalID.xlsx");

数据连接:

在这里插入图片描述
在这里插入图片描述

data = pd.merge(ds,dm);

在这里插入图片描述

数据筛选:

从’Lab Status’列中选取值为’Negative ID’的行;

dN = data[data['Lab Status'].isin(['Negative ID'])];

在这里插入图片描述

数据行堆叠:

dfr = pd.concat([dNt, dPt], axis=0, ignore_index=True);

数值替换:

在这里插入图片描述

dfr = dfr.replace({'Lab Status': {'Negative ID': 0, 'Positive ID': 1}});

在这里插入图片描述

随机打乱顺序:

dfr = dfr.reindex(np.random.permutation(dfr.index)); 

在这里插入图片描述

抽选出部分列:

dfr = dfr.loc[:,['Notes','Lab Status']];

在这里插入图片描述

更改数据类型:

dfr['Notes'] = dfr['Notes'].astype('string');

查看数据信息:

dfr.info()

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值