最近有一个这样的需求,想要实现2张excel表的关联,当然使用sql语句是很容易的。这里用python解决。当然还有其他的办法也可以解决。特别注意的是在读取数据时pd.excel和pd.csv区别,要读取指定的sheet时。注意!!!
import pandas as pd
#右表获取
data1 = pd.read_excel(r’F:2023-04-27\汇总数据-F.xlsx’,sheet_name=‘终2’)
data1_ = data1.loc[:,[‘登记号’, ‘淋巴结增大’, ‘手术类型’, ‘手术方式’, ‘术中出血量’, ‘术中并发症’, ‘术后辅助 治疗方式’, ‘放疗次数’, ‘化疗次数’, ‘分化程度’, ’ FIGO分期’, ‘组织类型’, ‘肿瘤最大直径.1’, ‘浸润深度’, ‘宫颈间质浸润’, ‘脉管浸润’, ‘附件浸润’, ‘腹主动脉旁淋巴结转移个数’, ‘盆腔淋巴结转移个数’, ‘转移’, ‘腹腔冲洗液有无癌细胞’, ‘Ki67’, ‘ER’,
‘PR’, ‘MSH-2’, ‘MSH-6’, ‘PMS-2’, ‘MLH-1’, ‘P16’]]
#print(data1_.head())
#print(data1_.columns)
#左表获取
data2 = pd.read_excel(r’F:\2023-04-27\现病史+个人史+检验.xlsx’,sheet_name=‘现病史+个人史+检验’)
#print(data2.shape)
#print(data2.head())
#将左右2张表关联 这里用pd.merge()
data3 = pd.merge(left=data2,right=data1_,on = “登记号” , how=‘left’)
print(data2.shape)
print(data3.shape)
print(data3.head())
#将数据保存下来,后续建模使用
data3.to_excel(r’F:\ping\2023-04-27\合并.xlsx’)
python 实现excel两张表关联
于 2023-04-27 11:27:25 首次发布