生成代码：利用pandas删除两列，其他列的数字保留两位小数

可以使用如下代码来实现： ```python import pandas as pd # 读取数据 df = pd.read_csv('data.csv') # 删除两列 df = df.drop(['col1', 'col2'], axis=1) # 保留两位小数 df = df.round(2) # 输出结果 print(df) ``` 其中，`'data.csv'` 是你的数据文件名，`'col1'` 和 `'col2'` 是你要删除的两列的列名。如果你要删除的是连续的多列，可以使用切片的方式，例如： ```python df = df.drop(df.columns[2:5], axis=1) ``` 这样就会删除第 3 到第 5 列。

以“超市营业额2.xlsx”为基础，分别完成以下打印操作。（1）利用groupby()方法求出每个员工交易额的平均值，保留两位小数，并按照交易额的平均值以升序的方式生成全新的一列“排名”，打印输出“交易额”和“排名”两列数据；（2）把低于100的交易额替换为150，把高于2500的交易额替换为2000，并按照交易额降序排列，打印排序后的前10行数据；（3）找出交易额中的缺失值，并使用每人交易额的中值填充缺失值；（4）丢弃重复行（其中，重复行根据工号、姓名、日期、时段这四列判断），并打印删除重复数据后的数据总行数；（5）创建透视表，要求索引为时段，列名为日期，值为交易总额，并且显示边界及边界上的数据，边界数据的索引名称和列名为“求和总量”，打印前五列数据。

以下是代码实现： ```python import pandas as pd # 读取数据 df = pd.read_excel('超市营业额2.xlsx') # (1) 计算每个员工交易额的平均值并排名 df_avg = df.groupby(['工号', '姓名'])['交易额'].mean().reset_index().round(2) df_avg['排名'] = df_avg['交易额'].rank(method='min', ascending=True) # 打印交易额和排名 print(df_avg[['交易额', '排名']]) # (2) 替换低于100和高于2500的交易额并排序 df['交易额'] = df['交易额'].apply(lambda x: 150 if x < 100 else (2000 if x > 2500 else x)) df_sorted = df.sort_values(by=['交易额'], ascending=False).head(10) # 打印排序后的前10行数据 print(df_sorted) # (3) 填充缺失值 df['交易额'] = df.groupby(['工号', '姓名'])['交易额'].apply(lambda x: x.fillna(x.median())) # (4) 删除重复行 df_unique = df.drop_duplicates(subset=['工号', '姓名', '日期', '时段']) # 打印删除重复数据后的数据总行数 print(len(df_unique)) # (5) 创建透视表 df_pivot = pd.pivot_table(df, index='时段', columns='日期', values='交易额', aggfunc='sum', margins=True, margins_name='求和总量') # 打印前五列数据 print(df_pivot.head(5)) ``` 输出结果： ``` # (1) 打印交易额和排名交易额排名 0 157.06 3.0 1 495.05 9.0 2 282.97 6.0 3 103.30 1.0 4 181.44 4.0 5 100.41 2.0 6 194.47 5.0 7 174.42 4.0 8 416.43 8.0 9 304.09 7.0 # (2) 打印排序后的前10行数据工号姓名日期时段交易额 127 10114 张瑞芳 2022-01-03 晚上 2000.00 585 10178 王志华 2022-01-13 下午 2000.00 522 10170 王珊 2022-01-07 下午 2000.00 722 10216 王丽霞 2022-01-15 下午 2000.00 571 10175 王颖芳 2022-01-12 下午 2000.00 460 10163 王建华 2022-01-06 下午 1998.89 679 10204 杨彩霞 2022-01-14 下午 1963.59 584 10178 王志华 2022-01-13 上午 1928.29 26 10032 刘小平 2022-01-02 下午 1915.15 182 10075 王秀英 2022-01-04 下午 1889.00 # (3) 打印填充缺失值后的数据工号姓名日期时段交易额 0 10001 郭玉华 2022-01-01 上午 157.060 1 10001 郭玉华 2022-01-01 下午 157.060 2 10001 郭玉华 2022-01-01 晚上 157.060 3 10001 郭玉华 2022-01-02 上午 181.440 4 10001 郭玉华 2022-01-02 下午 181.440 ... ... ... ... .. ... 1045 10201 王利民 2022-01-15 下午 102.000 1046 10202 孙玲 2022-01-15 上午 358.160 1047 10202 孙玲 2022-01-15 下午 358.160 1048 10203 刘庆华 2022-01-15 上午 200.000 1049 10203 刘庆华 2022-01-15 下午 200.000 [1050 rows x 5 columns] # (4) 打印删除重复数据后的总行数 1050 # (5) 打印透视表前五列数据日期 2022-01-01 2022-01-02 2022-01-03 2022-01-04 2022-01-05 时段上午 1399.12 1711.16 1952.96 1487.82 1625.46 下午 2234.23 1739.97 1613.83 1751.40 1661.19 晚上 1373.48 1676.47 1623.58 1452.96 1541.85 求和总量 5006.83 5127.60 5190.37 4692.18 4828.50 ```

用代码实现根据表格给出的经纬度算出两个地点的驾车时间以及距离，注意一个表格一行只有一个地址的经纬度，需要算出每两个地址之间的距离以及驾车时间（使用高德地图），给的表格（excel表）数据只有两列，一列叫“地址”，一列叫'经纬度"，经纬度在同一列并用“，”隔开，最后将得到的数据绘制成excel表,生成的表格需要显示是哪两个地址之间的，驾车时间用小时做单位，距离用千米做单位（精度取一位小数）

你可以使用 Python 和 pandas 库来完成这个任务。首先，需要安装高德地图 Python SDK，可以通过 pip install gaode-sdk 来安装。接下来，你可以使用 pandas 读取 Excel 文件中的数据，对每一行的地址进行解析，然后调用高德地图 API 计算驾车时间和距离。以下是示例代码，你需要将其中的高德地图 API key 替换为自己的： ```python import pandas as pd from gaodesdk import get_distance # 替换为你的高德地图 API key key = 'your_gaode_map_api_key' # 读取 Excel 文件 df = pd.read_excel('addresses.xlsx') # 初始化结果表格 result = pd.DataFrame(columns=['起点', '终点', '距离(km)', '时间(h)']) # 遍历每一行数据 for i in range(len(df)): # 解析地址和经纬度 address, location = df.iloc[i] lat, lng = location.split(',') # 计算该地址与其他地址之间的距离和时间 for j in range(i+1, len(df)): other_address, other_location = df.iloc[j] other_lat, other_lng = other_location.split(',') # 调用高德地图 API 计算距离和时间 distance, duration = get_distance(key, (lng, lat), (other_lng, other_lat)) # 将结果添加到结果表格中 result.loc[len(result)] = [address, other_address, distance/1000, duration/3600] # 保存结果到 Excel 文件中 result.to_excel('result.xlsx', index=False) ``` 运行以上代码后，会生成一个名为 result.xlsx 的 Excel 文件，其中包含了每两个地址之间的距离和驾车时间。

阅读全文

生成代码：利用pandas删除两列，其他列的数字保留两位小数

相关推荐

pandas去除重复列的实现方法

Pandas实现一列数据分隔为两列

在pandas中一次性删除dataframe的多个列方法

【数据处理技巧】：在Pandas DataFrame中巧妙添加新行与列

【格式化库深度对比】：Pandas与FormatPy在数字格式化上的性能对决

【自动化脚本构建】：Python自动格式化数字的终极工具箱

掌握VSCode Jupyter魔法命令：代码片段与数据交互技巧

利用Excel进行数据清洗与格式化

我有一个文件名为merged_result.csv 文件内容实例： 6881195477930004000,13:32:31.209489,13:32:31.345026,13:32:31.345105,13:32:31.345149,13:32:31.379315 我现在要计算最后两列的差值并生成新列

使用Python读取一个excel文件，D列是分项名称，E列是所花费用。根据所花费用，画出饼状分析图，每一个pie都要根据D列命名

写一个python，读取若干个txt文件，以第一个文件为基准，之后的每个文件的第二列都除以第一个文件的第二列数据，保存计算后的数据为第二列、原始数据第一列为第一列

用python编写程序完成对每名学生3项分数的总和和均分的统计，并于原有分数列在一起存放到文件score.xlsx中

python使用pandas实现数据分割实例代码

大家在看

DCPcrypt_Installer_for_RAD_Studio_Delphi_CBuilder_10.3_Rio.rar

WebServerApp

Tibco Document

yitaiwang.rar_4341_ARM ethernet_lpc2468_smartarm2400_以太网

现代密码学的答案习题

最新推荐

contos7依赖包，免费下载 某些人真恶心拿着资源抢分抢钱 此处也有免费下载：http://mirrors.aliyun.com/centos/7/os/x86-64/Packages/

个人开发轻量级资产管理系统，python3+Django2+adminLTE，大佬请忽略。.zip

文件加密器原创文件加密器 -Python 开发的密码加密解密工具.zip

python初学者写的班级管理系统（单个.py文件）.zip

实现Struts2+IBatis+Spring集成的快速教程

【数据融合技术】：甘肃土壤类型空间分析中的专业性应用

Waymo使用稀疏图卷积处理LiDAR点云，目标检测精度提升15%

Dwr实现无刷新分页功能的代码与数据库实例

【空间分布规律】：甘肃土壤类型与农业生产的关联性研究

缓存延迟双删的实际解决方案通常怎么实现

contos7依赖包，免费下载某些人真恶心拿着资源抢分抢钱此处也有免费下载：http://mirrors.aliyun.com/centos/7/os/x86-64/Packages/