import pandas as pd
# 1. 将数据集存入一个名为chipo的数据框内
chipo = pd.read_csv('chipotle.tsv', sep='\t')
# 2. 查看前10行内容
chipo.head(10)
# 3. 数据集中有多少个列(columns)?
chipo.shape[1]
# 4. 打印出全部的列名称
chipo.columns
# 5. 数据集的索引是怎样的?
chipo.index
# 6. 被下单数最多商品(item)是什么?
chipo.groupby(by='item_name').agg({'quantity': 'sum'}).idxmax()
# 7. 在item_name这一列中,一共有多少种商品被下单?
chipo['item_name'].nunique()
# 8. 一共有多少个商品被下单?
chipo['quantity'].sum()
# 9. 将item_price转换为浮点数
chipo['item_price'] = chipo['item_price'].str[1:].astype(float)
# string = '$2.39'
# float(string[1:])
# 10. 在该数据集对应的时期内,收入(revenue)是多少?
chipo['revenue'] = chipo['quantity'] * chipo['item_price']
chipo['revenue'].sum()
# 11. 在该数据集对应的时期内,一共有多少订单?
chipo['order_id'].nunique()
# 12. 平均客单价是多少?
chipo['revenue'].sum()/chipo['order_id'].nunique() # 方法一:利用总收入除以总订单数
chipo.groupby('order_id').agg({'revenue': 'sum'}).mean() # 方法二:利用分组聚合总操直接求解

weixin_45802166
- 粉丝: 2
最新资源
- 软件产品用户使用报告.doc
- 数字图像处理第二章课件ppt课件.ppt
- 高层框剪结构商务楼项目管理策划书.ppt
- 2023年PLC应用技术课程工学一体化教学实施方案研究.doc
- 基于PLC的X62W万能铣床电气控制.doc
- 综合布线第4章.pptx
- 基于php的网上销售系统的设计与实现.doc
- 室外电力通信电缆的敷设施工.doc
- 计算机基础培训题目.docx
- 2023年办公软件二级考试判断题及答案.doc
- 湖南航天卫星通信科技有限公司(PPT).ppt
- 做个人简历的软件ppt模板.doc
- 网络拓扑图VISIO素材大全.ppt
- 竞盛保险经纪公司的项目管理研究.doc
- 网络营销之定价策略分析.pptx
- 动态规划算法实验报告.doc
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈


