自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 数据清洗

数据的清洗import pandas as pddata = pd.read_excel(r'F:\数据分析—pandas\人事终表.xlsx').head()print(data) Unnamed: 0 部门 姓名 应发数 发放时间 绩效 合计工资0 0 2017借调(4人) 张琳 4131.0 2020-07工资 3800.0 7931.01 1 2017借调(4人)

2021-01-07 15:19:43 298

原创 pandas基础2

import pandas as pdimport numpy as npdata = pd.read_excel(r'F:\数据分析—pandas\meal_order_detail.xlsx').head(10) print(data.columns)data1 = data['place_order_time'].astype('str')print(data1)Index(['detail_id', 'order_id', 'dishes_id', 'logicprn_name',

2021-01-07 15:09:16 224

原创 pandas基础1

pandas功能:1.表格数据的操作:【增删改查】2.实现多个表格的处理3.数据清洗操作:缺失值,重复值,异常值,数据标准化,数据转换的操作4.实现excel的特殊操作:生成透视表,交叉表5.完成统计分析一、构建dataframeimport pandas as pdimport numpy as np#创建方法一df = pd.DataFrame(data =[['zs',20,'男','一'],['lihua',18,'女','二'],['lisi',21,'男','三']],#

2021-01-07 09:42:45 245

原创 数组的方法3

import numpy as np#去重arr = np.array([21,2,21,1,0,1]) #一维去重,展平去重,排序print(np.unique(arr))[ 0 1 2 21]arr1 = np.array([[21,2,21],[1,0,1],[1,0,1],[21,2,21]])print(arr1)print(np.unique(arr1,axis=None)) #全局去重print(np.unique(arr1,axis=0)) #纵向去重,对比整

2020-12-24 22:40:34 311 3

原创 矩阵,数组的基本特点1

矩阵,数组的基本特点1import numpy as npmatel = np.mat("1 2 3;2 3 4;3 4 5")#创建一个矩阵matel1 = np.mat("1 2 3;2 3 4;3 4 5") print(matel)print(matel1)[[1 2 3] [2 3 4] [3 4 5]][[1 2 3] [2 3 4] [3 4 5]]print(matel.shape) #矩阵的结构(3, 3)print(matel.size)#矩阵的个

2020-12-23 23:45:42 228 2

原创 数组的基本特点2

在numpy中实现数组的一些特点import numpy as nparr = np.eye(4) #生成单位数组print(arr)[[1. 0. 0. 0.] [0. 1. 0. 0.] [0. 0. 1. 0.] [0. 0. 0. 1.]]arr = np.random.rand(100)#生成平均分布# print(arr)arr1 = np.random.randn(100) #生成正态分布# print(arr1)arr = np.ones((4,4))

2020-12-23 21:10:48 144

原创 在发送请求时get与post的区别

GET和POST请求的区别1.get请求参数是通过url传递的,post请求参数是在请求体中2.get请求比post请求更不安全,因为get请求参数直接暴露在url中,所以,get请求不能用来传递敏感信息3.get请求在url中传递的参数是有长度限制的(在HTTP协议中并没有对url的长度进行限制,限制是在特定的浏览器及服务器对他的限制,不同的浏览器限制的长度不一样),post没有4.get请求参数会完整的保留在浏览器的历史记录中,post请求的参数不会保留5.get请求进行url编码(百分号编码

2020-12-09 21:39:08 789

原创 简简单单爬个虎牙直播的信息

随机选择一个虎牙直播分类, 实时获取该分类下所有页码中所有的直播间信息(房间名、主播名和热度)# 1. 导入requests模块import requestsfrom openpyxl import Workbook # 2. 实例化对象wb = Workbook()# 3. 激活工作表ws = wb.active# 4. 添加表头ws.append(['房间名','主播名','热度'])# 定义参数字典params = {"m": "LiveList","do": "g

2020-12-05 22:45:53 371 2

原创 创建线程的两种方法

1.创建线程的第一种方法(直接创建)# 直接创建# 导入threadingimport threading,time,random# 定义下载函数def download(musicName): print(musicName,'歌曲开始下载') time.sleep(random.randint(1,5)) print(musicName,'歌曲下载完毕')# 创建多线程for i in range(3): t = threading.Thread(tar

2020-12-02 22:37:24 135

原创 2020-12-01

@[toc] 爬取百度页面内容-python需求:在百度页面自定义搜索内容import requests 自定义搜索内容wd = input('请输入想要查询的内容:')定义参数字典 ```params = { "ie": "utf-8", "f": "8","rsv_bp": "1","rsv_idx": "1", "tn": "baidu","wd": wd, "fenlei": "256", "oq": "java","rsv_pq": "a10de332000

2020-12-01 23:17:56 204 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除