- 博客(57)
- 资源 (3)
- 收藏
- 关注
原创 在同一个网站上自动下载多个子页面内容
第一次遇到这样的问题,如下图:即在同一个网站上下载多个内容时,第一个内容明明已经正常get到了,但开始第二个页面的查询 以后,原来已经查出的内容就找不到了。
2024-03-30 16:20:39
429
原创 关于v114之后的chromedriver及存放路径
本文是一篇笔记,记录了怎么应对chrome升级后selium调不起浏览器的问题,共有4个问题。
2024-03-27 15:19:14
1568
原创 笔记:pyecharts中16个主题样式效果图
今天测试了pyecharts中的16个主题样式,记录一下,以后备用1、用的代码c = ( Bar(init_opts=opts.InitOpts(theme=ThemeType.PURPLE_PASSION)) .add_xaxis([1, 2, 3, 4, 5]) .add_yaxis("product1", list2, stack="stack1", category_gap="50%") .add_yaxis("product2", list3, stack="s
2022-05-11 20:14:45
1187
原创 python修改word文本框中的内容
一、背景和学习资料这个问题持续困扰了我9天,一有空就查资料,终于解决了,必须记录一下。这期间还学习了的内容有:1、phthon-docx的文档,请参看:https://python-docx.readthedocs.io/en/latest/index.html2、网上资料:Python批量提取docx格式Word文档中所有文本框内的文本如:https://blog.csdn.net/dongfuguo/article/details/1048250583、python修改xml节点中的文本
2022-04-14 21:59:54
3951
12
原创 python文件中导入同目录下其他py文件
问题现象我做了一个python项目,快要结束时产生了大量的测试文件,给客户提交原码其实只需要其中一部分文件。所以我把必须的文件挑出来,放到一个新的文件夹“V1”中,然后调试V1中的文件,OK没有问题。同样的操作,我把需要的文件放到V2中,并把原文件夹中的内容全删除,问题就来了:...
2021-11-17 21:47:11
3176
1
原创 自学python近3年,第一次这么认真地了解“python的虚拟环境“
本文从“删除python某个项目中的非标准包,导致其他项目不能使用”开始,逐步讲解建虚拟环境的重要性、操作步骤、使用方法及快速复制其他环境中的非标准包,最终解决了自己曾经的困惑和疑问。
2021-09-27 16:10:09
129
原创 用python实现在图片上套打 或 离线套打
一、开发背景说明【工作中遇到一种情况:需要将大量数据记录,逐条打印到某种固定格式的受理单上,生成电子受理单再对外发送。如:将excel中的“用户装机登记信息”数据信息取出,填到受理单上,并保存图片。二、动图(可以放在Excel中)日常工作中可视化内容截图一、静图(一般用于PPT)二、动图(可以放在Excel中)见地址:https://v.youku.com/v_show/id_XNTE5MTkwNDk5Mg==.html...
2021-08-10 16:00:57
98
原创 Python+机器学习+数据分类
今天学习了机器学习,机器学习与统计分析有所不同,统计分析是对现有数据的总结、分析、可视化甚至挖掘;而机器学习是从现有数据中找到某种规律,并按此规律对未来的数据做预测。现在就老师讲解的“数据分类器”的内容及自己的理解做笔记,使用的数据如下:该表中前26列数据是对调查对象多角度考察的数据记录,最后一列数据是“是否欺诈”的标识,由0和1表示。机器学习的目标是:使用以上数据训练出一个可以使用的“数据分类器”。一、 思路二、 脚本import pandas as pdfrom sklearn.mo
2020-10-24 23:48:13
543
原创 Python+networkx 网络可视化方法
一、 背景今天准备学习网络图networkx的基本操作。选择的用例为一百年以前美国一些社会科学家从报纸上搜集的“知名女士参加社会活动的记录”,表结构简化如下:通过网络图能否找出社交中的明星呢?这里说的明星是指:参加社交活动较多且认识其他知名女士较多的Lady。二、 思路按照以上定义,我们首先探索数据,先找出参加活动较多的女士,结果如下,看起来W01、W03参加活动最多,她们是不是就是我们要找的“明星”呢?我们还需要找一下,这些人中,谁认识的人较多。这个目标怎么实现呢?老师给我们一个思路:假设参
2020-10-23 16:52:58
3282
1
原创 Pyecharts的主要图表
今天有好多疑问,没有办法跟课,于是先解决自己的第一个疑问吧——pyecharts有多少种图表?整理一下,否则跟课也有点“云深不知处”的感觉。下面整理pyecharts图(38种)的函数名及图样:一、基本图表1、日历图Calendar()2、漏斗图Funnel()3、仪表盘图Gauge()4、关系图Graph()5、水球图Liquid()6、平行坐标系Parallel()7、饼图Pie()8、极坐标图Polar()9、雷达图Radar()10、桑基图Sankey()
2020-10-22 21:17:43
3230
1
原创 Python+pyecharts在地图上呈现数据(下)
本文主要内容一、分析目的及数据源简介二、数据展示1、展示流出流入数据方向2、展示流入人口总量3、使用网络图揭秘不同省份之间的关系三、本节新知识点小结一、分析目的及数据源简介本案例可以直观地看出,我国人口在各省之间的流动特点,并据此了解各省之间的相关性。本次学习使用的数据为1985至1990年(好久远呀)的人口迁移数据。数据样式如下:其中from 为流出省份,to为流入省份,count为人口数量。二、数据展示1、展示流出流入数据方向在实际研究中,我们为了观察主要特征,往往采取抓大放小的措施。在
2020-10-21 17:56:52
3529
1
原创 Python+pyecharts在地图上呈现数据
本文主要内容前言一、 地图的基本使用方法二、 地图与数据结合1、各省GDP在地图上展示2、去除地图上的数据信息3、用颜色区别数据大小4、自己定义颜色区间5、修改点的显示效果6、修改地图的色彩三、 Pyecharts制作地图的其他几种方式1、Map()2、Geo()3、Bmap()4、Map3D()前言今天和老师一起学习在地图上呈现数据,使用的库为pyecharts。看到这个库名时,我有似曾相似的感觉,翻看了一下,前段时间想实现可交互的图表时,了解过这个库。所以关于这个库,我这儿顺便多说几句吧。Pye
2020-10-21 09:34:57
23262
17
原创 Python + pandas + 不同客户购买力图形显示
数据源:Kaggle网站上一个“blackFriday.csv”文件( Kaggle网站是一个流行的数据科学竞赛平台),下载下来的数据字段如下:本节通过该数据,练习使用数据的三维图形化、相关性及相关性热力图,直观地查看出哪些因素影响购买力,其三维散点图是怎样的。一、怎样查看哪些因素影响购买力?方法1:逐一探索各字段对购买力的影响趋势数据量较小时,可以逐一查看每个字段与购买额字段的相关系数。相关系数较大的,影响力就大。而本文件数据量较大(53万条),不便直接展示各字段与购买额之间的散点图,所以可将
2020-10-19 13:28:54
458
原创 python+selenium爬取数据常见问题整理
一、 前言10月4号接了一个需求:写个脚本下载几个网站的数据,以减轻其日常手工下载数据之苦,毕竟需要下载近300个文件,手工点选下载确实苦不堪言。紧锣密鼓写了3天,期间也遇到了不少问题,最终都一一解决,作为总结,我将之前遇到的问题一一整理,也不枉费这么多天的时光。二、 问题及解决方案1、 知道下载地址,为什么下载不了数据?在检查页面的html文档后,我发现客户需要下载的内容都有固定地址,我想我是不是可以不去页面点选,直接用browser.get(url)的方法得到数据,这样就避免模拟手工点选各个T
2020-10-13 08:36:40
2264
3
原创 Python+pandas+历年音乐器材类商品评分简析(笔记)
从题目来看,这节课应该是探究某一事物随着时间推移而发生的变化情况。所以核心内容应该是探究时间序列数据变化趋势。详细如下:一、 取数据数据来源:http://jmcauley.ucsd.edu/data/amazon/links.html亚马逊电子商务网站,提供了一些数据资源,上图页面上的数据为1996年5月至2014年7月,20余年的商品评论。Ratings only 数据的表头为“user,item,rating,timestamp”我们下载“Musical Instruments”中的评论文件
2020-09-22 17:01:39
714
原创 Python+pandas +画出股票的收盘价的趋势图(笔记)
题目说的好像和股票有关,实际上就是一个时间序列图。但本节主要介绍时间序列的几个常用统计方法。详细如下:1、 画出股票(代码:688022)的收盘价趋势图【脚本】import tushare as tsimport matplotlib.pyplot as pltframe = ts.get_k_data('688022', start='2019-07-22')frame = frame.set_index('date')frame.index = pd.to_datetime(frame.i
2020-09-18 09:39:04
7869
原创 Python+pandas+每天股票涨了多少
第一步:得到某支股票历年来的交易数据方法见:https://blog.csdn.net/zwy_0309/article/details/108217342在此,我使用以下脚本得到股票(代码:688022)从开始时间至现在的行情信息:【脚本】import tushare as tsframe = ts.get_k_data('688022', start='2019-07-22')print(frame)【结果】date open close high low v
2020-09-17 11:35:01
718
python之matplotlib画图函数笔记.pdf
2020-09-28
tushare-1.2.60-py3-none-any.whl
2020-08-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人