自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 python:爬取完整版斗罗大陆并保存

可以爬标题,文本内容,用了一个报错防止网页404,存到记事本里。

2024-05-01 04:40:11 348 2

原创 python:爬虫抓取小说遇到跳章节难题

抓小说的时候,比如/218.html有时候下一章就跳到/300.html去了。在试过很多方法之后,用try还是最好的。用if也遇到过错误。这个错误表示你尝试访问的网页不存在。在你的代码中,这可能是因为提供的URL不正确,或者你尝试访问的页面在服务器上不存在了。然后关于小说我是写了一个for循环去遍历每一页,如果那一页不存在就跳过。下面附上一个爬斗罗大陆的代码吧,可以作为参考。也可以再加一个,在excpet里面,如果不是404错误,则重新抛出异常。下面是我的代码,改好的,主要是excep里面的内容。

2024-05-01 03:15:57 676

原创 记录:python爬虫抓取网页请求头

然后进去之后选着全部,然后是没有画面的,记得按请求执行!首先找到一个网站,然后按F12。一般第一个,html结尾的就是咯。

2024-04-27 19:44:59 1029 1

原创 记录:用basemap画地图

\画纬线,【生成-90到90,间隔为30的数字,标签显示在左边(例子为图一,labels=[0,1,0,0]为图二),纬线在绘图中的堆叠顺序】basemap.drawcountries(linewidth=1,color='k')\\国家勾线(线粗,颜色)basemap.drawcoastlines(linewidth=1,color='k')\\海岸线(线粗,颜色)(color='orange',lake_color='#000000')\\画出国家。然后首开构建一个一个新窗口,规划它的大小。

2024-04-07 22:22:20 1148

原创 记录:Pyhton用ggplot2画条形图

用法,先提取数据,整合成DataFrame,这是为了后续绘制堆叠条形图而准备的。很重要数据不是这个格式就不能跑了。如我们的数据是mydata。优势,有数据就行了自己会画图。

2024-03-20 14:52:53 400 1

原创 记录:spark安装

(安装java,jdk跟jre的区别, JDK它是Java开发运行环境,JRE是运行,JDK包含JRE,就是说你要写程序的话就装JDK,运行别人的看一看就行就装JRE), 安装,选那个windows的。然后装就完事了,最后自定义装到一个地方不然到时候找不到而且有空格。官网下载地址:https://www.jetbrains.com/idea/ 方法百度。下载完之后选一个你想下到的地方一直next就行。在idea里面设置,安装插件里面安装scala。安装的验证,直接在命令行输入。装完同样环境变量设置。

2024-03-19 15:43:43 453 1

原创 数据可视化

Jacques Bertin的理论基础。除了坐标是位置变量其他都是视网膜变量。

2024-03-13 14:48:22 478

原创 python记录:python图片

重点技巧是如果想同时展示两张就每一张开头加一个plt.figure().最后才加plt.show(),不然的话就是一张张出,×一个才下一张。做一个图要有一个数据跟大小这是最基础的。plt.pie(数据,大小,标签,精度)plt.show() //是展示这个图。以圆饼图变成圆环图为例子,

2024-03-12 21:15:38 372 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除