
爬虫实战
米儿~
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python2.x与python3.x的Urllib库的转换
升级合并后,模块中包的位置变化的地方较多。在此,我们总结并为大家列举一些常见的位置变动,方便之前用Python2.X的朋友在使用Python3.X的时候可以快速掌握,其他的我们在用到时具体为大家讲解。常见的变化有:在Python2.X中使用import urllib2---------对应的,在Python3.X中会使用import urllib.request, urlib.error。在Python2.X中使用import urlib---------对应的,在Python3.X中会使用impo原创 2020-10-30 08:54:14 · 379 阅读 · 0 评论 -
爬虫项目实战(二)
1、XPath介绍XPath,全称XML Path Language,即XML路径语言,它是一门在XML文档中查找信息的语言。最初是用来搜寻XML文档的,但同样适用于HTML文档的搜索。所以在做爬虫时完全可以使用XPath做相应的信息抽取。2、XPath的常用规则:这里列出了XPath的常用匹配规则,示例如下: .//title[@lang='eng‘],这是一个XPath规则,代表的是选择所有名称为title,同时属性lang的值为eng的节点,后面会通过Python的lxml库,利用XPath.原创 2020-06-25 23:21:22 · 455 阅读 · 0 评论 -
爬虫项目实战(一)
大纲:一、爬虫介绍二、网络请求requests1、requests库的基本使用2、GET&POST查看电脑当前的python版本在cmd中输入命令:python -V如果电脑中有两个python环境,例如想在python3中下载时,使用命令:pip3 install requests 即可接下来以爬取古诗文网为例https://www.gushiwen.org/打开古诗文网址,按F12,查看源代码而之前代码中显示是由python代码的爬虫程序原创 2020-06-15 00:23:31 · 2249 阅读 · 0 评论