
python爬虫
broccoli2
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
selenium爬取数据打开浏览器新的标签页
如何利用webdriver打开多个标签页和链接呢?经实践,网上流传的传入“ctrl+t的按键事件”方法针对谷歌浏览器并不适用。实践证明以下方式可以正常打开谷歌浏览器新的标签页。browser.execute_script("window.open('" + url + "');")完整例子:import timefrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium import webdriver'''爬取原创 2020-06-12 23:18:11 · 1378 阅读 · 0 评论 -
python+selenium爬取链家网房源信息并保存至csv
python+selenium爬取链家网房源信息并保存至csv抓取的信息有:房源’, ‘详细信息’, ‘价格’,‘楼层’, '有无电梯import csvfrom selenium import webdriverimport timefrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support i...原创 2019-12-27 20:21:13 · 1968 阅读 · 1 评论 -
python+selenium多线程与多进程爬虫
使用python+selenium抓取深圳证券交易所本所公告数据,刚开始是用单进程爬取的,最近将代码修改了一下,分别用多进程和多线程进行抓取,速度非常快。如果对selenium不了解的请移步别的地方学习一下。多进程爬取# coding=utf-8'''多进程抓取深圳证券交易所本所公告数据标题和公告内容写入了不同的csv文件里Author:西兰Date:2019-11-30'''...原创 2019-12-01 11:37:26 · 17536 阅读 · 9 评论 -
TypeError: __init__() takes 2 positional arguments but 3 were given
近日在使用selenium+python3.6爬取一个网站时遇到这个问题:Traceback (most recent call last): File "D:/pythoncode/spider/spiderforQA.py", line 17, in <module> wait=WebDriverWait(driver,10).until(EC.presence_of...原创 2019-05-08 10:10:00 · 12942 阅读 · 4 评论