通过selenium框架爬取图片

我家有一口鱼塘

已于 2024-04-07 11:50:02 修改

阅读量892

点赞数 6

CC 4.0 BY-SA版权

文章标签： selenium 测试工具爬虫

于 2024-04-07 11:47:37 首次发布

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/u014717706/article/details/137458452

本文详细介绍了如何通过Selenium库在Python环境中搭建环境，配置Chrome浏览器驱动，并演示了如何定位、点击、等待和抓取Bing搜索结果中的图片，提供了一个完整示例，包括获取图片URL和控制爬取数量。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

通过selenium框架爬取图片

环境搭建

搭建python环境就不在此展开了，首先安装selenium框架:

pip install selenium

下载浏览器驱动，此处仅仅以Chrome浏览器为例子， 驱动版本必须与当前系统安装的Chrome对应。

chromedriver下载，如果找不到对应版本，是因为版本太新，需要到此链接找到对应版本。

版本对应关系在链接中存在说明:
chromedriver

基本过程

首先将下载的chromedriver放置到环境变量：

current_script_path = os.path.abspath(os.path.dirname(__file__))
original_path = os.environ.get("PATH")
os.environ["PATH"] = original_path +";" + os.path.join(current_script_path,"chromedriver-win64","chromedriver.exe")

接下来启动浏览器驱动:

from selenium import webdriver

driver = webdriver.Chrome() 

# ....

driver.get(search_link)

查找指定元素

如果要找到指定元素, 可通过xpath:

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

我家有一口鱼塘

关注关注

6
点赞
踩
11

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

python selenium批量爬取图片

qq_47733923的博客

05-25

2692

文章目录一、selenium安装1.Selenium 模块安装2.浏览器驱动的下载安装二、代码三、运行结果一、selenium安装 1.Selenium 模块安装 Selenium 现在最新的版本为 3.1，由于 2.X 和 3.X 在使用上有差别，本书选择 3.0 以上版本。Selenium 官方地址为: http://www.seleniumhq.org/。可选择下载后安装。由于 pip 使用的源多为国外镜像，网速较慢。可以使用 pip -i 参数，指定国内镜像源。以下使用的 https://py

python使用selenium库如何抓取一幅图片

qq_31397725的博客

02-16

1481

要使用Python的Selenium库抓取一幅图片，你需要执行以下步骤：安装Selenium库（如果你还没有安装的话）：下载对应浏览器的WebDriver。Selenium本身不直接控制浏览器，而是通过WebDriver与浏览器交互。你需要下载与你的浏览器版本相匹配的WebDriver。例如，如果你使用的是Chrome浏览器，你需要下载ChromeDriver。配置WebDriver，使其能够在你的系统中运行。

2 条评论您还未登录，请先登录后发表或查看评论

如何用Selenium下载图片

u011954255的博客

04-04

936

其中最核心的是获取这些高清图片的URL。具体获取这些URL的方法可以关注作者主页介绍的公众号继续交流。

selenium-批量下载图片及滚动加载的元素获取

最新发布

gitblog_06760的博客

05-05

298

selenium-批量下载图片及滚动加载的元素获取去发现同类优质开源项目:https://gitcode.com/ 此仓库包含了一个基于selenium实现的Python脚本，用于实现以下功能：使用selenium批量下载网页中的图片到本地。实现浏览器滚动加载更多数据时，同步获取滚动后出现的元素。功能说明批量下载图片该脚本能够自动识别网页中的图片元素，并将它们下载到本地指定文件夹中...

selenium爬取图像

weixin_41514525的博客

09-25

1095

目标内容(红框中的图片) 代码 from tqdm import tqdm from selenium import webdriver from six.moves import urllib wd = webdriver.Chrome() names = ['spellList'] targetUrls = ['https://lol.qq.com/data/info-spell.shtml#Navi', ] for index, name in enumerate(names): wd.

selenium爬取百度图片

10-21

177

一：简介通过selenium模块，模拟火狐浏览器进行搜索下载操作。二：脚本内容 # -*- coding:utf-8 -*- # 百度图片自动爬去 # Chrome浏览器类似，设置其options： # download.default_directory：设置下载路径 # profile.default_content_settings.popups：设置为 0 禁止弹出窗口 ...

Selenium批量自动化获取并下载图片

萧鼎的博客

01-21

2401

下载WebDriver：Selenium需要与WebDriver配合使用，WebDriver是一个浏览器驱动，用于执行浏览器操作。例如，如果你使用的是Chrome，你需要下载ChromeDriver。图片大小和分辨率：在下载图片时，你可能需要调整图片的大小和分辨率以满足你的需求。在这种情况下，你需要处理浏览器的同源策略限制。导入必要的库：在Python脚本中，你需要导入Selenium的库以及用于处理图片的库（如PIL）。下载图片：对于每个找到的图片元素，提取其src属性，然后使用PIL库下载图片。

通过selenium框架爬取知乎图片

11-06

使用Selenium框架爬取知乎图片通常涉及到浏览器自动化，因为它模拟了用户在网页上交互的行为。以下是基本步骤： 1. **安装必要的库**：首先，你需要安装Python的Selenium库以及支持的WebDriver（如ChromeDriver、...

通过selenium框架爬取知乎图片并保存的本地

11-11

使用Selenium框架爬取知乎图片并保存到本地，你可以按照以下步骤操作： 1. **安装必要的库**: 首先，确保已经安装了Python的基本环境，如`requests`, `beautifulsoup4`, 和 `PIL` (Pillow)用于处理HTML内容和图像...

jingdong:jdPhone是一个基于Scrapy-Selenium的爬取京东手机信息的爬虫

05-11

由于京东的防爬限制，这里采用了模拟浏览器的工具Selenium结合Scrapy框架爬取京东。Selenium采用了headless mode无头模式和无图片模式提升了爬取速度。但是在获取AJAX动态加载的页面信息和全部网页时，依然受限于...

基于Java + selenium 爬取某网站千张图片

weixin_53536363的博客

12-28

1570

基于Java + selenium 爬取某网站千张图片学习经历

python爬图一篇过（一）【超·详细】：selenium库：webdriver环境配置+新手基础知识

qq_53021454的博客

09-29

2303

前言：一个月前，博主在学过python（一年前）、会一点网络（能按F12）的情况下，凭着一腔编程改变世界的热血和对把电脑变成工具人的兴趣，开始了python爬虫的学习。一路过来可以说走了相当多弯路，但是前不久终于成功！！！（泪目）所以今天萌新我第一次斗胆在CSDN上开一个栏目，分享我的python图片爬虫全实现过程，内心真的激动！！！希望过路大神能多多指教和鼓励，写得不对的地方请直接指出！老规矩上第一章的思维导图所谓之所以要基于selenium库爬虫，是因为现在网...

【selenium爬虫】用selenium自动化爬虫爬取海贼王动漫图片

Yhen的博客

04-18

4368

以下内容为本人原创，欢迎大家观看学习，禁止用于商业用途，转载请说明出处，谢谢合作！大噶好！我是python练习时长一个月的Yhen.很高兴能在这里和大家分享我的学习经验。作为小白，我在写代码的时候可能会遇到各种各样的BUG，我把我的一些经验分享给大家，希望对大家能有所帮助！

python基于Selenium方法爬取网页图片

Chengxuyuan0307的博客

03-06

7030

python数据爬取

【爬虫】Selenium爬取动态网页的base64图片

m0_55415167的博客

09-04

4367

Selenium爬取动态网页的base64图片并解决：页面完整加载缓慢，base64字符串的获取和格式转码，一些页面不存在，部分照片无法加载等问题。附源码

selenium+java爬取图片

小魏快起床的博客

09-21

2295

看很多大佬都在用python爬取图片，其实java也可以啦，这里就通过一个例子来跑一把啦

用selenium爬取百度图片

wengmt1996的博客

09-19

720

用selenium爬取百度图片因为百度图片是瀑布流，所以我选择了用selenium模拟鼠标点击来下载图片 from selenium import webdriver import bs4 import time import urllib.request import re name = input('请输入你要搜索的名字：') number = int(input('请输入你要保存的文件...

selenium爬百度图片

weixin_45075241的博客

05-28

1021

一开始学习爬虫的时候就想爬一下百度图片，但是怎么也爬不成功。学习了几天才知道，百度图片库中的图片也不是放在源代码里面的，用requests去直接去请求是拿不到的。最近几天学习了一下selenium，也趁着今天我的IP又被某网址封了，我也没有代理可以用，就拿百度图片来练一下，了却一下心愿。用selenium来爬百度图片就比较简单了，直接进入要爬取类型的图片的第一张详情页，获取源代码，找到图片的u...

Python爬虫爬取百度图片（使用selenium库web driver实现）

L1481333167的博客

03-13

2263

Pyhon 使用selenium库的webdriver实现爬取百度图片，爬取其他网站的方式基本差不多，window上可以直接粘贴代码使用