通过selenium框架爬取图片

本文详细介绍了如何通过Selenium库在Python环境中搭建环境,配置Chrome浏览器驱动,并演示了如何定位、点击、等待和抓取Bing搜索结果中的图片,提供了一个完整示例,包括获取图片URL和控制爬取数量。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

通过selenium框架爬取图片

环境搭建

搭建python环境就不在此展开了, 首先安装selenium框架:

pip install selenium

下载浏览器驱动, 此处仅仅以Chrome浏览器为例子, 驱动版本必须与当前系统安装的Chrome对应

chromedriver下载,如果找不到对应版本, 是因为版本太新, 需要到此链接找到对应版本。

版本对应关系在链接中存在说明:
chromedriver

基本过程

首先将下载的chromedriver放置到环境变量:

current_script_path = os.path.abspath(os.path.dirname(__file__))
original_path = os.environ.get("PATH")
os.environ["PATH"] = original_path +";" + os.path.join(current_script_path,"chromedriver-win64","chromedriver.exe")

接下来启动浏览器驱动:

from selenium import webdriver

driver = webdriver.Chrome() 

# ....

driver.get(search_link)

查找指定元素

如果要找到指定元素, 可通过xpath:


                
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值