python爬虫

最新推荐文章于 2025-07-21 10:19:08 发布

香菜南波万

最新推荐文章于 2025-07-21 10:19:08 发布

阅读量723

点赞数 3

CC 4.0 BY-SA版权

文章标签： python 爬虫开发语言

本文链接：https://blog.csdn.net/studyinstall/article/details/146448455

爬取一个百度知道的一张图片中国建行的

所需要的包有

import os 
import requests
from lxml import etree 
如果没有安装lxml和requests的
在pycharm终端输入命令:
pip install requests
pip install lxml

首先确定一个爬取的网站的图片

url = 'https://zhidao.baidu.com/business/profile?id=108421'

使用一个代理

headers = {
    'User-Agent':
        'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/134.0.0.0 Safari/537.36 Edg/134.0.0.0'
}

使用requests请求一下请求头

response = requests.get(url,headers = headers)
response.encoding = response.apparent_encoding
response_text = response.text

使用lxml解析网站的信息如果是图片需要加content

tree = etree.HTML(response_text)
firse_xpath = tree.xpath('/html/body/div[3]/div[1]/div[2]/img/@src')
print(firse_xpath)

请求一下firse_xpath拿到的图片地址，然后直接保存到指定文件

result = requests.get(url2)
save_dir = r'D:\temp2'
save_path = os.path.join(save_dir,'wb.jpg')
if not os.path.exists(save_dir):
    os.makedirs(save_dir)
print(f'目录在{save_path}')

写入指定文件夹

with open(save_path,'wb') as f:
    f.write(result.content)

效果如下：

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

香菜南波万

关注关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Python爬虫

LegendaryChen的博客

01-11

4110

选择一个主题，用Python语言编写一个网络爬虫程序，将文字和图像等信息抓取到MySQL中保存，（如果有图片数据，图片数据可以只在数据库存放路径，图片资源存储到文件夹）。

Python爬虫100例教程导航帖（已完结）

梦想橡皮擦，专栏100例写作模式先行者，现象级专栏《Python 爬虫 100 例》作者、《滚雪球学 Python 专栏》原创者

08-14

20万+

Python爬虫入门教程导航，目标100篇。

参与评论您还未登录，请先登录后发表或查看评论

带你玩转Python爬虫（爬取电影资源篇）

热门推荐

阿玥的小博客

03-16

76万+

跟着我，python你也可以！

Python爬虫实战：利用代理IP爬取百度翻译

努力让自己发光，对的人才能迎着光而来

08-06

25万+

Python爬虫实战：利用代理IP爬取百度翻译

Python爬虫之入门保姆级教程，学不会我去你家刷厕所

小袁同学的博客

05-26

13万+

注重版权，转载请注明原作者和原文链接作者：Bald programmer 今天这个教程采用最简单的爬虫方法，适合小白新手入门，代码不复杂爬虫的介绍以及原理等等七七八八的东西我就不多bb了，咋们直接上教程本案例我就以彼岸图网这个网站做教程，原网址下方链接 https://pic.netbian.com/ 首先打开咋们的网站可以看到有很多好看的图片，一页总共21张图片我们右键选择检查或者直接按F12来到控制台点击左上角的箭头或者快捷键ctrl+shift+c，然后随便点在一张图片上面 ..

【Python爬虫详解】第一篇：Python爬虫入门指南

Luck_ff的博客

04-20

3514

网络爬虫（Web Crawler）是一种自动获取网页内容的程序。它可以访问网站，抓取页面内容，并从中提取有价值的数据。在信息爆炸的时代，爬虫技术可以帮助我们高效地收集、整理和分析互联网上的海量数据。为了应对不同的爬取需求和反爬挑战，Python生态系统提供了多种爬虫相关的库。库名特点适用场景Requests简单易用的HTTP库基础网页获取HTML/XML解析器静态网页内容提取Scrapy全功能爬虫框架大型爬虫项目Selenium浏览器自动化工具需要JavaScript渲染的网页。

Python爬虫（34）Python爬虫高阶：动态页面处理与Playwright增强控制深度解析

CSDN博客专家，领域包括但不限于：AI、大数据、Python、架构师，有合作、课程、问题、疑惑请私信博主

05-23

1万+

随着Web技术的快速发展，前端工程化进入3.0时代，动态渲染、反爬技术升级和性能需求激增成为主要挑战。传统爬虫方案在动态内容获取、反爬对抗和维护成本方面面临困境。本文提出了一种基于Playwright和BeautifulSoup的动态爬虫解决方案，通过双引擎架构、浏览器指纹伪装和动态内容解析，有效应对了这些挑战。该方案在电商价格监控和社交媒体舆情分析等场景中表现出色，显著提升了处理速度和反爬能力。未来，该技术将继续优化，为高频次、大规模数据抓取提供更高效的解决方案。

Python爬虫系列（一）——手把手教你写Python爬虫

cun的博客

10-23

4万+

适合初学者快速上手入门，以爬取CSDN和百度图片为例。

Python爬虫详解（一看就懂）

我的博客

06-21

9万+

爬虫简单的来说就是用程序获取网络上数据这个过程的一种名称。如果要获取网络上数据，我们要给爬虫一个网址（程序中通常叫URL），爬虫发送一个HTTP请求给目标网页的服务器，服务器返回数据给客户端（也就是我们的爬虫），爬虫再进行数据解析、保存等一系列操作。爬虫可以节省我们的时间，比如我要获取豆瓣电影 Top250 榜单，如果不用爬虫，我们要先在浏览器上输入豆瓣电影的 URL ，客户端（浏览器）通过解析查到豆瓣电影网页的服务器的 IP 地址，然后与它建立连接，浏览器再创造一个 HTTP 请求发送给豆瓣电影的服务器，

【Python爬虫实战】从基础概念到HTTP/HTTPS协议全面解析

易辰的博客

10-04

2万+

Python 爬虫是一种通过编写程序自动化访问网页并从中提取信息的技术，通常用于从互联网上收集数据。它能够模拟用户浏览器行为，自动加载网页、抓取数据，并将所需信息存储在数据库或文件中，供后续分析使用。Python 是进行爬虫开发的常用语言，因为它拥有丰富的第三方库和简单易懂的语法，能够快速开发高效的爬虫。整个爬虫流程包括从请求网页、解析数据到数据清洗、存储和反爬机制的处理。流程的每一步都可以根据实际需求进行调整和优化。以下是常见的爬虫流程图示：明确抓取目标发送 HTTP 请求解析网页数据提取。

python爬虫代码源码.rar

02-25

python爬虫程序可用于收集数据。这也是最直接和最常用的方法。由于爬虫程序是一个程序，程序运行得非常快，不会因为重复的事情而感到疲倦，因此使用爬虫程序获取大量数据变得非常简单和快速。由于99%以上的网站是...

Python爬虫框架Scrapy教程《PDF文档》

10-02

《Python爬虫框架Scrapy教程》主要是针对学习python爬虫的课程，又基础的python爬虫框架scrapy开始，一步步学习到最后完整的爬虫完成，现在python爬虫应用的非常广泛，本文档详细介绍了scrapy爬虫和其他爬虫技术的...

Python爬虫实战案例教程.pdf

09-19

以一个电子书的网站为例来实现python爬虫获取电子书资源。爬取整站的电子书资源，按目录保存到本地，并形成索引文件方便查找。爬取的目标网站：苦瓜书盘步骤：爬取->分析、解析->保存对于一个不需要登录验证的...

Python爬虫框架Scrapy教程完整版PDF

04-06

Python爬虫JS逆向进阶课程-课程网盘链接提取码下载 .txt

06-08

这门课程是Python爬虫JS逆向进阶课程，将教授学员如何使用Python爬虫技术和JS逆向技术获取网站数据。学习者将学习如何分析网站的JS代码，破解反爬虫机制，以及如何使用Selenium和PhantomJS等工具进行模拟登录和数据...

用算法思维了解一个停车点的车辆情况

Buy0515的博客

07-20

487

如果你希望了解一个停车点的车辆情况，你需要有一些网络知识，了解 APP 和相关软件服务器之间的通讯协议，当了解了具体的接口之后就可以写一个包含循环的程序来定时判断某一个点的车辆数量信息，这个程序可以用 Python 来完成，涉及到的库不会超过 2 个，基本就是。对于这样的操作来说，真的只需要。

《python语言程序设计》2018版--第8章9题编写函数实现二进制转十六进制（字符串变整数）！！整数没法进行下标

电饭叔

07-18

799

使用硬性指派确实帮助了我很多。循环步幅是很好的使用工具。如何转换呢？？二进制转十六进制通过智能ai一下子就生成了！！哇塞！！质的飞跃。但是我还是用毕竟原始的办法来弄吧。

深度学习方法生成抓取位姿与6D姿态估计的完整实现

ZPC8210的博客

07-20

793

如何将GraspNet等深度学习模型与6D姿态估计集成到ROS2和MoveIt中，实现高精度的机器人抓取系统。

深入解析与实战应用：利用Python和Amazon Product Advertising API实战分析