建筑兔零基础自学记录75|爬虫实战网络图片-6-CSDN博客

本文链接：https://blog.csdn.net/tzcnancy/article/details/147123345

这次我们来尝试从网页获取图片，先看一下图片的格式

网络图片链接的格式：
http://www.example.com/picture.jpg

进入中国国家地理的图片库中，任意选取了一个小花鼠的照片，地址如下：

http://tg.dili360.com/contest/index.php?s=/Index/info/896/c872630d74d319644b3c1901aff97a8b

获取照片代码1

import requests
path='M:/pic/123.jpg'
url='http://tg.dili360.com/static/data/vaillant/201405/content_sc_1401241678.jpg'
r=requests.get(url)
r.status_code
with open(path,'wb')as f:
            f.write(r.content)
f.close()

注意图片链接要是一个jpg结尾的地址，可以右键获取图像链接~不是网页的地址！

以及代码中的path='M:/pic/123.jpg'是自己设置的位置，注意/方向

运行代码可以获取图片

获取照片代码2（真实图名作为获取图片名）

我们继续进阶一下，把图片源文件真实的名称作为获取图片的名称

import requests
import os
url='http://tg.dili360.com/static/data/vaillant/201405/content_sc_1401241678.jpg'
root='M:/pic/'
path=root+url.split('/')[-1]
try:
    if not os.path.exists(root):
        os.mkdir(root)
    if not os.path.exists(path):
        r=requests.get(url)
        with open(path,'wb')as f:
            f.write(r.content)
            f.close()
            print("文件保存成功")
    else:
        print ("文件已存在")
except:
    print("爬取失败")

os 库（即 os 模块）能够在 Python 程序里实现很多和操作系统相关的操作

一起来试试吧~