这次我们来尝试从网页获取图片,先看一下图片的格式
网络图片链接的格式:
http://www.example.com/picture.jpg
进入中国国家地理的图片库中,任意选取了一个小花鼠的照片,地址如下:
http://tg.dili360.com/contest/index.php?s=/Index/info/896/c872630d74d319644b3c1901aff97a8b
获取照片代码1
import requests
path='M:/pic/123.jpg'
url='http://tg.dili360.com/static/data/vaillant/201405/content_sc_1401241678.jpg'
r=requests.get(url)
r.status_code
with open(path,'wb')as f:
f.write(r.content)
f.close()
注意图片链接要是一个jpg结尾的地址,可以右键获取图像链接~不是网页的地址!
以及代码中的path='M:/pic/123.jpg'是自己设置的位置,注意/方向
运行代码可以获取图片
获取照片代码2(真实图名作为获取图片名)
我们继续进阶一下,把图片源文件真实的名称作为获取图片的名称
import requests
import os
url='http://tg.dili360.com/static/data/vaillant/201405/content_sc_1401241678.jpg'
root='M:/pic/'
path=root+url.split('/')[-1]
try:
if not os.path.exists(root):
os.mkdir(root)
if not os.path.exists(path):
r=requests.get(url)
with open(path,'wb')as f:
f.write(r.content)
f.close()
print("文件保存成功")
else:
print ("文件已存在")
except:
print("爬取失败")
os
库(即 os
模块)能够在 Python 程序里实现很多和操作系统相关的操作
一起来试试吧~