urlib库
urllib库是Python中的一个最基本的网络请求库。可以模拟 浏览器的行为,向指定的服务器发送一个请求,并可以保存服务器返回的数据。
urlopen函数:
在python3的urllib库中,所有和网络请求相关的方法,都被集到urllib.request模块下面,url的基本使用:
from urllib import request
resp = request.urlopen('http://www.baidu.com')
print(resp.read())
urlopen函数参数详解:
urlopen函数原型
def urlopen(url, data=None,timeout=socket._GLOBAL_DEFAULT_TIMEOUT,
*,cafile=None,capath=None,cadefault=False,context=None)
- url:请求的url
- data:请求的data,如果设置了这个值,那么将会变成post请求
- 返回值:返回值是一个http.client.HTTPResponse对象,这个对象是一个类文件句柄对象
有read(size)、resdline、resdlines以及getcode等方法。
urlretrieve函数
这个函数可以将网页上的一个文件保存到本地。
代码为:
获取文件(以百度的index文件为例)
from urllib import request
request.urlretrieve("https://www.baidu.com/", '百度.html')