前几天写了一个爬虫程序,经历了一个从无到有的过程,现在将过程写下来,希望供大家学习交流,如有错误欢迎指正。
一、程序的功能:爬取公司内部网站上的图片,网站需要用户名密码登录
二、程序流程
1、先用request.post获取token
2、再用request.get获取订单号
3、最后用订单号查找图片
三、基础知识
1、get和post的区别
一般查询服务的时候用get,是从服务器上获取数据;向后台提交数据时用post,如注册登陆。post安全点,提交的数据多点,数据是放在http头信息里面的,get的参数是在URL后面的,另外,<