上篇记录了一下用java代码爬取图片并下载到本地的代码,但是那只是对于一张图片。如果要很多图片的话,
就需要把代码改一下。如果是静态页面,可以不用webmagic(不过用webmagic更加方便);动态的话,需要
用到selenium。在这里就直接使用webmagic了,因为webmagic将爬虫需要用到的方法封装好了,而且也可以
模拟启动浏览器来爬取动态页面。
进入网页并右键查看网页源代码可以看到每一张图片的信息都在<script>标签中写着,源代码中并没有很明确的
图片地址,说明是动态网页。那么先使用开发者工具查看网页源码。
打开开发者工具方式:
1、进入网页,然后敲键盘上的F12键即可;
2、右击鼠标,单击检查即可(如下图)。
打开后的页面为: