一般流程
- 第一步:先要明确需要获取哪些数据,是哪些列表页或内容页。
- 第二步:大致看下每个数据包(DOC,XHR等)请求参数和返回数据,明确数据返回接口。
- 第三步:通过请求重放,查看哪些参数是非必要的,剔除掉非必要参数。
- 第四步:最后就是靠经验来解密数据或加密参数了,(以后我每篇逆向文章都尽量详细的讲出自己的思路和想法,如果有说的不对的地方,还清大家指正一下,谢谢。)
过程
- 目标:aHR0cHM6Ly93d3cuc2ltdXdhbmcuY29tL3NtenE=
- 目的:获取每页的数据。
明确数据接口
- 在谷歌浏览器打开调试工具,点开XHR,通过往下滑动页面查看发送的请求数据包,发现是瀑布流。
- 看到一部分很规律的请求参数,猜测condition参数为瀑布流的“块号”?那page又是啥,还有另外请求的fundNavTrend是啥?(这两种请求都返回了加密数据)
- 百思不得其姐的我(doge)又重新尝试刷新网页,发现是他给我重定向到了展示全部板块,而不是我要的期货板块。所以我又重新滚动并记录几次完整请求,直到请求“样子”基本都一致在去看。发现page参数变正常了,但fundNavTrend也莫名消失了,先大胆猜测他是其他的板块数据,因为太少出现了。正常的样子,如下图:
- 正常了