某小说站点逆向还原文本——CSS反爬，AST解混淆

mYlEaVeiSmVp

于 2023-09-28 18:16:00 发布

阅读量2k

点赞数

CC 4.0 BY-SA版权

分类专栏： Web逆向文章标签： css 前端

本文链接：https://blog.csdn.net/leavemyleave/article/details/133362961

Web逆向专栏收录该内容

8 篇文章 ¥359.90 ¥399.90

订阅专栏

前段时间视频刷到一个小说站点，其内容没啥营养，却使用了CSS反爬和OB混淆。于是我去读了一下它的算法。读懂并写出脚本后，感觉这个网站逆向难度较小，可以尝试解决，即：只需要给出小说某一章的html链接，就能获取其内容。

样本地址：aHR0cHM6Ly9nLmhvbmdzaHUuY29tL2NvbnRlbnQvMTIxMTAyLzI3NzM2MDkuaHRtbA==

技术栈：

ts-node、typescript。
babel处理AST。
superagent发起网络请求。
cheerio解析HTML文本。

算法分析

小说内容的HTML结构很简单，每段都是一个p标签，文本中间有一些不和谐的span标签：

<div class="rdtext"fsize="16">
    <p><span class="context_kw6"></span>叫顾凡<span class="context_kw0"></span>顾<span class="context_kw7"></span>得<span class="context_kw4"></span>顾<span class="context_kw0"></span>平

了解本专栏