嗨喽~大家好呀,这里是魔王呐 ❤ ~!
python更多源码/资料/解答/教程等 点击此处跳转文末名片免费获取
知识点:
-
爬虫基本流程
-
nodejs的使用
-
AES加密还原
开发环境:
-
解释器: python 3.8
-
编辑器: pycharm 2022.3
第三方模块:
-
crypto-js>>> npm install crypto-js
-
requests >>> pip install requests pyexecjs
模块安装:
win + R 输入cmd 输入安装命令 pip install 模块名 (如果你觉得安装速度比较慢, 你可以切换国内镜像源)
爬虫作用:
采集数据 / 模拟用户行为
(可见即可爬, 爬虫不是破解)
爬虫原理:
模拟成 客户端 向 服务器 发送网络请求
批量采集数据 / 类重复的行为 自动化
爬虫基本流程:
一、思路分析
找到数据的来源
先分析单章的小说情况
https://read.zongheng.com/chapter/1215341/68208370.html
小说内容 都在网页源代码当中
二、实现代码
-
发送请求
-
获取数据
-
解析数据
-
保存数据
代码展示
'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:926207505
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
import re
import requests
cookies = {
'sensorsdata2015jssdkcross': '%7B%22distinct_id%22%3A%2218a55c160d8979-0721567b14502b-26031f51-1764000-18a55c160d91161%22%2C%22%24device_id%22%3A%2218a55c160d8979-0721567b14502b-26031f51-1764000-18a55c160d91161%22%2C%22props%22%3A%7B%22%24latest_traffic_source_type%22%3A%22%E8%87%AA%E7%84%B6%E6%90%9C%E7%B4%A2%E6%B5%81%E9%87%8F%22%2C%22%24latest_referrer%22%3A%22https%3A%2F%2F2.zoppoz.workers.dev%3A443%2Fhttps%2Fwww.baidu.com%2Flink%22%2C%22%24latest_referrer_host%22%3A%22www.baidu.com%22%2C%22%24latest_search_keyword%22%3A%22%E6%9C%AA%E5%8F%96%E5%88%B0%E5%80%BC%22%7D%7D',
'ZHID': '6B8B1AA3F580487ED41316E742908662',
'zhffr': 'www.baidu.com',
'logon': 'NTU1MjUwMDM%3D%7CMA%3D%3D%7C%7C5Lmm5Y%2BLNjE2NjMzMjY%3D%7CdHJ1ZQ%3D%3D%7CMjEzNjIwOTA5MA%3D%3D%7C8592118A0059F35F304A37C75A03EBFA',
'__logon__': 'NTU1MjUwMDM%3D%7CMA%3D%3D%7C%7C5Lmm5Y%2BLNjE2NjMzMjY%3D%7CdHJ1ZQ%3D%3D%7CMjEzNjIwOTA5MA%3D%3D%7C8592118A0059F35F304A37C75A03EBFA',
'__zhs__': <