- 博客(8)
- 收藏
- 关注

原创 孔夫子旧书网采集软件 - 孔网寻书
功能页面:小规模测试直接填入isbn即可,如果需要大规模采集的话,必须上传文件,这样做的目的是防止数据量过大,导致软件解析卡死填了isbn就不需要上传文件了,程序会自动判断,上传文件跟填写isbn只选其一即可隧道代理是必填项,因为这个功能涉及到了cookie,如果不加代理裸跑cookie的话很容易导致账号被封。采集后的信息会自动保存到当前目录下info文件夹。
2024-10-06 13:56:05
980
原创 streamlit部署至宝塔面板,全网最简单部署方式!!
因为懒得写前端,就用了python懒人库streamlit,但是官方文档里除了在git上部署并没有详细的在其他环境部署的教程,并且我找遍了全网的资料,都是一群垃圾文章,看得我内心极度不爽!!!都用宝塔了为什么还搞得这么复杂?经过我2个小时的研究,总算是研究出最简单的部署方法了。
2024-01-09 14:26:11
1904
1
原创 谷歌浏览器headers自动换行解决方法
但是谷歌浏览器最新版本复制粘贴下来的header信息会自动换行。在请求接口的时候很多时候需要用到header,3.搜索headers,然后取消掉这个实验项目。2:选择设置里的实验。
2023-08-30 13:41:35
1705
7
原创 安装pyinstaller失败处理方法
1.其实一点也不麻烦2.先“pip install pywin32”3.在“pip install wheel”4.试一下“pip install pyinstaller”
2022-04-20 00:38:59
2217
原创 python通过异步爬取小说
本次爬取目标网址:长夜余火(爱潜水的乌贼)_长夜余火最新章节 - 笔趣阁不难看出首页包含所有文章的链接,那么我们第一步就先获取说有章节的链接。首先引入所需要的库:import asyncioimport requestsimport aiohttpfrom lxml import etreeimport csv然后创建一个获取链接的函数,刚获取到的链接是不完整的,所以需要拼接就这样我们创建好了一个获取所有章节链接的函数:def get_url(): ...
2022-04-17 17:20:25
1268
3
原创 解决python中aiohttp证书出错的问题
报错:raise ClientConnectorCertificateError(req.connection_key, exc) from excaiohttp.client_exceptions.ClientConnectorCertificateError: Cannot connect to host cuiqingcai.com:443 ssl:True [SSLCertVerificationError: (1, '[SSL: CERTIFICATE_VERIFY_FAILED] certif
2022-04-17 11:24:01
6543
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人