file-type

Python+Selenium打造知乎关键词爬虫教程

版权申诉
6.48MB | 更新于2024-10-21 | 115 浏览量 | 0 下载量 举报 1 收藏
download 限时特惠:#19.90
知识点: 1. Python 3基础:Python是一种广泛使用的高级编程语言,Python 3是其较新的版本。在本项目中,Python 3.5.3是推荐的运行环境。Python 3引入了很多新的特性,如print函数的变化、整数除法的变化等。 2. Selenium工具:Selenium是一个用于Web应用程序测试的工具。它允许用户通过编写脚本来模拟用户在浏览器中的行为。Selenium支持多种浏览器,如Chrome、Firefox、IE等。在本项目中,Selenium被用来模拟用户在知乎网站中的搜索行为。 3. Python包管理工具pip:pip是Python的包安装工具,用于安装和管理Python包。在本项目中,pip被用来安装项目的依赖。 4. Cookie的使用:Cookie是服务器发送到用户浏览器并保存在本地的一小块数据,它会在用户下次与同一服务器交互时发送回服务器。在本项目中,Cookie被用来存储登录信息,以便进行登录后的数据抓取。 5. Python文件操作:在本项目中,涉及到对Python文件的修改,如修改HTML文件中的地址,修改配置文件中的Cookie等。 6. Python脚本运行:在本项目中,Python脚本运行在命令行环境中,使用python命令运行,后跟脚本名称。 7. 项目配置文件:在本项目中,有一个名为config.py的配置文件,需要根据实际情况进行修改,如修改Cookie等。 8. 项目依赖文件:在本项目中,有一个名为requirements.txt的文件,包含了项目运行所需的依赖,使用pip install -r requirements.txt命令进行安装。 9. 项目运行方式:在本项目中,通过在命令行中运行python run.py来启动项目。 10. 项目适用人群:本项目适用于希望学习不同技术领域的小白或进阶学习者。可以作为毕设项目、课程设计、大作业、工程实训或初期项目立项。

相关推荐

MarcoPage
  • 粉丝: 4637
上传资源 快速赚钱

资源目录

Python+Selenium打造知乎关键词爬虫教程
(28个子文件)
lightbox-plus-jquery.js 259KB
README.md 4KB
requirements.txt 78B
bs.py 92B
get_cookie.png 718KB
data_demo.png 530KB
selenium.py 4KB
run_test.py 72B
my_test.py 855B
__init__.py 0B
lightbox.css 4KB
basic.py 347B
question.py 1KB
dec.py 346B
logger.py 531B
result_demo.png 284KB
.gitignore 1KB
web_demo.png 5.01MB
config.py 1KB
run.py 1KB
__init__.py 0B
__init__.py 0B
requests.py 387B
keyword_demo.png 98KB
go.html 2KB
go.py 7KB
__init__.py 0B
answer.py 2KB
共 28 条
  • 1