# DoubanSpider
python 爬虫爬取豆瓣读书信息
程序主要是由 6 个函数组成:
get_html():请求页面,返回页面 html 源码。
get_pageurl(base_url):从 html 源码中提取分页链接部分字段。
def bookinfo(url):提取图书信息,以列表形式返回。
get_num(person):判断评价人数,没有评价人数的按 10 人处理。
write2csv():将图书信息保存为 csv 文件。
main():程序执行的主函数。
程序思路:
1.分析豆瓣读书链接,分析分页链接规律。
2.循环提取链接中书本信息。
3.将书本信息保存为 csv 文件

极致人生-010
- 粉丝: 4677
最新资源
- 医学院校计算机专业课程体系构建的探索与实践.docx
- 开题报告项目管理系统设计.pdf
- 最新最专业的企业网站推广方案.doc
- 计算机网络课程设计说明书兰州市第九中学校园网组建方案.doc
- 网络销售实习报告1000字.docx
- 国际项目管理专业资质认证IPMP试题概论.doc
- 工业互联网体系架构.doc
- 海赋国际网络营销方案.pptx
- 组合投资风险与收益与其MATLAB实现.doc
- GOSP-硬件开发资源
- 嵌入式系统期末考试试卷.doc
- 软件学院软件工程领域代码.doc
- 基于Android手机蓝牙控制的智能小车设计.doc
- 电子商务公司的口号.doc
- 网络营销战略计划.pptx
- 三菱FX2N系列PLC.ppt
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈


