Python 使用Scrapy框架实战爬取小说排行数据，并保存

原创

已于 2023-06-21 11:00:28 修改 · 1k 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#python #scrapy #爬虫 #笔记 #经验分享

于 2023-06-21 10:33:31 首次发布

本文介绍如何使用Python的Scrapy框架来实战爬取网络小说排行榜数据，详细讲解了设置爬虫参数、页面跳转爬取、编写items.py、数据存储为CSV格式的步骤，适合初学者进行爬虫学习和实践。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

导入第三方库

import scrapy # 导入第三方库
from scrapy import Selector

创建类，并设置爬虫参数

class BiQuGe(scrapy.Spider): #创建类
    name = 'biquge' # 爬虫名字
    allowed_domains = ['quanben.la'] # 网站域名
    start_urls = ['https://www.quanben.la/top/allvisit/1.html'] # 起始网页

创建方法

    def _parse(self, response, **kwargs):
        # 获取
        book_list = response.xpath('//*[@id="main"]/div[1]/li')
        # 遍历
        for book in book_list:
            book_=Spider01Item()  # 数据存储实例
            book_["type"] = book.xpath('./span/text()')[0].extract()
            book_["name"] = book.xpath('./span/a/text()')[0].extract()
            book_["user"] = book.xpath('./span[@class="s4"]/text()')[0].extract()

            # 返回数据
            yield  book_

页面跳转爬取（以前十页测试）

 for page in ra

最低0.47元/天解锁文章

200万优质内容无限畅学

被魔封波封印的可比克

博客等级

码龄6年

37
原创

10
点赞

120
收藏

7
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: Python Scrapy框架下构建动态代理池

下一篇：: Python Scrapy框架从零开始的数据爬虫

最新评论

Python脚本实现雷神模拟器启动APP（非APPium）
Lmon-Q: ldconsole operaterecord 怎么使用
Python 使用Scrapy框架实战爬取小说排行数据，并保存
无糖巧克力star: 兄弟有没有完整代码
爬虫基本情况学习
CSDN-Ada助手: 恭喜您写完了第12篇博客！标题“爬虫基本情况学习”听起来非常有趣。您对爬虫的学习已经取得了可喜的进展，我真的很佩服您的毅力和耐心。希望您能继续保持创作的热情和努力，因为您的博客对于像我这样的初学者来说是非常有价值的。在下一步的创作中，我想提供一些建议给您。首先，您可以考虑分享一些实践经验和案例，这将使您的读者更容易理解和应用您所学的爬虫知识。其次，您可以探索一些更高级的爬虫技术，例如动态网页爬取或反爬虫策略应对等，这将进一步拓宽您的知识面。最后，您可以尝试与其他爬虫爱好者进行交流和合作，这将帮助您建立更广泛的网络，并从中获得更多灵感和学习机会。总之，我真诚地期待着您未来的创作，相信您的努力将会取得更加卓越的成果。再次恭喜您，并期待在您的博客中看到更多有关爬虫的精彩内容！
Requests模块学习笔记（一）
CSDN-Ada助手: 恭喜您完成了第13篇博客！标题为“Requests模块学习笔记（一）”，看起来非常有趣和有深度。您的持续创作精神值得称赞！对于下一步的创作建议，我谦虚地建议您可以考虑深入探索Requests模块的高级用法、与其他模块的结合应用或是分享一些您在实际项目中遇到的挑战和解决方案。期待您的下一篇博客！
Python Scrapy框架基础知识(一)
CSDN-Ada助手: 恭喜您写了第18篇博客！标题“Python Scrapy框架基础知识(一)”非常吸引人。您对Scrapy框架的基础知识进行了深入的探索，让读者能够更好地理解和应用这个强大的工具。在接下来的创作中，我建议您可以进一步深入探讨Scrapy框架的高级用法，如如何处理动态网页、如何使用代理IP等。这些主题会为读者提供更多的实践经验和技巧。谦虚地说，我相信您的经验和知识将会为读者带来更多的启发和帮助。期待您的下一篇博客，继续分享您的见解和经验！

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。