爬虫入门之错误总结(二)保存数据之间出现空行以及设置csv文件标题行

本文基于之前的Python爬虫案例,后续会更新新的爬虫内容及Scrapy框架爬虫。作者将不定期分享写爬虫时遇到的坑和细节问题。此次主要解决保存数据间有空行和设置CSV文件标题行的问题,给出相应代码,让爬取的数据更规范整齐。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

经过之前的两个爬虫案例学习,相信大家对爬虫已经有了一个非常清晰的认识。前面的爬虫教程主要是通过requests,etree,csv来编写爬虫,后续也会更新一些新的爬虫内容,以及通过Scrapy框架来写的爬虫。
从今天开始,我会不定期的更新,写爬虫时遇到的坑以及细节问题。我,解决了这些问题之后就会让爬虫看起来更加舒服。
今天我们主要来解决一下,我们保存的数据之间出现空行以及设置数据标题行的问题
一、保存数据之间出现空行怎么办?

  • 这个问题的解决方法很简单,在open()中加个newline参数即可,上代码:
with open('DouBanMovieT250.csv','a+',encoding='utf-8',newline='') as fp:

这样我们爬取下来的内容之间就不会有空行了,看起来会舒服很多。
在这里插入图片描述
二、设置CSV文件标题行

  • 如果我们爬下来的只有数据,没有标题,这样看起来不会十分清楚。如果我们加上标题,就知道每一列是什么,这样我们爬取下来的数据就会非常规范。
    现在我们就来设置标题。
headers = ['电影名称','导演','主演','上映时间','国家']

writer.writerow(headers)

以上代码我们就可以写出标题行内容。完整代码;

    headers = ['电影名称','导演','主演','上映时间','国家']
    with open('DouBanMovieT250.csv','a+',encoding='utf-8-sig',newline='') as fp:
        writer = csv.writer(fp)
        writer.writerow(headers)
        for key in infos:
            writer.writerow([key['movieName'],key['director'],key['actors'],key['time'],key['country']])

这样,我们爬取下来的内容就非常规范整齐了!
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值