爬虫数据存入csv
时间: 2025-05-24 17:51:55 浏览: 19
### 如何将爬虫抓取的数据保存为CSV格式
为了实现这一目标,可以按照以下方法操作:
#### 数据准备与处理
在使用 Python 编写爬虫程序时,通常会先利用 `requests` 或 `BeautifulSoup` 等库来获取网页内容并解析所需数据。这些数据可能以列表或字典的形式存在,在将其保存至 CSV 文件之前,需确保其结构化以便于存储[^1]。
#### 使用 Pandas 库保存数据到 CSV 文件
Pandas 是一种强大的数据分析工具包,它提供了简单的方法来创建 DataFrame 并导出为 CSV 文件。下面是一个完整的例子展示如何完成此过程:
```python
import pandas as pd
# 假设我们已经从网站上提取了一些书籍的信息
book_data = [
{"title": "Book A", "author": "Author X", "price": "$20"},
{"title": "Book B", "author": "Author Y", "price": "$25"}
]
# 将数据转化为DataFrame对象
df_books = pd.DataFrame(book_data)
# 保存到本地路径下的CSV文件中,设置参数 index=False 表示不保留索引列;encoding='utf-8-sig' 解决中文乱码问题
df_books.to_csv('books.csv', index=False, encoding='utf-8-sig')
```
上述代码片段展示了如何构建一个简单的 DataFrame 来表示图书信息,并通过调用 `.to_csv()` 方法将其保存成名为 'books.csv' 的文件[^3]。
#### 手动逐行写入 CSV 文件
如果不想依赖第三方库如 Pandas,则可以直接使用内置模块 csv 进行手动写入。这种方式更加基础但也同样有效:
```python
import csv
data_rows = [["Title", "Author", "Price"], ["Book C", "Author Z", "$30"]]
with open('output.csv', mode='w', newline='', encoding='utf-8-sig') as file:
writer = csv.writer(file)
for row in data_rows:
writer.writerow(row)
```
这里定义了一个二维数组 `data_rows`, 它包含了表头和一条记录。接着打开一个新的 CSV 文件 (命名为 output.csv),并通过循环遍历每一行数据写出到该文件里去[^2]。
---
阅读全文
相关推荐


















