在日常的办公自动化中,处理Excel文件是非常常见的任务。Python提供了许多库来帮助我们操作Excel文件,其中xlrd
是一个经典的选择,虽然近年来xlrd
对读取Excel文件的支持有所变化,但它仍然是一个非常有用的工具。下面我们将通过一个实际的Excel文件示例,讲解如何使用xlrd
读取文档内容的步骤、一些关键的函数或属性。
一、安装 xlrd
库
在使用xlrd
之前,首先需要安装这个库。可以使用以下命令安装:
pip install xlrd==1.2.0
注意:
xlrd
1.2.0版本及以下支持.xls和.xlsx格式的文件,从2.0.0版本开始只支持.xls格式的文件。因此,如果需要处理.xlsx格式的文件,建议使用1.2.0版本。
二、导入 xlrd
并打开Excel文件
我们将首先导入xlrd
库,并使用它打开一个Excel文件。假设我们已经有一个名为“巴黎奥运会奖牌榜.xlsx”的文件。
import xlrd
# 打开Excel文件
file_path = '/mnt/data/巴黎奥运会奖牌榜.xlsx'
workbook = xlrd.open_workbook(file_path)
xlrd.open_workbook()
函数用于打开一个Excel文件,并返回一个Book
对象,这个对象代表整个Excel文件。
三、选择工作表
一个Excel文件中可以包含多个工作表,我们需要先选择要读取的工作表。可以通过以下两种方式来选择:
- 按名称选择工作表
sheet = workbook.sheet_by_name('Sheet1') # 假设工作表名称为Sheet1
- 按索引选择工作表