Python xlrd库在Excel读操作中的应用
xlrd
概述
xlrd是一个用于读取Excel文件的Python库,它可以帮助用户快速提取数据并进行分析。它适合用于读取旧版Excel 文件(.xls 格式)中的数据,对于新格式的Excel文件,推荐使用其他库如openpyxl或pandas。
文档:https://xlrd.readthedocs.io/en/latest/
安装
首先,需要确保已安装xlrd
pip install xlrd==1.2.0
注意:xlrd新版本只支持xls格式,因此这里指定安装1.2.0版本,可以支持xlsx格式。
读取Excel文件
使用 xlrd 打开一个 Excel 文件
import xlrd
# 打开 Excel 文件
workbook = xlrd.open_workbook('Test.xlsx')
sheet操作
获取sheet工作表
可以通过索引或名称获取工作表
# 1.通过索引查找
sheet = workbook.sheet_by_index(0)
# 2.通过sheet名查找:
sheet = workbook.sheet_by_name('Sheet1')
获取sheet的行、列数
获取工作表的行数、列数
# 获取行数和列数
num_rows = sheet.nrows
num_cols = sheet.ncols
print(f"行数: {
num_rows}, 列数: {
num_cols}")
遍历操作sheet
# 获取sheet数量
print(workbook.nsheets)
# 遍历Excel工作簿中的所有工作表
for i in range(0, workbook.nsheets):
# 根据索引获取当前工作表
sheet = workbook.sheet_by_index(i)
# 打印当前工作表左上角单元格的值 1行1列的值
print(sheet.cell_value(0, 0))
# 获取所有sheet名字
print(workbook.sheet_names())
# 遍历工作簿中的所有工作表
for i in workbook.sheet_names():
# 根据工作表名称获取工作表对象
sheet = workbook.sheet_by_name(i)
# 打印该工作表第一行第一列的单元格值
print(sheet.cell_value(0, 0))
单元格操作
读取单元格内容
可以通过指定行和列的索引来读取单元格的值
# 读取特定单元格(例如:第一行第一列)
print(sheet.cell_value(0, 0))
# 获取第二行第三列的值
print(sheet.cell_value(1, 2))
# 获取第二行第三列的单元格对象
print(sheet.cell(1, 2).value)
print(sheet.row(1)[2].value)
读取单元格类型
可以获取单元格的类型
# 获取第一行第一列单元格的类型
cell_type = sheet.cell_type(0, 0)
# 0: NUMERIC, 1: STRING, 2: BLANK, 3: BOOLEAN, 4: ERROR
print(f"单元格类型: {
cell_type}")
遍历所有单元格
遍历整个工作表的所有单元格并打印内容
# 遍历Excel表格的每一行和每一列,以获取每个单元格的值
for row in range(sheet.nrows): # sheet.nrows返回表格的总行数
for col in range(sheet.ncols): # sheet.ncols返回表格的总列数
# 获取当前位置(row, col