需要安装fitz
pip install PyMuPDF
这里我发现了问题,默认安装最新版本1.21.x 但是不支持大部分网上的api 所以分开两部分
1.21.x的
import fitz # PyMuPDF
from PIL import Image
def extract_images_from_tiff(tiff_path, output_folder):
# 打开 TIFF 文件
pdf_document = fitz.open(tiff_path)
# 遍历每个页面
for page_number in range(pdf_document.page_count):
# 获取页面
page = pdf_document[page_number]
# 获取像素图
pixmap = page.get_pixmap()
# 将像素图数据转为 PIL Image 对象
pil_image = Image.frombytes("RGB", (pixmap.width, pixmap.height), pixmap.samples)
# 保存为 JPG 格式
jpg_file_path = f"{output_folder}/page_{page_number + 1}.jpg"
pil_image.save(jpg_file_path, "JPEG")
# 关闭 PDF 文件
pdf_document.close()
# 示例用法
tiff_file_path = "./data/ISC-1226/02-121665-PB.tif"
output_folder_path = "./tif_output"
extract_images_from_tiff(tiff_file_path, out