Python 去除 PDF 文件水印的方法
有多种方法可以使用 Python 去除 PDF 文件中的水印,以下是几种常用的方法:
方法一:使用 PyMuPDF (fitz)
```python
import fitz # PyMuPDF
def remove_watermark(input_pdf, output_pdf):
doc = fitz.open(input_pdf)
for page in doc:
# 查找并删除水印(可能需要调整条件)
for annot in page.annots():
if annot.type[0] == 8: # 8 代表水印
page.delete_annot(annot)
# 或者删除特定文本
for block in page.get_text("dict")["blocks"]:
if "lines" in block:
for line in block["lines"]:
for span in line["spans"]: