python使用tesseract ocr
时间: 2025-01-08 19:49:24 浏览: 42
### 如何在 Python 中使用 Tesseract OCR 进行光学字符识别
为了利用 Tesseract OCR 技术,在 Python 环境下可以借助 `pytesseract` 库来实现文字识别功能。安装必要的依赖之后,可以通过简单的几行代码完成图片到文本的转换。
#### 安装依赖库
首先需要确保已经安装了 Tesseract-OCR 工具本身以及对应的 Python 封装库 `pytesseract` 和 Pillow(PIL Fork),用于加载图像文件:
```bash
sudo apt-get install tesseract-ocr
pip install pytesseract pillow
```
对于 Windows 用户,则需下载适用于 Windows 的 Tesseract 版本,并将其路径添加至环境变量中以便于调用[^1]。
#### 基础示例代码
下面是一个基本的例子展示如何通过 Python 调用 Tesseract 来解析一张名为 "image.jpg" 的英文图片:
```python
from PIL import Image
import pytesseract
# 加载要分析的文字图片
img = Image.open('image.jpg')
# 设置语言参数为英语, 并指定引擎模式(OEM)和页面分割模式(PSM)
text = pytesseract.image_to_string(img, lang='eng', config='--oem 1 --psm 3')
print(text)
```
这段程序会尝试从给定的 JPG 文件中提取可辨识的文字内容并打印出来。其中配置选项 `--oem 1` 表明选择了 LSTM 文字识别引擎;而 `--psm 3` 则设定了自动检测完整的单页文档作为输入形式。
#### 处理多语言支持
如果目标图像是其他语言编写的,只需更改 `lang` 参数即可适应不同语种的需求。例如针对中文材料应设置成 `'chi_sim'` 或者 `'chi_tra'` 对应简体/繁体汉字。
#### 提高准确性的小技巧
当遇到难以识别的情况时,考虑预处理图像以增强对比度、去除噪声或是调整分辨率等方法有助于提升最终效果。此外还可以探索更多高级特性如自定义词典或训练集优化模型性能。
阅读全文
相关推荐


















