Python实现从图片提取文字

最新推荐文章于 2025-06-14 16:25:23 发布

hijack89

最新推荐文章于 2025-06-14 16:25:23 发布

阅读量1.8w

点赞数 3

CC 4.0 BY-SA版权

分类专栏： Python 文章标签： Python

本文链接：https://blog.csdn.net/helloc0de/article/details/80410250

本文介绍了使用Python3的pillow和pytesseract包来实现图片文字识别。在遇到FileNotFoundError、TesseractError和Permission denied等错误时，提供了详细的解决方法，包括设置TESSDATA_PREFIX环境变量、确保tessdata目录正确以及调整Tesseract-OCR的安装路径。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

环境

Python3
Python3的pillow、pytesseract包
可使用pip install pillow、pip install pytesseract命令安装
或者通过pycharm进行安装
识别引擎tesseract-ocr ，下载地址

代码

#-*- coding:utf-8 -*-  
import pytesseract  
from PIL import Image  

# 使用pytesseract对英文进行识别，lang参数可省略  
print(pytesseract.image_to_string(Image.open('textEng.png'，lang='eng')))  
# 使用pytesseract对中文（含英文，但识别率降低）进行识别  
print(pytesseract.image_to_string(Image.open('textCh.png'), lang='ch