Tesseract OCR 图片识别
官方链接
1.下载
Tesseract OCR文档说明
,也可通过官网,下面位置,点击进入:
Tesseract OCR windows 下载包
,界面如下:
我这边下载了64位的
2.安装
安装其余与一般一样,默认即可,特别注意以下要选中文相关
,不想装C盘的可以选一下安装路径
3.手动添加环境变量
环境变量入口如下:
不要添加
:
系统变量名为(会报错,添加了请删除):
TESSDATA_PREFIX
配了会报错:
4.检测是否安装成功
tesseract
表示设置环境变量成功。
tesseract D:\img.jpg D:\test –l chi_sim+eng
(chi_sim是中文识别包,equ是数学公式包,eng是英文包)
示例表示:把d盘下img.jpg图片识别结果,输出至d盘的test文本
不要写代码的话,已经成功了,用命令行也能直接用。。。
5.python代码实现
vscode下载库
前提:python环境是3.9的
-m pip install pytesseract
-m pip install Pillow
以下是系统命令(选择性执行)
python -m pip install pytesseract
python -m pip install Pillow
卸载包
python -m pip uninstall pytesseract
python -m pip uninstall Pillow
删除环境
conda remove -n test37 --all
有疑问
微信小程序联系客服,及时沟通
扫描公众号,了解更多实例分享: