windows下安装tesserocr报错——避坑指南

本文详细介绍了在Windows环境下安装tesserocr和tesseract OCR的过程,包括解决常见错误的方法,如更新环境变量、安装Visual C++ Build Tools和直接使用whl文件安装等。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

学习爬虫的时候需要安装tesserocr来进行图片的识别,在安装过程中有几个坑,一个接着一个,小问题浪费很多时间。跟着这个流程走保证分分钟搞定。

根据教程先行下载和安装tesseract,安装过程中记得勾选Additional language data。这是为了识别多语言用的。一路next即可。千万不要以为安装完了就万事大吉了,这里需要更新一下windows的环境变量。不然在python中安装和调用tesserocr的时候会报错的。

1. 更新windows的PATH环境变量,将tesseract安装目录加进去,例如“C:\Tesseract-OCR”

2. 创建一个新的环境变量TESSDATA_PREFIX,将tessdata路径加进去,例如“C:\Tesseract-OCR\tessdata”

这样tesseract的安装配置就完成了,接下来去python安装tesserocr。一般的流程是直接运行pip来安装tesserocr和pillow

pip3 install tesserocr pillow

不出意外你会遇到这个错误error: Microsoft Visual C++ 14.0 is required. Get it with “Microsoft Visual C++ Build Tools”: http://landinghub.visualstudio.com/visual-cpp-build-tools。这个错误是在安装tesserocr的时候抛出的,pillow已经安装完成了。

当然按着我们就去安装VS C++ build tools呗。安装完用pip再次安装tesserocr,这个时候你会遇到这个错Cannot open include file: 'leptoncia/allheaders.h': No such file or directory. 简直抓狂有没有。

重点来了,为了避免以上pip安装的错误,请直接下载whl文件进行安装

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值