Tesseract-OCR使用教程

本文详细介绍了TesseractOCR在Mac、Linux和Windows下的安装步骤,包括所需依赖的安装,以及遇到的常见问题如环境变量设置、Python接口使用错误等。同时涵盖了jTessBoxEditor的安装和使用,以及Python结合Tesseract进行图像处理和验证码识别的应用示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、Tesseract-OCR安装

1,Mac下安装

brew install automake autoconf libtool autoconf-archive pkgconfig leptonica icu4c gcc pango leptonica 
brew info tesseract 
brew install tesseract

2,Linux下安装

安装并编译Tesseract

1.下载安装编译要用到的文件。(此网盘tesseract为3.0版本)

在安装tesseract时,需要下载很多文件,网上有的博客中给了下载链接,但是好多都需要翻墙才能下载,在这里我把所需要的文件下载到了网盘里供大家下载,https://pan.baidu.com/s/1mj6YTIw   提取码是:95p5

注:一定要先把这些文件下载到本地再进行后面的安装,因为后面会用到这些文件。

2.安装相应lib。

打开linux下的命令行,分别输入以下命令:

sudo apt-get install libpng12-dev libjpeg62-dev libtiff5-dev libtool gcc g++ automake

3.下载安装leptonica。

在linux命令行中输入:

wget http://www.leptonica.org/source/leptonica-1.71.tar.gz

执行完毕后就得到了leptonica-1.71.tar.gz压缩文件,解压:

tar -zxvf leptonica-1.71.tar.gz 
./configure & make &make install

4.下载安装tesseract。

安装编译tesseract所需的tesseract-3.04.00文件。

进入到该文件目录下:

cd tesseract-3.04.00

分别执行以下指令:

sudo ./autogen.sh & ./configure & make & make install &ldconfig

5.安装中英文语言包。

将语言包chi_sim.traineddata、eng.traineddata、eng.traineddata.part三个文件,并把它们放到tessdata文件夹中。

cp chi_sim.traineddata /usr/local/share/tessdata 
cp eng.traineddata /usr/local/share/tessdata 
cp eng.traineddata.part /usr/local/share/tessdata

6.简单验证测试

testing目录下

tesseract phototest.tif result -l eng

3,windows下安装

1.下载并安装Tesseract

Index of /tesseract

其中文件名中带有dev的为开发版本,不带dev的为稳定版本,可以选择下载不带dev的版本

2、配置环

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值