一、Tesseract-OCR安装
1,Mac下安装
brew install automake autoconf libtool autoconf-archive pkgconfig leptonica icu4c gcc pango leptonica
brew info tesseract
brew install tesseract
2,Linux下安装
安装并编译Tesseract
1.下载安装编译要用到的文件。(此网盘tesseract为3.0版本)
在安装tesseract时,需要下载很多文件,网上有的博客中给了下载链接,但是好多都需要翻墙才能下载,在这里我把所需要的文件下载到了网盘里供大家下载,https://pan.baidu.com/s/1mj6YTIw 提取码是:95p5
注:一定要先把这些文件下载到本地再进行后面的安装,因为后面会用到这些文件。
2.安装相应lib。
打开linux下的命令行,分别输入以下命令:
sudo apt-get install libpng12-dev libjpeg62-dev libtiff5-dev libtool gcc g++ automake
3.下载安装leptonica。
在linux命令行中输入:
wget http://www.leptonica.org/source/leptonica-1.71.tar.gz
执行完毕后就得到了leptonica-1.71.tar.gz压缩文件,解压:
tar -zxvf leptonica-1.71.tar.gz
./configure & make &make install
4.下载安装tesseract。
安装编译tesseract所需的tesseract-3.04.00文件。
进入到该文件目录下:
cd tesseract-3.04.00
分别执行以下指令:
sudo ./autogen.sh & ./configure & make & make install &ldconfig
5.安装中英文语言包。
将语言包chi_sim.traineddata、eng.traineddata、eng.traineddata.part三个文件,并把它们放到tessdata文件夹中。
cp chi_sim.traineddata /usr/local/share/tessdata
cp eng.traineddata /usr/local/share/tessdata
cp eng.traineddata.part /usr/local/share/tessdata
6.简单验证测试
testing目录下
tesseract phototest.tif result -l eng
3,windows下安装
1.下载并安装Tesseract
其中文件名中带有dev的为开发版本,不带dev的为稳定版本,可以选择下载不带dev的版本
2、配置环