简述以下内容:
编译tesseract ocr的静态lib库,给c++编程中开发使用,可搭配opencv或leptonica库进行图片识别。都是当下最新的版本
文中所用到的网址如下
1.SW下载地址:https://software-network.org/client/
2.tesseract ocr下载地址:https://github.com/tesseract-ocr/tesseract
3.tesseract ocr依赖的lib库下载地址:https://github.com/peirick/Tesseract-OCR_for_Windows
4.leptonica下载地址:https://github.com/DanBloomberg/leptonica
5.tesseract ocr文字识别库下载地址:https://github.com/tesseract-ocr/tessdata
编译后的文件资源,也都已经上传
实操步骤
1.下载配置SW
下载最新的sw-master-windows_x86_64-client.zip解压到任意目录,把SW.exe所在路径设置为环境变量。
在CMD中执行sw setup,这一步是为了在编译tesseract ocr时自动找到SW_DIR的路径。
上图我是更换了一个网络才不会报错的,可能公司网有限制。
2.编译tesseract ocr
下载最新的tesseract,在目录中新建build目录,打开cmake-gui。
当然你需要选择你所用的VS版本和编译平台,如下图,他会自动找到SW所在路径,依次点击configure和generate,sw会下载很多依赖库到C:\Users\用户名.sw里面。
打开build下面的tesseract.sln,点击ALL_BUILD,右键生成
此时会出现多个(20个左右)文件报警如下,每次生成就会爆出一个,依次将该文件的编码类型改为utf-8 带签名(VS中具有这个功能),再次生成
在debug和release模式下分别点击install后,在C:/program Files下会生成tesseract.exe和tesseract54d.lib、tesseract54.lib等文件