目录
一、功能简介
【概要介绍】
tesserocr 是一个用于 OCR(Optical Character Recognition 光学字符识别)的 Python库,它结合了 Google 的 Tesseract 和 Python 的封装库。
它提供了 OCR 过程需要的全部功能:图像预处理、文本分析、字符识别和后处理。
tesserocr 库主要是使用 Leptonica 这个图像处理库进行图像的处理和分析。
它能够基于输入的图像,自动识别文本信息,输出清晰可读的文本结果。
tesserocr 的最大优势在于其速度。与其他分析工具不同,它具有很强的处理能力和更快的处理速度。
【参考文献】
- Github上tesserocr的代码库,作者为Ginn Chen,https://github.com/sirfz/tesserocr,2021年访问。
- “