怎么安装 Tesseract OCR
时间: 2025-05-30 22:03:50 浏览: 15
### Tesseract OCR 安装指南
Tesseract OCR 是一个强大的开源光学字符识别(OCR)引擎,能够将图像中的文本转换为机器可读的文本。以下是针对 Windows、macOS 和 Kylin OS 的安装指南。
---
#### **Windows 上的安装**
1. 下载适用于 Windows 的预编译二进制文件。可以从官方 GitHub 页面下载最新版本的安装程序[^1]。
2. 运行下载好的 `.exe` 文件并按照提示完成安装过程。
3. 将 Tesseract 的安装路径添加到系统的 `PATH` 环境变量中。具体操作如下:
- 右键单击“此电脑” -> “属性” -> “高级系统设置” -> “环境变量”。
- 在“系统变量”部分找到 `Path` 并点击“编辑”。
- 添加 Tesseract 的安装目录(例如:`C:\Program Files\Tesseract-OCR`)[^3]。
4. 打开命令提示符并输入以下命令验证安装是否成功:
```bash
tesseract --version
```
---
#### **macOS 上的安装**
1. 如果尚未安装 Homebrew,请先通过终端运行以下命令来安装 Homebrew:
```bash
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
```
2. 使用 Homebrew 安装 Tesseract 和其依赖项 Leptonica:
```bash
brew install tesseract
brew install leptonica
```
3. 验证安装是否成功:
```bash
tesseract --version
```
注意,在 macOS 中无需手动配置环境变量,因为 Homebrew 会自动处理这些细节[^5]。
---
#### **Kylin OS 上的安装**
对于基于 Red Hat 的 Kylin OS,可以参考以下步骤:
1. 更新系统包管理器索引:
```bash
sudo yum update
```
2. 安装必要的构建工具和依赖项:
```bash
sudo yum groupinstall "Development Tools"
sudo yum install cmake gcc-c++
```
3. 安装 Leptonica 库及其头文件:
```bash
sudo yum install liblept5-devel
```
4. 下载并解压 Tesseract 源码(假设版本为 5.3.3):
```bash
wget https://github.com/tesseract-ocr/tesseract/archive/refs/tags/5.3.3.tar.gz
tar -xzvf 5.3.3.tar.gz
cd tesseract-5.3.3
```
5. 编译并安装 Tesseract:
```bash
mkdir build && cd build
cmake ..
make
sudo make install
sudo ldconfig
```
6. 解决可能遇到的问题:如果在配置过程中找不到 Leptonica 库,则需确认已正确安装 Leptonica,并将其路径加入链接选项中[^2]。
7. 测试安装是否成功:
```bash
tesseract --version
```
---
#### **Python 接口配置**
如果您希望在 Python 中使用 Tesseract OCR,可以通过 PyPI 安装 `pytesseract` 包作为接口:
```bash
pip install pytesseract
```
随后编写简单的测试脚本以验证功能正常工作:
```python
from PIL import Image
import pytesseract
image_path = 'example.png'
text = pytesseract.image_to_string(Image.open(image_path))
print(text)
```
确保在此之前已完成 Tesseract 的基础安装以及 PATH 设置[^4]。
---
阅读全文
相关推荐


















