第十七篇【传奇开心果系列】Python的OpenCV库技术点案例示例：自适应阈值二值化处理图像提取文字

最新推荐文章于 2025-03-11 15:29:15 发布

置顶

传奇开心果编程

最新推荐文章于 2025-03-11 15:29:15 发布

阅读量3.3k

点赞数 78

CC 4.0 BY-SA版权

分类专栏： Python库OpenCV 技术点案例示例短博文文章标签： python opencv 计算机视觉人工智能图像处理

本文链接：https://blog.csdn.net/jackchuanqi/article/details/136082187

传奇开心果短博文系列

系列短博文目录
- Python的OpenCV库技术点案例示例系列
短博文目录
- 前言
- 一、自适应阈值二值化处理图像提取文字轮廓的初步示例代码：
- 二、扩展思路介绍
- 三、调整自适应阈值二值化的参数示例代码
- 四、对二值化图像进行形态学操作示例代码
- 五、使用轮廓特征进行筛选示例代码
- 六、边缘检测算法示例代码
- 七、使用图像分割算法将图像分割为文字和背景区域示例代码
- 八、调整参数优化文字轮廓示例代码
- 九、应用形态学操作优化文字轮廓示例代码
- 十、筛选轮廓优化文字轮廓示例代码
- 十一、归纳总结

系列短博文目录

Python的OpenCV库技术点案例示例系列

短博文目录

前言

在这里插入图片描述自适应阈值二值化来处理图像，以更好地提取文字轮廓。自适应阈值二值化可以根据图像局部区域的灰度值自动确定阈值。

一、自适应阈值二值化处理图像提取文字轮廓的初步示例代码：

在这里插入图片描述以下是使用Python和OpenCV库进行自适应阈值二值化的示例代码：

import cv2

# 读取图像
image = cv2.imread('your_image.jpg', 0)

# 自适应阈值二值化
binary = cv2.adaptiveThreshold(image, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 2)

# 查找轮廓
contours, _ = cv2.findContours(binary, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

# 绘制轮廓
contour_image = cv2.drawContours(image.copy(), contours, -1, (0, 255, 0), 2)

# 显示结果
cv2.imshow('Binary Image', binary)
cv2.imshow('Contour Image', contour_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

在上述代码中，首先使用cv2.adaptiveThreshold函数对图像进行自适应阈值二值化，其中cv2.ADAPTIVE_THRESH_MEAN_C表示使用局部均值作为阈值计算方式。然后使用cv2.findContours函数查找图像中的轮廓，并使用cv2.drawContours函数绘制轮廓。

您可以根据实际情况调整自适应阈值二值化的参数，如窗口大小和均值计算方法，以获得最佳的结果。

二、扩展思路介绍

在这里插入图片描述当使用自适应阈值二值化来处理图像时，还可以考虑以下几个方面的扩展：

调整自适应阈值二值化的参数：除了示例代码中使用的cv2.ADAPTIVE_THRESH_MEAN_C方法外，还可以尝试使用cv2.ADAPTIVE_THRESH_GAUSSIAN_C方法，它使用局部区域的加权和作为阈值计算方式。可以根据图像的特点和需求，比较两种方法的效果并选择最佳的方法。
对二值化图像进行形态学操作：在获取到二值化图像后，可以应用形态学操作来进一步处理图像，以改善文字轮廓的提取效果。例如，可以使用cv2.dilate函数对二值化图像进行膨胀操作，以填充文字内部的空洞；或者使用cv2.erode函数对二值化图像进行腐蚀操作，以去除细小的噪点。
使用轮廓特征进行筛选：在查找轮廓后，可以通过一些条件来筛选出符合要求的轮廓。例如，可以根据轮廓的面积、周长、宽高比等特征进行筛选，以排除不需要的轮廓。
应用其他图像处理技术：如果仍然无法满足需求，可以尝试其他图像处理技术来提取文字轮廓。例如，可以使用边缘检测算法（如Canny边缘检测）来获取文字的边缘信息；或者使用图像分割算法（如基于区域的分割算法）将图像分割为文字和背景区域。

综上所述，根据具体的需求和图像特点，可以尝试调整参数、应用形态学操作、筛选轮廓以及使用其他图像处理技术来进一步优化文字轮廓的提取效果。

三、调整自适应阈值二值化的参数示例代码

在这里插入图片描述下面是一个示例代码，演示了如何调整自适应阈值二值化的参数来提取文字轮廓：

import cv2

# 读取图像
image = cv2.imread('your_image.jpg', 0)

# 自适应阈值二值化（调整参数）
binary = cv2.adaptiveThreshold(image, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 5)

# 查找轮廓
contours, _ = cv2.findContours(binary, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

# 绘制轮廓
contour_image = cv2.drawContours(image.copy(), contours, -1, (0, 255, 0), 2)

# 显示结果
cv2.imshow('Binary Image', binary)
cv2.imshow('Contour Image', contour_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

在上述代码中，我调整了自适应阈值二值化的两个参数：窗口大小（11）和均值计算的偏移值（5）。您可以根据实际需求，尝试不同的参数值来获得最佳的效果。

增大窗口大小可以考虑更大范围的像素值，从而适应不同大小的文字。减小偏移值可以使阈值更接近局部像素均值，以更好地区分文字和背景。

请注意，调整参数时需要根据具体情况进行实验和调整。不同的图像和文字特征可能需要不同的参数设置。

四、对二值化图像进行形态学操作示例代码

在这里插入图片描述下面是一个示例代码，演示了如何对二值化图像进行形态学操作来改善文字轮廓的提取效果：

import cv2
import numpy as np

# 读取图像
image = cv2.imread('your_image.jpg', 0)

# 自适应阈值二值化
binary = cv2.adaptiveThreshold(image, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 2)

# 形态学操作（膨胀和腐蚀）
kernel