【iOS】——基于Vision Kit框架实现图片文字识别

不会敲代码的VanGogh

已于 2024-01-18 17:17:15 修改

阅读量3.9k

点赞数 23

CC 4.0 BY-SA版权

文章标签： ios objective-c 学习 apple vision pro

于 2024-01-18 17:15:14 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_73974920/article/details/135676698

文章目录

前言
一、文本识别的分类
二、实现步骤
三、运行结果测试
- 1.纯英文环境
- 2.中英文混合环境

前言

根据苹果的官方文档，Vision可以执行面部检测、文本检测、条形码识别、图像注册和一般功能跟踪。Vision还允许将自定义Core ML模型用于分类或对象检测等任务。下面只是对文本识别的一个学习。

一、文本识别的分类

Vision的文本识别分为两种方式。

第一种是快速路径（fast），它使用框架的字符检测功能来查找单个字符，然后使用小型机器学习模型来识别单个字符和单词，这种方法类似于传统的光学字符识别(OCR）。

第二种是准确路径(accurate)，它使用神经网络查找字符串和行的文本，然后执行进一步分析以查找单个单词和句子。这种方法更符合人类阅读文本的方式。

这两种识别方式都在VNRecognizeTextRequest 类的 recognitionLevel 属性中，并且该属性为枚举类型：

VNRequestTextRecognitionLevelAccurate: 表示精确级别的文本识别。在这个级别下，识别结果的准确性较高，但可能会增加处理时间和资源消耗。
VNRequestTextRecognitionLevelFast: 表示快速级别的文本识别。在这个级别下，识别速度较快，但可能会牺牲一些准确性。

使用其中任意一个路径都可以选择应用基于自然语言处理（NLP）的语言校正阶段，以尽量减少误读的可能性。

流程图如下：

在这里插入图片描述

识别图像中的文本官方文档

二、实现步骤

实现文字识别总共分为六个步骤：

第一步：导入Vision Kit框架
第二步：创建请求处理器
第三步：在请求处理器中设置文字识别功能
第四步：将图片添加到请求处理器中
第五步：发起文字识别请求
第六步：处理识别结果

1.导入Vision Kit框架

1.打开需要导入的Xcode项目

2.在导航器面板中，选择您的项目文件

3.在项目设置中点击"General"选项卡，然后在"Frameworks, Libraries, and Embedded Content"（框架、库和嵌入内容）部分，点击"+"按钮。

在这里插入图片描述

4.在弹出窗口中，搜索并选择"Vision.framework"。

在这里插入图片描述

5.在项目文件中引入头文件

#import <Vision/Vision.h>

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。