C#平台调用OpenVINOTM部署PP-OCR文字识别模型，基于OpenVINOTM模型推理库资源-CSDN下载

共60个文件

jpg：13个

cs：13个

onnx：4个

版权申诉

44 浏览量 2024-02-29 18:41:09 上传评论收藏 44.68MB ZIP 举报

在IT领域，尤其是在人工智能应用开发中，模型推理库和跨平台调用能力是至关重要的。本文将详细探讨如何在C#环境下利用OpenVINOTM模型推理库部署PP-OCR文字识别模型，帮助开发者理解并实践这一技术。 OpenVINO™（Open Visual Inference & Neural Network Optimization）是由Intel开发的一个高性能的计算机视觉和深度学习推理平台。它提供了一个工具集，允许开发者将训练好的深度学习模型快速部署到各种硬件设备上，包括CPU、GPU、FPGA等。OpenVINO™模型推理库是其核心组成部分，可以高效地执行模型推理任务。 PP-OCR（PaddlePaddle Optical Character Recognition）是百度公司推出的一个开源OCR系统，基于PaddlePaddle深度学习框架构建。PP-OCR在文字检测和识别方面表现出色，尤其对于中文文字的识别效果优秀，广泛应用于文档处理、图像分析等领域。在C#中调用OpenVINO™部署PP-OCR模型，主要涉及以下几个步骤： 1. **环境准备**：确保已安装OpenVINO™ SDK，其中包含了OpenVINO™运行时和模型推理库。同时，需要安装C#编译环境，如.NET Framework或.NET Core。 2. **获取模型**：从PP-OCR项目中下载预训练模型，并将其转换为OpenVINO™兼容的IR（Intermediate Representation）格式。通常，OpenVINO™的Model Optimizer工具可以完成这个转换。 3. **导入OpenVINO™库**：在C#项目中，引入OpenVINO™的C# API，这通常是一个动态链接库（DLL）。通过NuGet包管理器或者手动添加引用，将OpenVINO™的C#接口库引入到项目中。 4. **初始化Inference Engine**：在代码中创建InferenceEngine实例，这是OpenVINO™推理库的入口点。设置设备类型（如CPU、GPU等）以及模型路径。 5. **加载模型**：使用InferenceEngine加载IR格式的模型文件，包括模型结构文件（.xml）和模型权重文件（.bin）。 6. **输入处理**：对需要识别的文字图像进行预处理，如缩放、灰度化等，然后将其数据转换为模型所需的输入格式。 7. **执行推理**：调用InferenceEngine的Execute方法，将预处理后的图像数据作为输入，进行模型推理。 8. **结果解析**：获取模型的输出数据，解码并解析出识别的文字。根据PP-OCR模型的输出结构，可能需要进一步的后处理步骤来提取和组合识别结果。 9. **释放资源**：完成推理后，记得释放InferenceEngine对象和其他分配的资源，避免内存泄漏。在提供的压缩包"OpenVinoSharp_deploy_PaddleOCR-paddlrocr2.0"中，可能包含了C#的示例代码、OpenVINO™的C#接口库、转换好的IR模型文件以及其他辅助资源。开发者可以通过研究这些示例代码，了解如何在实际项目中实现C#调用OpenVINO™进行PP-OCR文字识别。总结来说，通过C#调用OpenVINOTM部署PP-OCR模型，可以充分利用OpenVINO™的高性能推理能力和PP-OCR的高准确率文字识别功能，实现在C#环境下的高效文字识别应用。这对于需要在Windows平台上开发OCR系统的开发者来说，是一个非常有价值的实践方案。

资源推荐

资源详情

资源评论

收起资源包目录

OpenVinoSharp_deploy_PaddleOCR-paddlrocr2.0.zip （60个子文件）

OpenVinoSharp_deploy_PaddleOCR-paddlrocr2.0

.gitattributes 2KB

LICENSE.txt 11KB

image

demo_5.jpg 100KB

demo_5_reault.jpg 123KB

demo_4.jpg 305KB

demo_2_reault.jpg 49KB

demo_8.jpg 166KB

demo_6.jpg 67KB

demo_7.jpg 89KB

demo_1.jpg 48KB

demo_2.jpg 42KB

demo_8_reault.jpg 84KB

demo_1_reault.jpg 104KB

demo_7_reault.jpg 135KB

demo_3.jpg 45KB

src

paddle_ocr

OcrRec.cs 4KB

PostProcessor.cs 12KB

paddle_ocr.csproj 632B

Extensions.cs 780B

utility.cs 8KB

PaddleOCR.cs 4KB

Predictor.cs 1KB

PreProcess.cs 3KB

OcrDet.cs 3KB

OcrCls.cs 2KB

OpenVinoSharp

OpenVinoSharp.csproj 302B

Core.cs 4KB

NativeMethods.cs 2KB

test_ocr

test_ocr.csproj 336B

Program.cs 311B

test_ocr.cs 1KB

OpenVinoSharpExtern

common.cpp 4KB

OpenVinoSharpExtern.vcxproj 8KB

common.h 984B

OpenVinoSharpExtern.vcxproj.filters 1KB

openvino_api.h 2KB

openvino_api.cpp 15KB

基于Csharp和OpenVINO部署PaddleOCR模型2.0.sln 5KB

model

ppocr_keys_v1.txt 26KB

ppocr_model_v3

rec_paddle

inference.pdmodel 1.21MB

inference.pdiparams.info 22KB

inference.pdiparams 10.12MB

model.onnx 10.17MB

cls_paddle

inference.pdmodel 1.55MB

inference.pdiparams.info 18KB

inference.pdiparams 527KB

det_onnx

model.onnx 2.32MB

det_ir

model.bin 2.19MB

model.mapping 31KB

model.xml 257KB

rec_onnx

model.onnx 10.17MB

det_paddle

inference.pdmodel 1.35MB

inference.pdiparams.info 26KB

inference.pdiparams 2.27MB

cls_onnx

model.onnx 566KB

rec_ir

model.bin 10.05MB

model.mapping 26KB

model.xml 219KB

.gitignore 6KB

README.md 24KB

# 基于C#和OpenVINO部署PaddleOCR模型 &emsp; 基于OpenVINO模型推理库，在C#语言下，调用封装的OpenVINO动态链接库，部署推理PaddleOCR中的文字识别模型；实现了在C#平台使用PaddleOCR文字识别模型识别文字。 &emsp; OpenVinoSharp源码在GitHub和Gitee上已开源，可以直接通过Git获取所有源码 &emsp; 在Github上克隆下载： ``` git clone https://github.com/guojin-yan/OpenVinoSharp_deploy_PaddleOCR.git ``` &emsp; 在Gitee上克隆下载： ``` git clone https://gitee.com/guojin-yan/OpenVinoSharp_deploy_PaddleOCR.git ``` ## 1.OpenVINO &emsp; OpenVINO™是英特尔基于自身现有的硬件平台开发的一种可以加快高性能计算机视觉和深度学习视觉应用开发速度工具套件，用于快速开发应用程序和解决方案，以解决各种任务（包括人类视觉模拟、自动语音识别、自然语言处理和推荐系统等）。 ![image-20230422095309885](https://s2.loli.net/2023/04/22/Cea3M7TwXyOiRbv.png) &emsp; 该工具套件基于最新一代的人工神经网络，包括卷积神经网络 (CNN)、递归网络和基于注意力的网络，可扩展跨英特尔® 硬件的计算机视觉和非视觉工作负载，从而最大限度地提高性能。它通过从边缘到云部署的高性能、人工智能和深度学习推理来为应用程序加速，并且允许直接异构执行。极大的提高计算机视觉、自动语音识别、自然语言处理和其他常见任务中的深度学习性能；使用使用流行的框架（如TensorFlow，PyTorch等）训练的模型；减少资源需求，并在从边缘到云的一系列英特尔®平台上高效部署；支持在Windows与Linux系统，且官方支持编程语言为Python与C++语言。 &emsp; 官方发行的[OpenVINO™](www.openvino.ai)未提供C#编程语言接口，因此在使用时无法实现在C#中利用[OpenVINO™](www.openvino.ai)进行模型部署。在之前所做工作中，利用动态链接库功能，调用官方依赖库，实现在C#中部署深度学习模型，推出了[OpenVinoSharp](https://blog.csdn.net/Grape_yan/article/details/128962379)。在本文项目中，使用了OpenVinoSharp作为模型推理工具，加速PaddleOCR模型推理。 <img title="更新日志" src="https://s2.loli.net/2023/04/22/3DhEQetFrPOg2Ns.png" alt="" width="300"> ## 2.PaddleOCR &emsp; PP-OCR是PaddleOCR自研的实用的超轻量OCR系统。在实现前沿算法的基础上，考虑精度与速度的平衡，进行**模型瘦身**和**深度优化**，使其尽可能满足产业落地需求。PP-OCR是一个两阶段的OCR系统，其中文本检测算法选用DB，文本识别算法选用[RNN，并在检测和识别模块之间添加文本方向分类器，以应对不同方向的文本识别。 &emsp; PP-OCR系统在持续迭代优化，目前已发布PP-OCR、PP-OCRv2和PP-OCRv3三个版本。PP-OCR从骨干网络选择和调整、预测头部的设计、数据增强、学习率变换策略、正则化参数选择、预训练模型使用以及模型自动裁剪量化8个方面，采用19个有效策略，对各个模块的模型进行效果调优和瘦身(如绿框所示)，最终得到整体大小为3.5M的超轻量中英文OCR和2.8M的英文数字OCR。 #### PP-OCRv2 &emsp; PP-OCRv2在PP-OCR的基础上，进一步在5个方面重点优化，检测模型采用CML协同互学习知识蒸馏策略和CopyPaste数据增广策略；识别模型采用LCNet轻量级骨干网络、UDML 改进知识蒸馏策略和Enhanced CTC loss损失函数改进（如上图红框所示），进一步在推理速度和预测效果上取得明显提升。 #### PP-OCRv3 &emsp; PP-OCRv3在PP-OCRv2的基础上，针对检测模型和识别模型，进行了共计9个方面的升级： - PP-OCRv3检测模型对PP-OCRv2中的CML协同互学习文本检测蒸馏策略进行了升级，分别针对教师模型和学生模型进行进一步效果优化。其中，在对教师模型优化时，提出了大感受野的PAN结构LK-PAN和引入了DML蒸馏策略；在对学生模型优化时，提出了残差注意力机制的FPN结构RSE-FPN。 - PP-OCRv3的识别模块是基于文本识别算法[SVTR](https://arxiv.org/abs/2205.00159)优化。SVTR不再采用RNN结构，通过引入Transformers结构更加有效地挖掘文本行图像的上下文信息，从而提升文本识别能力。PP-OCRv3通过轻量级文本识别网络SVTR_LCNet、Attention损失指导CTC损失训练策略、挖掘文字上下文信息的数据增广策略TextConAug、TextRotNet自监督预训练模型、UDML联合互学习策略、UIM无标注数据挖掘方案，6个方面进行模型加速和效果提升。 ![ppocrv3_framework](https://s2.loli.net/2023/04/22/JwM4V2tC3KZpAQH.png) ## 3.模型下载与转换 &emsp; 本文中用到的所有模型均在PaddleOCR中下载，本文中给出了详细获取流程，丙夜在代码厂库中提供了本文中所用到的所有模型。 ### 3.1 Detection model （1）PaddlePaddle模型下载方式： &emsp; 命令行直接输入以下代码，或者浏览器输入后面的网址即可。 ``` wget https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar ``` &emsp; 下载好后将其解压到文件夹中，便可以获得Paddle格式的推理模型。（2）转换为ONNX格式： &emsp; 该方式需要安装paddle2onnx和onnxruntime模块。在命令行中输入以下指令进行转换： ``` paddle2onnx --model_dir ./ch_PP-OCRv3_det_infer --model_filename inference.pdmodel --params_filename inference.pdiparams --save_file ./inference/det_onnx/model.onnx --opset_version 10 --input_shape_dict="{'x':[-1,3,640,640]}" --enable_onnx_checker True ``` &emsp; 其中在指定模型输入大小时，-1代表不指定，可以模型推理部署时在进行指定。运行上述指令后在./inference/det_onnx/路径下可以找到该模型（3）转换为IR格式 &emsp; 利用OpenVINOTM模型优化器，可以实现将ONNX模型转为IR格式。 &emsp; 在OpenVINOTM环境下，切换到模型优化器文件夹，直接使用下面指令便可以进行转换。 ``` mo –input_model det_onnx/model.onnx ``` &emsp; 经过上述指令模型转换后，可以在当前文件夹下找到转换后的三个文件。 ### 3.2 Direction classifier （1）PaddlePaddle模型下载方式： &emsp; 命令行直接输入以下代码，或者浏览器输入后面的网址即可。 ``` wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar ``` &emsp; 下载好后将其解压到文件夹中，便可以获得Paddle格式的推理模型。（2）转换为ONNX格式： &emsp; 该方式需要安装paddle2onnx和onnxruntime模块。在命令行中输入以下指令进行转换： ``` paddle2onnx --model_dir ./ch_ppocr_mobile_v2.0_cls_infer --model_filename inference.pdmodel --params_filename inference.pdiparams --save_file ./inference/cls_onnx/model.onnx --opset_version 10 --input_shape_dict="{'x':[-1,3,640,640]}" --enable_onnx_checker True ``` &emsp; 其中在指定模型输入大小时，-1代表不指定，可以模型推理部署时在进行指定。运行上述指令后在./inference/cls_onnx/路径下可以找到该模型（3）转换为IR格式 &emsp; 利用OpenVINOTM模型优化器，可以实现将ONNX模型转为IR格式。 &emsp; 在OpenVINOTM环境下，切换到模型优化器文件夹，直接使用下面指令便可以进行转换。 ``` mo –input_model det_onnx/model.onnx ``` &emsp; 经过上述指令模型转换后，可以在当前文件夹下找到转换后的三个文件。 ### 3.3 Recognition model （1）PaddlePaddle模型下载方式： &emsp; 命令行直接输入以下代码，或者浏览器输入后面的网址即可。 ``` wget https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar ``` &emsp; 下载好后将其解压到文件夹中，便可以获得

评论收藏

内容反馈

版权申诉