PP-PicoDet注意版面分析模型的结果导出

本文详细讲解了PP-PicoDet模型在版面检测中的应用,提醒读者注意模型导出时的后处理设置,并在配置文件中指定benchmark和anno_file以确保正确类别加载。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

版面分析

使用轻量模型PP-PicoDet检测模型实现版面各种类别的检测。

注意1

版面分析模型的结果导出时不需要有后处理,可以在configs/runtimes.yml中设置benchmark=True

 注意2

导出模型最好在训练算法中,其他的可能会找不到训练类,别使用默认用coco类别

ppdet.data.source.category WARNING: anno_file '\val.json' is None 
or not set or not exist, 
please recheck TrainDataset/EvalDataset/TestDataset.anno_path, 
otherwise the default categories will be used by metric_type.
ppdet.data.source.category WARNING: metric_type: COCO, 
load default categories of COCO.

 

 

### 关于通用信息抽取大模型 PP-UIE #### 模型概述 PP-UIE 是一个强大的统一信息抽取框架,能够处理多种自然语言处理任务。该模型基于 PaddleNLP 平台开发,在多个下游任务上表现出色[^2]。 #### 功能特性 - **多模态支持**:不仅限于纯文本输入,还具备 OCR 和版面分析功能,适用于复杂场景下的文档理解。 - **高性能推理引擎**:兼容 CPU 及 Nvidia GPU 部署环境,并默认集成了 Paddle Inference、ONNX Runtime、OpenVINO 以及 TensorRT 推理后端,确保高效运行性能[^4]。 #### 安装与配置指南 为了使用 PP-UIE 进行模型微调并保存结果到特定位置,可以通过如下 Python 代码片段实现: ```python from paddlenlp import Taskflow # 初始化 UIE 模型实例 schema = ["时间", "地点"] # 自定义实体类别列表 ie = Taskflow("information_extraction", schema=schema, model="paddlenlp/PP-UIE-1.5B") # 微调过程中的超参数设置(此处仅为示意) training_args = { 'output_dir': './results', } # 执行微调操作并将最终版本存储起来 model.save_pretrained(training_args['output_dir']) ``` 上述脚本展示了如何加载预训练权重文件 `paddlenlp/PP-UIE-1.5B` 来初始化一个新的信息提取器对象;接着通过调整某些关键参数完成定制化需求;最后将经过优化后的网络结构及其对应的参数持久化至本地磁盘中以便后续应用或分享给其他开发者继续迭代改进。 #### 获取更多资源 对于希望深入了解 PP-UIE 或者尝试其最新扩展组件如 UIE-X 的研究人员来说,官方 GitHub 页面提供了详尽的技术文档和支持材料,涵盖了从基础概念讲解一直到高级应用场景实践等多个方面的内容[^3]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值