PaddleOCR识别框架解读[08] 文本识别rec模型构建

我是天才很好

已于 2024-03-13 14:43:45 修改

阅读量504

点赞数

CC 4.0 BY-SA版权

分类专栏： PaddleOCR使用及其解析文章标签：深度学习 ocr 计算机视觉人工智能 python

于 2024-03-08 10:24:57 首次发布

本文链接：https://blog.csdn.net/weixin_43593330/article/details/136555001

PaddleOCR使用及其解析专栏收录该内容

19 篇文章 ¥39.90 ¥99.00

订阅专栏

超级会员免费看

本文详细解读了PaddleOCR的rec模型构建，包括en_PP-OCRv3_rec.yml配置，en_dict.txt字典文件，以及build_model函数中的base_model类，特别是使用MobileNetV1Enhance作为骨干网络。此外，介绍了识别头MultiHead，CTCHead和SARHead的构建，其中SARHead包含SAREncoder和ParallelSARDecoder的解码器部分。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

en_PP-OCRv3_rec.yml
en_dict.txt
build_model函数
- base_model类
build_backbone函数
- 骨干网络 MobileNetV1Enhance
build_head函数

en_PP-OCRv3_rec.yml

# 全局配置
Global:
  debug: false
  # 设置代码是否在gpu运行
  use_gpu: true
  # 最大训练epoch数
  epoch_num: 500
  # log队列长度，每次打印输出队列里的中间值
  log_smooth_window: 20
  # 设置打印log间隔
  print_batch_step: