PP-Detection Logs —— 运算效率

本文链接：https://blog.csdn.net/qq_39430450/article/details/121983791

这篇博客对比了Paddle2.2和Pytorch1.7在运行Yolov3模型时的运算效率、GPU资源使用情况及mAP性能。结果显示，Paddle在单次epoch运算时间上显著长于Pytorch，GPU显存占用更多但利用率低，且mAP表现不佳。作者推测可能的原因涉及框架底层，并计划进行更深入的探究和验证。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

PP-Detection Logs（2021.12.17）

1. 记录——运算效率（对比Pytorch 1.7）

1. 记录——运算效率（对比Pytorch 1.7）

1.1. 单次epoch的运算时间（以Yolo v3为例）

Image-size：2432*2040
Batch-size：4 images
Epoch-size：897 images
Epoch-train_size：717 images
Epoch-test_size：180 images
Worker：1

这里说明一下，Paddle在开大于1个worker时会出现训练中断，有类似“dataloder worker exited unexpectedly”的报错。而Pytorch不会这问题。所以为了对比的有效性，这里num_workers都设置为1。

Frame	Train time (s)	Test time (s)
Pytorch 1.7	80±10	12±2
Paddle 2.2	605±10	20±2

截取了其中一次epoch的log截图：
Pytorch-train-test
Paddle-train-test
很明显，同等超参情况下，Paddle的耗时远大于Pytorch。猜想有一部分原因来自于LoDTensor，但应该不是根本原因。具体根源来自于哪？目前不得而知，后续深入使用后，希望可以找到。