本地训练服务器:Ubuntu16.04、cuda10.1、cudnn7.6.5、1080Ti x 8
主要是从 https://github.com/deepinsight/insightface/issues/125 找的线索。。。
- 环境变量配置(显存):
参考https://blog.csdn.net/u010402786/article/details/78475472
- 使用memonger:
参考 https://github.com/dmlc/mxnet-memonger,但将其加入到代码中,报错,未解决。
- 奇怪现象-GPU使用率大部分时间0%,很短时占用率80%:
- 修改default.kvstore=’local’ # device
70 samples/sec
- 将训练数据rec拷贝到服务器本地
速度提升到600 samples/sec
- 训练开始速度快,后来变慢
- config.is_shuffled_rec = True # False
速度提升到870 samples/sec