《Learned Video Codec with Enriched Reconstruction for CLIC P-frame Coding 》
20年12月提交在arXiv上的一篇paper,一个新的基于深度学习的端到端视频编解码框架,看到有大佬已经解读,跟着学习一下!!!大佬的解读点这里
论文:点这里
David Alexandre, Hsueh-Ming Hang
Dept. of Electronics Engineering, National Chiao Tung University, Taiwan
Abstract
本文提出了一种基于学习的视频编解码框架。具体地说,设计了带有Refine-Net的压缩网络,用于编码残差信号和运动矢量。此外,对于运动估计,引入了基于注意力的分层ME-Net。为了验证设计,对模块和不同的输入格式进行了消融实验。其视频编解码器通过在CLIC P-frame Challenge指定的解码器端使用完美参考帧来证明其性能。实验结果表明,在质量指标方面(MS-SSIM),提出的编解码器与Challenge的前排对比也非常有竞争力。