HSR Diff:基于条件扩散模型的高光谱图像超分辨率

HSR-Diff: Hyperspectral Image Super-Resolution via Conditional Diffusion Models

2023 IEEE/CVF
2380-7504/23/$31.00 ©2023 IEEE DOI 10.1109/ICCV51070.2023.00652

论文作者:Chanyue Wu,Dong Wang,Hanyu Mao,Ying Li

作者单位:Northwestern Polytechnical University; Yan’an University

论文链接:http://arxiv.org/abs/2306.12085v1

方向:图像超分辨率

应用:高光谱图像超分辨率

笔记总结

研究背景:

以往的HSI超分辨率方法中:

  1. 基于GAN的:需要精心设计正则化和优化技巧,以驯服优化不稳定性并避免模式崩溃。
  2. 条件扩散模型:尽管条件扩散模型易于定义且训练高效,但据我们所知,还没有证据表明它们能够合并LR-HSI和HR-MSI。没有专门研究HSI-SR的问题。且通常是串联的去噪网络,可能阻碍在LR HSI和HR MSI中提取有用的空间光谱信息。
  3. 一般的 Transformer只关注像素之间的空间关系,而忽略了光谱维度

研究方法:

diffusion和transformer。
HSR-Diff的前向和后向过程,前向过程q通过逐渐添加高斯噪声生成HSI序列(从左到右),后向过程p迭代细化HR-HSI(从右到左)。
HSI Diff分为了两个过程,一个将HR-HSI Z0扰动为噪声的正向过程,以及一个将噪声转换回HR-HSI Z0的反向过程。

小结:
1、 提出了一个HSI-SR的条件扩散模型
2、 引入一个CDFormer,细化有噪声的HRHSI。

在这里插入图片描述

条件扩散模型

  • 提出了一个HSISR的条件扩散模型
  • 引入一个CDFormer,细化有噪声的HRHSI

HSR Diff利用了两个过程:一个将HR-HSI Z0扰动为噪声的正向过程,以及一个将噪声转换回HR-HSI Z0的反向过程。

条件去噪 CDFormer:

双流架构,堆叠的“Spatio-Spectral Transformer Layers (S2TLs).”

  • SR stream中的Transformer,空间自注意力和光谱自注意力。在这里插入图片描述

  • Denoising stream中的Transformer,添加了NLE(噪声嵌入向量)。NLE采用正弦位置编码将噪声水平嵌入模型之中。

在这里插入图片描述
NLE的公式如下:
在这里插入图片描述

Progressive Learning Strategy

提出背景:一方面,在固定大小的图像块上训练所提出的CDFormer可能无法适当地反映全局关系,这可能会导致在使用全分辨率图像时性能不佳。另一方面,在训练阶段,由于内存有限,CDFormer无法上传到图形处理单元(GPU)。
实施:在初始阶段,网络使用较小的图像块进行训练。随后,随着训练的进行,我们过渡到在最后的训练阶段使用更大的补丁,并最终使用全分辨率图像。

研究结果:

数据集:CAVE [38], PaviaU [21], Chikusei [39], and HypSen [37]
SOTA:采用六种最先进的HSI-SR方法进行比较,包括:UTV-TD[34]、UAL[43]、BRResNet[16]、Fusionformer[15]、CMHF Net[31]和UAL-DMI[28]。UTV-TD是一种基于张量的技术;UAL、BRResNet、Fusionformer和CMHF Net属于基于DL的方法类别;UAL-DMI可视为UAL的升级版本。
在这里插入图片描述
消融
条件扩散模型的烧蚀研究。↑或↓表示较高或较低的值对应更好的结果。
CDFormer消融研究。↑或↓表示较高或较低的值对应更好的结果。
关于渐进式学习的消融研究。↑或↓表示较高或较低的值对应更好的结果。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值