全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210742299.2 (22)申请日 2022.06.27 (71)申请人 武汉大学 地址 430072 湖北省武汉市武昌区八一路 299号 (72)发明人 张洪艳 林漫晖 杨光义 张良培  (74)专利代理 机构 武汉科皓知识产权代理事务 所(特殊普通 合伙) 42222 专利代理师 王琪 (51)Int.Cl. G06V 20/40(2022.01) G06V 20/10(2022.01) G06V 20/13(2022.01) G06V 10/82(2022.01) G06V 10/80(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于视频理解和时空解耦的高分辨率遥感 影像变化检测方法 (57)摘要 本发明涉及一种基于视频理解和时空解耦 的高分辨率遥感影像变化检测方法。 本发明针对 双时相高分辨率遥感影像对空间、 时间维度构造 不平衡的特点, 采用时序线性插值策略构建伪视 频帧序列, 扩展时间维度, 使得使用视频理解算 法处理变化检测任务成为可能。 本发 明结合变化 检测任务侧重时空信息的特点, 提出一种时空解 耦的编码器设计方案, 使网络一次只关注问题的 一个维度, 从而缓解解码器的负担, 提升检测 效 果。 同时, 为了促进时空编码器间的信息交流, 本 发明提出时序聚合模块, 将其设置在空间编码器 到时间编码器的边路连接中, 提升时空特征的契 合度。 此外, 本发明使用深度监督技术, 改善深层 模型收敛速度, 解决模型中间层特征有效性不足 的问题。 权利要求书2页 说明书7页 附图2页 CN 115147760 A 2022.10.04 CN 115147760 A 1.基于视频理解和时空解耦的高分辨率遥感影像变化检测算法, 其特征在于, 包括以 下步骤: 步骤1, 根据输入的双时相遥感影像对, 通过时序插值策略, 得到伪视频帧序列, 伪视频 帧序列中的每一幅影 像均与原始图像具有相同的空间尺寸和数值范围; 步骤2, 构建时间编码器与空间编码器, 时间编码器接收伪视频帧序列作为输入, 首先 执行下采样操作, 然后通过级联 的三维卷积层提取特征, 空间编码器接 收原始双时相 遥感 影像对作为输入, 使用二 维卷积层提取特征, 在两个编 码器间设置单向的边路连接, 使用时 序聚合模块(temporal  aggregation  module,TAM)处理从时间编码器传递到空间编码器的 特征; 步骤3, 构建渐进式解码器, 将空间编码器各个层级模块的输出与解码器 中各个层级模 块的输入相连接, 解码器最后的卷积层输出 单通道变化 概率图; 步骤4, 在时间编码器末端添加额外的卷积层, 并对其输出施加深度监督, 构建联合损 失函数, 使用梯度下降法对整个网络进行权重参数的优化, 直到损失收敛; 其中, 时间编码 器末端的卷积层仅在模型训练阶段提供额外输出, 在模型推理阶段, 仍使用解码器最后的 卷积层输出的单通道变化 概率图作为网络最终输出。 2.如权利要求1所述的基于视频理解和时空解耦的高分辨率遥感影像变化检测算法, 其特征在于: 步骤1中, 假设第一时相原始影像为I1, 第二时相原始影像为I2, 视频共包含N 帧, 则对第n帧影 像Fn的插值公式为: 3.如权利要求1所述的基于视频理解和时空解耦的高分辨率遥感影像变化检测算法, 其特征在于: 步骤2中, 空间编码器的输入为: Xs=concat(I1,I2)          (2) 其中, 第一 时相原始影像为I1, 第二时相原始影像为I2, concat()表示通道维度的拼接 操作, 空间编码器的基本组成模块为空间模块S ‑Block, S ‑Block又分为S ‑Block I与S‑ Block II两种类型; 两种类型的空间模块的起始部 分均包含两个级 联的卷积层以及 对应的 BN层和ReLU激活函数, 而末尾部分均为一个最大池化层; 相比S ‑BlockI, S ‑BlockII具有一 个额外的卷积层以及对应的BN层和ReLU激活函数, 也因此具有更强的特征提取和拟合能 力, 在第一个ReLU激活函数的输出和最后一个归一化层的输出之间添加有残差连接; 两个 S‑Block I和一个S ‑Block II依次连接构成空间编码器。 4.如权利要求1所述的基于视频理解和时空解耦的高分辨率遥感影像变化检测算法, 其特征在于: 时间编码器的输入为: Xt=stack(F0,F1,F2,...,FN‑1)         (3) 其中, stack()表示在新的维度叠加影像的操作, 时间编码 器的基本组成模块为时间模 块T‑Block; T‑Block首先使用一个1 ×1×1卷积层减少输入特征的通道数; 然后将特征送入 一个3×3×3卷积层进行处理, 以实现对空间上下文的编 码和对变化信息的充分挖掘; 最后 再次使用一个1 ×1×1卷积层增加特征通道数, 提高模型容量; 在每个卷积层之后增加BN 层, 在第一个和第二个BN层之后增加ReLU激活函数, 此外, 为了缓解梯度消失问题、 提升模 块的收敛性能, 在T ‑Block的输入和输出之间增加 了残差连接, 残差支路使用1 ×1×1卷积权 利 要 求 书 1/2 页 2 CN 115147760 A 2层和BN层匹配特征通道数; 在时间编码器的第一个T ‑Block前添加一个由卷积层、 BN层以及 ReLU激活函数串 联组成的降采样模块, 卷积核的大小被 设置为3×9×9, 步长被 设置为1×4 ×4, 经过降采样模块后, 输入视频帧序列的空间分辨率将 被降低4倍, 这可以降低时间编码 器对空间信息的关注程序, 实现显式时空解耦。 5.如权利要求1所述的基于视频理解和时空解耦的高分辨率遥感影像变化检测算法, 其特征在于: 时序聚合模块TAM首先对时间编码器的某一层级输出 的特征进行时间维度的 全局最大池化与全局平均池化, 以得到对T ‑Block提取特征中所蕴含的时序变化信息的高 效表示; 接着, 将 两种池化结果在通道维度上拼接, 得到聚合特征; 最后, 使用卷积核 大小为 1×1的卷积层以及一个批归一化层和ReLU激活函数对聚合特征进 行点对点变换, 得到最 终 输出。 6.如权利要求3所述的基于视频理解和时空解耦的高分辨率遥感影像变化检测算法, 其特征在于: 在步骤3中, 渐进式解码器串联了一个卷积层和数个解码模块D ‑Block, D ‑ Block的总数比空间编码器中S ‑Block的数量多一个; D ‑Block接收两个输入, 分别是上一个 D‑Block的输出以及处于同一层级的S ‑Block的输出, 首先对上级解码特征进行上采样, 然 后将上采样结果和同级编码特征在通道维度上拼接, 最后使用两个卷积层进行特征融合, 在每个卷积层之后增加BN层和ReLU激活函数, 在两个卷积层间添加残差连接以缓解梯度消 失问题。 7.如权利要求1所述的基于视频理解和时空解耦的高分辨率遥感影像变化检测算法, 其特征在于: 在步骤4中, 通过最小化联合损失函数来进行训练整个变化检测网络, 联合损 失函数可表示为: L=l(Pfinal,R)+λl(Pinter,R)        (4) 其中l表示对每个输出 ‑真值标签对所使用的具体损失函数, Pfinal和Pinter分别表示模型 最终输出和旁路输出 的变化概率图, 其中模型最终输出即解码器输出, 旁路输出即时间编 码器输出, R表示真值变化标签, 而 λ则是辅助损失的权重系数, 选取类别均衡交叉熵损失作 为具体的损失类型: 其中, H和 W分别表示图像的高和宽, i和j分别表示图像的第i行和第j列, wc和wu则分别 为变化类与不变 类的类别权 重系数, 使用Adam优化器调整梯度, 最小化损失函数。 8.如权利要求3所述的基于视频理解和时空解耦的高分辨率遥感影像变化检测算法, 其特征在于: 空间编码器中共包含3个S ‑Block, 分别设置三个S ‑Block的输出通道数为32、 64和128。 9.如权利要求4所述的基于视频理解和时空解耦的高分辨率遥感影像变化检测算法, 其特征在于: 时间编码器包含1个降采样模块和4个T ‑Block, 下采样模块的输出通道数设置 为64; 对于4个T ‑Block, 分别将输出通道数设置为25 6、 256、 512和512。权 利 要 求 书 2/2 页 3 CN 115147760 A 3

.PDF文档 专利 基于视频理解和时空解耦的高分辨率遥感影像变化检测方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于视频理解和时空解耦的高分辨率遥感影像变化检测方法 第 1 页 专利 基于视频理解和时空解耦的高分辨率遥感影像变化检测方法 第 2 页 专利 基于视频理解和时空解耦的高分辨率遥感影像变化检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:30:45上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。