说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210565190.6 (22)申请日 2022.05.23 (71)申请人 山东海量信息技 术研究院 地址 250098 山东省济南市高新 技术开发 区国家信息通信国际创新园 申请人 济南大学 (72)发明人 杨晓晖 张昊然 冯志全 曲守宁  范雪  (74)专利代理 机构 济南圣达知识产权代理有限 公司 372 21 专利代理师 黄海丽 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/40(2022.01) G06V 10/74(2022.01)G06V 10/774(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06K 9/62(2022.01) (54)发明名称 基于残差块和特征金字塔的视频帧生成方 法及系统 (57)摘要 本发明公开了基于残差块和特征金字塔的 视频帧生成方法及系统; 其中所述方法, 包括: 获 取待处理的前后两帧图像; 将获取的前后两帧图 像, 输入到训练后的视频帧生成模型中, 输出生 成的中间帧图像; 其中, 视频帧生成模型包括相 互连接的改进后的编码器和改进后的解码器; 所 述改进后的编码器, 是通过将U ‑Net网络编码器 的卷积层替换为残差块得到; 所述改进后的编码 器, 用于提取前后两帧图像的空时特征; 所述改 进后的解码器, 是通过将U ‑Net网络的解码器设 置为特征金字塔网络得到; 所述改进后的解码 器, 用于对提取的特征进行特征融合, 以生成中 间帧图像 。 权利要求书2页 说明书9页 附图8页 CN 114842400 A 2022.08.02 CN 114842400 A 1.基于残差块和特 征金字塔的视频帧生成方法, 其特 征是, 包括: 获取待处 理的前后两帧图像; 将获取的前后两帧图像, 输入到训练后的视频帧生成模型中, 输出生成的中间帧图像; 其中, 视频帧生成模型包括相互连接的改进后的编码器和改进后的解码器; 所述改进后的编码器, 是通过将U ‑Net网络编码器的卷积层替换为残差块得到; 所述改 进后的编码器, 用于提取 前后两帧图像的空时特 征; 所述改进后的解码器, 是通过将U ‑Net网络的解码器设置为特征金字塔网络得到; 所述 改进后的解码器, 用于对提取的特 征进行特征融合, 以生成中间帧图像。 2.如权利要求1所述的基于残差块和特征金字塔的视频帧生成方法, 其特征是, 所述改 进后的编码器, 具体结构包括: 依次连接的基础模块j1、 池化层c1、 残差块k1、 池化层c2、 残差块k2、 池化层c3、 残差块 k3、 池化层c4、 残差块 k4和池化层c 5; 基础模块j1, 对于输入的特征, 首先通过卷积层得到一个特征图, 随后将特征图输入修 正线性单 元Relu激活函数层, 以此类 推, 直到生成输出 特征; 对于输入到残差块的特征, 首先通过卷积核大小为3 ×3的卷积层得到一个特征图, 随 后特征图输入修正线性单元激活层, 以此类推, 直到最后一个修正线性单元激活层, 其得到 的特征与跳跃 连接路线输送到的特 征相加, 作为 最终输出。 3.如权利要求1所述的基于残差块和特征金字塔的视频帧生成方法, 其特征是, 所述改 进后的解码器, 工作原理包括: 首先, 采用卷积 操作分别把 不同层次的特 征通道数归一 化处理; 然后, 通过 上采样层, 对每 个层次的归一 化处理的特征进行上采样操作; 随后, 将上采样的特 征通过通道并联拼接; 对拼接结果进行 卷积操作; 最后, 将拼接结果的卷积结果分别进行处理得到核权重、 运动偏移向量和遮挡权重; 基 于核权重、 运动偏移向量和遮挡权 重, 生成中间帧。 4.如权利要求3所述的基于残差块和特征金字塔的视频帧生成方法, 其特征是, 所述基 于核权重、 运动偏移向量和遮挡权 重, 生成中间帧, 具体过程包括: 首先, 使用输入帧中每个像素的运动偏移量和核权重, 对输入的前一帧图像I0和输入的 后一帧图像I1进行变形, 得到 和 具体过程如下: 其中, F是卷积核大小, θa,b(a,b)是核权 重, ( αa,b, βa,b)是运动偏移向量; 使用输入帧中每个像素的遮挡权重, 对变形后的输入帧 和 进行融合, 并得到帧生 成 结果; 假设输入输出 大小为M×N, 遮挡权 重为V∈[0,1]M×N; 使用遮挡权 重融合帧的具体操作, 如公式(4)所示: 权 利 要 求 书 1/2 页 2 CN 114842400 A 2其中, 为生成的中间帧, V为遮挡权重, ⊙为逐像素相乘操作, Y是大小为M ×N、 值全为1 的矩阵, 和 是变形后的输入帧; 对每一个目标像素(i,j), V(i,j)=1代表像素只在 中 可见, V(i,j)=0代 表像素只在 中可见。 5.如权利要求1所述的基于残差块和特征金字塔的视频帧生成方法, 其特征是, 所述训 练后的视频帧生成模型; 训练过程包括: 构建训练集; 所述训练集包括若干个已知中间帧的前后帧图像; 将训练集输入到视频帧生成模型中, 对模型进行训练, 当模型的损 失函数达到最小值 或迭代次数达 到设定阈值时, 停止训练, 得到训练后的视频帧生成模型。 6.如权利要求5所述的基于残差块和特征金字塔的视频帧生成方法, 其特征是, 损失函 数: 其中, M是整个图像中所有像素点的个数, m是其 中一个像素点, ρ 表示Charbonnier惩罚 函数, 表示帧生成结果, It表示真实中间帧。 7.如权利要求1所述的基于残差块和特征金字塔的视频帧生成方法, 其特征是, 使用峰 值信噪比和结构相似性, 作为定量评估生成帧质量的工具。 8.基于残差块和特 征金字塔的视频帧生成系统, 其特 征是, 包括: 获取模块, 其被 配置为: 获取待处 理的前后两帧图像; 中间帧生成模块, 其被配置为: 将 获取的前后两帧图像, 输入到训练后的视频帧生成模 型中, 输出生成的中间帧图像; 其中, 视频帧生成模型包括相互连接的改进后的编码器和改进后的解码器; 所述改进后的编码器, 是通过将U ‑Net网络编码器的卷积层替换为残差块得到; 所述改 进后的编码器, 用于提取 前后两帧图像的空时特 征; 所述改进后的解码器, 是通过将U ‑Net网络的解码器设置为特征金字塔网络得到; 所述 改进后的解码器, 用于对提取的特 征进行特征融合, 以生成中间帧图像。 9.一种电子设备, 其特 征是, 包括: 存储器, 用于非暂时性存 储计算机可读指令; 以及 处理器, 用于运行 所述计算机可读指令, 其中, 所述计算机可读指令被所述处理器运行时, 执行上述权利要求1 ‑7任一项所述的 方法。 10.一种存储介质, 其特征是, 非暂时性地存储计算机可读指令, 其中, 当所述非暂时性 计算机可读指令由计算机执 行时, 执行权利要求1 ‑7任一项所述方法的指令 。权 利 要 求 书 2/2 页 3 CN 114842400 A 3

PDF文档 专利 基于残差块和特征金字塔的视频帧生成方法及系统

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于残差块和特征金字塔的视频帧生成方法及系统 第 1 页 专利 基于残差块和特征金字塔的视频帧生成方法及系统 第 2 页 专利 基于残差块和特征金字塔的视频帧生成方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:29:03上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。