说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211365059.1 (22)申请日 2022.11.03 (71)申请人 山东大学 地址 250061 山东省济南市历下区经十路 17923号 (72)发明人 刘成云 曹佳倩 陈振学 张玉娇  孙露娜 钟昆儒 秦皓  (74)专利代理 机构 济南圣达知识产权代理有限 公司 372 21 专利代理师 于凤洋 (51)Int.Cl. G06V 40/16(2022.01) G06V 10/82(2022.01) G06V 10/80(2022.01) G06V 10/774(2022.01)G06V 10/26(2022.01) G06T 7/11(2017.01) G06T 3/00(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于生成对抗网络的多姿态人脸正面化方 法及系统 (57)摘要 本公开提供了基于生成对抗网络的多姿态 人脸正面化方法及系统, 涉及图像数据转换技术 领域, 包括获取多姿态人脸图像并进行预处理; 将多姿态人脸图像输入至人脸正面化模型中提 取抽象特征, 采用双注意力机制建立上下文关 系, 将上下文信息编码为局部特征, 通过注意力 挖掘通道图之间的相互依赖关系, 形成相互依赖 的特征图, 获取语义特征表示; 利用所述语义特 征表示的特征图进行正面人脸图像的合成; 本公 开人脸注意力机制增强人脸中最具判别性区域 的生成效果, 指导 生成结构更真实的人脸图像 。 权利要求书1页 说明书5页 附图3页 CN 115471901 A 2022.12.13 CN 115471901 A 1.基于生成对抗网络的多 姿态人脸 正面化方法, 其特 征在于, 包括: 获取多姿态人脸图像并进行 预处理; 将多姿态人脸图像输入至人脸正面化模型中提取抽象特征, 采用双注意力 机制建立上 下文关系, 将上下文信息编 码为局部特征, 通过注意力挖掘通道图之 间的相互依赖 关系, 形 成相互依赖的特 征图, 获取语义特 征表示; 利用所述语义特 征表示的特 征图进行正 面人脸图像的合成。 2.如权利要求1所述的基于生成对抗网络的多姿态人脸正面化方法, 其特征在于, 所述 预处理的方式为进行图像大小格式的裁 剪, 使得图像大小为相同尺寸。 3.如权利要求1所述的基于生成对抗网络的多姿态人脸正面化方法, 其特征在于, 所述 多姿态人脸图像为多种视角的人脸图像, 包括偏转和俯仰角度的人脸图像。 4.如权利要求1所述的基于生成对抗网络的多姿态人脸正面化方法, 其特征在于, 所述 人脸正面化模型为融合多种注意力机制的生成对抗网络 。 5.如权利要求4所述的基于生成对抗网络的多姿态人脸正面化方法, 其特征在于, 所述 生成对抗网络包括判别器结构, 所述判别器结构包括四个判别器, 针对对应人脸图像中的 人脸、 眼睛、 鼻子以及嘴巴区域, 每 个判别器均包括 一个下采样模块以及一个全连接层。 6.如权利要求5所述的基于生成对抗网络的多姿态人脸正面化方法, 其特征在于, 所述 下采样模块包括四个步长为2, 卷积核为3 ×3的卷积层, 并且在最后两层前增加一个自我注 意力模块。 7.如权利要求1所述的基于生成对抗网络的多姿态人脸正面化方法, 其特征在于, 所述 生成对抗网络还包括深度特征编码器结构, 由残差块和双注意力模块串联组成, 所述双注 意力模块由位置注意力模块和通道 注意力模块并联组成。 8.基于生成对抗网络的多 姿态人脸 正面化系统, 其特 征在于, 包括: 图像获取模块, 用于获取多 姿态人脸图像并进行 预处理; 图像特征提取模块, 用于将多姿态人脸图像输入至人脸正面化模型中提取抽象特征, 采用双注意力机制建立上下文关系, 将上下文信息编码为局部特征, 通过注意力挖掘通道 图之间的相互依赖关系, 形成相互依赖的特 征图, 获取语义特 征表示; 图像合成模块, 用于利用所述语义特 征表示的特 征图进行正 面人脸图像的合成。 9.一种计算机可读存储介质, 其特征在于, 其中存储有多条指令, 所述指令适于由终端 设备的处理器加载并执行权利要求 1‑7中任一项 所述的基于生成对抗网络的多姿态人脸正 面化方法。 10.一种终端设备, 其特征在于, 包括处理器和计算机可读存储介质, 处理器用于实现 各指令; 计算机可读存储介质用于存储多条指令, 所述指令适于由处理器加载并执行如权 利要求1‑7中任一项所述的基于生成对抗网络的多 姿态人脸 正面化方法。权 利 要 求 书 1/1 页 2 CN 115471901 A 2基于生成 对抗网络的多姿态人脸正面化方 法及系统 技术领域 [0001]本公开涉及图像数据转换技术领域, 具体涉及基于生成对抗网络的多姿态人脸正 面化方法及系统。 背景技术 [0002]本部分的陈述仅仅是提供了与本公开相关的背景技术信息, 不必然构成在先技 术。 [0003]在生活中, 通过生物特征识别个体身份是各个场景下的主要方式, 如指纹识别, 虹 膜识别, 人脸识别等。 其中人脸识别具有非接触性和非强制性的优点, 成为了人工智能、 计 算机视觉领域的研究热点, 同时也产生很多优秀的应用产品。 然而在非受限的环境 (如监控 视频) 中, 受到姿态、 光照、 遮挡、 表情等因素的影响, 这些应用及现有的人脸识别模型的性 能会严重下降。 近年来, 人脸识别的研究重点也逐渐从受 限环境下 的人脸识别转变为非受 限环境下 的人脸识别。 人脸识别在现实场景中有广泛的应用, 且在非受 限环境问题上还有 提升空间。 研究人脸正面化解决多姿态识别问题具有重要的实际意义。 此外, 人脸正面化在 其他领域也有利用价 值, 如为刑侦领域的办案人员提供参 考等。 [0004]姿态是非受限条件下影响人脸识别模型性能下降的主要因素, 姿态问题的本质是 人脸头部刚性旋转导致的自遮挡问题, 意味着用于识别的人脸信息的缺失。 随着生成对抗 网络的发展, 很多基于该网络的人脸正面化方法被提出, 这些方法很大程度上提高了多姿 态人脸识别的准确率, 但现有的方法存在网络复杂, 训练时间长, 需要先验知识 (如人脸偏 转角度) 等问题, 且图像生成质量和正 面化后的人脸识别准确率有 待进一步提高。 发明内容 [0005]本公开为了解决上述问题, 提出了基于生成对抗网络的多姿态人脸正面化方法及 系统, 通过残差块加深生成对抗网络层数, 并融合多种注意力机制, 对数据库中多种姿态的 人脸图像生成正 面人脸图像, 在保证生成图像质量的同时, 提高了生成图像的速度。 [0006]根据一些实施例, 本公开采用如下技 术方案: 基于生成对抗网络的多 姿态人脸 正面化方法, 包括: 获取多姿态人脸图像并进行 预处理; 将多姿态人脸图像输入至人脸正面化模型 中提取抽象特征, 采用双注意力机制建 立上下文关系, 将上下文信息编码为局部特征, 通过注意力挖掘通道图之间的相互依赖关 系, 形成相互依赖的特 征图, 获取语义特 征表示; 利用所述语义特 征表示的特 征图进行正 面人脸图像的合成。 [0007]根据一些实施例, 本公开采用如下技 术方案: 基于生成对抗网络的多 姿态人脸 正面化系统, 包括: 图像获取模块, 用于获取多 姿态人脸图像并进行 预处理; 图像特征提取模块, 用于将多姿态人脸图像输入至人脸正面化模型中提取抽象特说 明 书 1/5 页 3 CN 115471901 A 3

PDF文档 专利 基于生成对抗网络的多姿态人脸正面化方法及系统

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于生成对抗网络的多姿态人脸正面化方法及系统 第 1 页 专利 基于生成对抗网络的多姿态人脸正面化方法及系统 第 2 页 专利 基于生成对抗网络的多姿态人脸正面化方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:23:58上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。