(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210616049.4
(22)申请日 2022.05.31
(71)申请人 北京百度网讯科技有限公司
地址 100085 北京市海淀区上地十街10号
百度大厦2层
(72)发明人 王珂尧
(74)专利代理 机构 北京市汉坤律师事务所
11602
专利代理师 姜浩然 吴丽丽
(51)Int.Cl.
G06V 40/16(2022.01)
G06V 40/40(2022.01)
G06V 10/774(2022.01)
G06V 10/764(2022.01)
G06V 10/74(2022.01)G06V 10/44(2022.01)
(54)发明名称
图像检测方法和用于训练图像检测模型的
方法
(57)摘要
本公开提供了一种图像检测方法和用于训
练图像检测模型的方法, 涉及人工智能技术领
域, 具体为深度学习、 图像检测、 计算机视觉技术
领域, 可应用于人脸等场景。 实现方案为: 获取第
一图像, 第一图像包括多个图像块; 获取第一图
像的第一图像特征和与第一图像对应的第二图
像的第二图像特征中的至少一项特征; 以及基于
至少一项特征, 获取检测结果, 检测结果指示第
一图像的第一类别; 其中, 第二图像包括多个图
像块, 并且多个图像块在第一图像中的位置与在
第二图像中的位置不同, 第一图像特征与第二图
像特征之间的相似度高于预定相似度。
权利要求书5页 说明书15页 附图6页
CN 114998963 A
2022.09.02
CN 114998963 A
1.一种图像 检测方法, 包括:
获取第一图像, 所述第一图像包括多个图像块;
获取所述第一图像的第一图像特征和与所述第一图像对应的第二图像的第二图像特
征中的至少一项特 征; 以及
基于所述至少一项特 征, 获取检测结果, 所述检测结果指示所述第一图像的第一类别;
其中, 所述第二图像包括所述多个图像块, 并且所述多个图像块在所述第一图像中的
位置与在所述第二图像中的位置不同, 所述第一图像特征与所述第二图像特征之 间的相似
度高于预定相似度。
2.根据权利要求1所述的方法, 其中, 所述获取所述第 一图像的第 一图像特征和与 所述
第一图像对应的第二图像的第二图像特 征中的至少一项特 征包括:
对所述第一图像进行划分, 得到所述多个图像块;
将所述多个图像块进行重新组合, 得到所述第二图像; 以及
基于所述第一图像和所述第二图像中的至少一个, 对应获取 所述至少一项特 征。
3.根据权利要求1所述的方法, 其中, 所述基于所述第 一图像和所述第 二图像中的至少
一个, 对应获取 所述至少一项特 征, 包括:
将所述第一图像和所述第 二图像中的至少一个输入至特征提取网络, 以对应得到所述
至少一个特 征; 其中,
所述特征提取网络采用训练图像和与所述训练图像对应的更新训练图像训练而来, 所
述训练图像和所述更新训练图像对应于相同的标注标签并且分别包括多个训练图像块, 所
述标注标签指示所述训练图像和所述更新训练图像的对应类别, 所述多个训练图像块在所
述训练图像中的多个位置不同于所述多个训练图像块在所述更新训练图像中的多个位置 。
4.根据权利要求1所述的方法, 其中, 所述至少一项特征包括: 所述第一图像特征和所
述第二图像特 征;
所述基于所述至少一项特 征, 获取检测结果包括:
将所述第一图像特 征和所述第二图像特 征进行融合, 得到融合特 征; 以及
基于所述融合特 征, 获得所述检测结果。
5.根据权利要求3所述的方法, 其中, 所述至少一项特征包括: 所述第一图像特征和所
述第二图像特 征;
所述基于所述至少一项特 征, 获取检测结果包括:
基于所述第一图像特征, 获得第一结果, 所述第一结果指示所述第一图像对应第二类
别;
基于所述第二图像特征, 获得第二结果, 所述第二结果指示所述第一图像对应第三类
别; 以及
基于所述第一结果和所述第二结果, 获取 所述检测结果。
6.根据权利要求2所述的方法, 其中, 所述第一图像包括: 包含人脸的图像, 所述第一类
别包括: 人脸活体 类、 屏幕攻击类、 头模攻击类或者 纸质攻击类。
7.一种用于训练图像 检测模型的方法, 包括:
获取第一训练图像, 所述训练图像具有标注标签并且包括多个训练图像块, 所述标注
标签指示所述第一训练图像对应第四类别;权 利 要 求 书 1/5 页
2
CN 114998963 A
2基于所述多个训练图像块, 获取第二训练图像, 所述多个训练图像块在所述第一训练
图像中的位置不同于所述多个训练图像块在所述第二训练图像中的位置; 以及
基于训练图像对和所述标注标签, 训练图像 检测模型;
其中, 所述训练图像对 包括: 所述第一训练图像和所述第二训练图像。
8.根据权利要求7所述的方法, 其中, 所述图像检测模型包括特征提取网络和分类网
络, 所述基于训练图像对和所述标注标签, 训练图像 检测模型包括:
将所述第一训练图像和所述第 二训练图像分别输入至所述特征提取网络, 以获得与 所
述第一训练图像对应的第一训练图像特征和与所述第二训练图像对应的第二训练图像特
征;
将所述第一训练图像特征和所述第二训练图像特征中的至少一项输入至所述分类网
络, 以获得至少一个预测结果;
基于所述至少一个预测结果和所述标注标签, 获得至少一个损失; 以及
基于所述至少一个损失, 获得 所述训练图像对 对应的总损失; 以及
基于所述总损失, 调整所述图像 检测模型的参数。
9.根据权利要求8所述的方法, 其中, 所述至少一个预测结果包括与 所述第一训练图像
对应的第一结果和与所述第二训练图像对应的第二结果, 所述至少一个损失包括与所述第
一训练图像对应的第一损失和与所述第二训练图像对应的第二损失; 所述总损失为所述第
一损失和所述第二损失之和。
10.根据权利要求8所述的方法, 其中, 所述基于所述至少一个损失, 获得所述训练图像
对对应的总损失包括:
将所述第一训练图像特征和所述第 二训练图像特征中的一个作为标签特征, 另一个作
为预测特 征, 以计算所述标签特 征和预测特 征之间的特 征损失; 以及
基于所述至少一个损失和所述特 征损失, 获得 所述总损失。
11.根据权利要求7 所述的方法, 其中, 所述获得 所述第一训练图像包括:
获得包含第 一对象的第 三图像和包含第 二对象的第四图像, 并且所述第 三图像和所述
第四图像对应第五类别;
获得所述第 三图像中与所述第 一对象相应的第 一图像区域, 和所述第四图像中与 所述
第二对象相应的第二图像区域;
将所述第三图像中的所述第一图像区域替换为所述第二图像区域, 以获得第五图像,
并且将所述第四图像中的所述第二图像区域替换为所述第一图像区域, 以获得第六图像;
以及
将所述第三图像、 所述第 四图像、 所述第五图像和所述第六图像分别确定为所述第一
训练图像, 其中, 所述第一训练图像的标注标签指示所述第一训练图像对应所述第五类别。
12.根据权利要求7 所述的方法, 其中, 所述获得 所述训练图像包括:
获得包含第 三对象的第七图像和包含第四对象的第八图像, 并且所述第七图像和所述
第八图像对应第六类别;
基于所述第七图像和所述第八图像生成第九图像, 所述第九图像包括第五对象, 所述
第五对象与 与所述第四对象的相似度不小于预设值; 以及
将所述第七图像、 所述第八图像、 所述第九图像分别确定为所述第一训练图像, 其中,权 利 要 求 书 2/5 页
3
CN 114998963 A
3
专利 图像检测方法和用于训练图像检测模型的方法
文档预览
中文文档
27 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:29:05上传分享