专利 图像检测方法和用于训练图像检测模型的方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210616049.4 (22)申请日 2022.05.31 (71)申请人北京百度网讯科技有限公司地址 100085 北京市海淀区上地十街10号百度大厦2层 (72)发明人王珂尧　 (74)专利代理机构北京市汉坤律师事务所 11602 专利代理师姜浩然　吴丽丽 (51)Int.Cl. G06V 40/16(2022.01) G06V 40/40(2022.01) G06V 10/774(2022.01) G06V 10/764(2022.01) G06V 10/74(2022.01)G06V 10/44(2022.01) (54)发明名称图像检测方法和用于训练图像检测模型的方法 (57)摘要本公开提供了一种图像检测方法和用于训练图像检测模型的方法，涉及人工智能技术领域，具体为深度学习、图像检测、计算机视觉技术领域，可应用于人脸等场景。实现方案为：获取第一图像，第一图像包括多个图像块；获取第一图像的第一图像特征和与第一图像对应的第二图像的第二图像特征中的至少一项特征；以及基于至少一项特征，获取检测结果，检测结果指示第一图像的第一类别；其中，第二图像包括多个图像块，并且多个图像块在第一图像中的位置与在第二图像中的位置不同，第一图像特征与第二图像特征之间的相似度高于预定相似度。权利要求书5页说明书15页附图6页 CN 114998963 A 2022.09.02 CN 114998963 A 1.一种图像检测方法，包括：获取第一图像，所述第一图像包括多个图像块；获取所述第一图像的第一图像特征和与所述第一图像对应的第二图像的第二图像特征中的至少一项特征；以及基于所述至少一项特征，获取检测结果，所述检测结果指示所述第一图像的第一类别；其中，所述第二图像包括所述多个图像块，并且所述多个图像块在所述第一图像中的位置与在所述第二图像中的位置不同，所述第一图像特征与所述第二图像特征之间的相似度高于预定相似度。 2.根据权利要求1所述的方法，其中，所述获取所述第一图像的第一图像特征和与所述第一图像对应的第二图像的第二图像特征中的至少一项特征包括：对所述第一图像进行划分，得到所述多个图像块；将所述多个图像块进行重新组合，得到所述第二图像；以及基于所述第一图像和所述第二图像中的至少一个，对应获取所述至少一项特征。 3.根据权利要求1所述的方法，其中，所述基于所述第一图像和所述第二图像中的至少一个，对应获取所述至少一项特征，包括：将所述第一图像和所述第二图像中的至少一个输入至特征提取网络，以对应得到所述至少一个特征；其中，所述特征提取网络采用训练图像和与所述训练图像对应的更新训练图像训练而来，所述训练图像和所述更新训练图像对应于相同的标注标签并且分别包括多个训练图像块，所述标注标签指示所述训练图像和所述更新训练图像的对应类别，所述多个训练图像块在所述训练图像中的多个位置不同于所述多个训练图像块在所述更新训练图像中的多个位置。 4.根据权利要求1所述的方法，其中，所述至少一项特征包括：所述第一图像特征和所述第二图像特征；所述基于所述至少一项特征，获取检测结果包括：将所述第一图像特征和所述第二图像特征进行融合，得到融合特征；以及基于所述融合特征，获得所述检测结果。 5.根据权利要求3所述的方法，其中，所述至少一项特征包括：所述第一图像特征和所述第二图像特征；所述基于所述至少一项特征，获取检测结果包括：基于所述第一图像特征，获得第一结果，所述第一结果指示所述第一图像对应第二类别；基于所述第二图像特征，获得第二结果，所述第二结果指示所述第一图像对应第三类别；以及基于所述第一结果和所述第二结果，获取所述检测结果。 6.根据权利要求2所述的方法，其中，所述第一图像包括：包含人脸的图像，所述第一类别包括：人脸活体类、屏幕攻击类、头模攻击类或者纸质攻击类。 7.一种用于训练图像检测模型的方法，包括：获取第一训练图像，所述训练图像具有标注标签并且包括多个训练图像块，所述标注标签指示所述第一训练图像对应第四类别；权　利　要　求　书 1/5 页 2 CN 114998963 A 2基于所述多个训练图像块，获取第二训练图像，所述多个训练图像块在所述第一训练图像中的位置不同于所述多个训练图像块在所述第二训练图像中的位置；以及基于训练图像对和所述标注标签，训练图像检测模型；其中，所述训练图像对包括：所述第一训练图像和所述第二训练图像。 8.根据权利要求7所述的方法，其中，所述图像检测模型包括特征提取网络和分类网络，所述基于训练图像对和所述标注标签，训练图像检测模型包括：将所述第一训练图像和所述第二训练图像分别输入至所述特征提取网络，以获得与所述第一训练图像对应的第一训练图像特征和与所述第二训练图像对应的第二训练图像特征；将所述第一训练图像特征和所述第二训练图像特征中的至少一项输入至所述分类网络，以获得至少一个预测结果；基于所述至少一个预测结果和所述标注标签，获得至少一个损失；以及基于所述至少一个损失，获得所述训练图像对对应的总损失；以及基于所述总损失，调整所述图像检测模型的参数。 9.根据权利要求8所述的方法，其中，所述至少一个预测结果包括与所述第一训练图像对应的第一结果和与所述第二训练图像对应的第二结果，所述至少一个损失包括与所述第一训练图像对应的第一损失和与所述第二训练图像对应的第二损失；所述总损失为所述第一损失和所述第二损失之和。 10.根据权利要求8所述的方法，其中，所述基于所述至少一个损失，获得所述训练图像对对应的总损失包括：将所述第一训练图像特征和所述第二训练图像特征中的一个作为标签特征，另一个作为预测特征，以计算所述标签特征和预测特征之间的特征损失；以及基于所述至少一个损失和所述特征损失，获得所述总损失。 11.根据权利要求7 所述的方法，其中，所述获得所述第一训练图像包括：获得包含第一对象的第三图像和包含第二对象的第四图像，并且所述第三图像和所述第四图像对应第五类别；获得所述第三图像中与所述第一对象相应的第一图像区域，和所述第四图像中与所述第二对象相应的第二图像区域；将所述第三图像中的所述第一图像区域替换为所述第二图像区域，以获得第五图像，并且将所述第四图像中的所述第二图像区域替换为所述第一图像区域，以获得第六图像；以及将所述第三图像、所述第四图像、所述第五图像和所述第六图像分别确定为所述第一训练图像，其中，所述第一训练图像的标注标签指示所述第一训练图像对应所述第五类别。 12.根据权利要求7 所述的方法，其中，所述获得所述训练图像包括：获得包含第三对象的第七图像和包含第四对象的第八图像，并且所述第七图像和所述第八图像对应第六类别；基于所述第七图像和所述第八图像生成第九图像，所述第九图像包括第五对象，所述第五对象与与所述第四对象的相似度不小于预设值；以及将所述第七图像、所述第八图像、所述第九图像分别确定为所述第一训练图像，其中，权　利　要　求　书 2/5 页 3 CN 114998963 A 3

专利 图像检测方法和用于训练图像检测模型的方法

专利图像检测方法和用于训练图像检测模型的方法