专利 图像的识别方法、装置、存储介质以及电子设备

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210578525.8 (22)申请日 2022.05.25 (71)申请人北京明略昭辉科技有限公司地址 100098 北京市海淀区北三环西路25 号27号楼二层2020室 (72)发明人朱彦浩　胡郡郡　唐大闰　 (74)专利代理机构北京华夏泰和知识产权代理有限公司 1 1662 专利代理师林鹏飞 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/74(2022.01) G06V 10/24(2022.01) G06V 20/60(2022.01) (54)发明名称图像的识别方法、装置、存储介质以及电子设备 (57)摘要本发明公开了一种图像的识别方法、装置、存储介质以及电子设备。该方法包括：获取目标图像，其中，目标图像中包含待分类对象；对目标图像进行数据增强，得到第一图像和第二图像；将第一图像输入至第一识别模型，得到第一输出结果并根据第一输出结果确定目标图像的分类结果，将第二图像输入第二识别模型，得到第二输出结果；获取第一输出结果与第二输出结果的对比结果；在对比结果小于阈值的情况下，输出目标图像的分类结果。本发明解决了训练模型的网络性能低的技术问题。权利要求书2页说明书10页附图3页 CN 114972865 A 2022.08.30 CN 114972865 A 1.一种图像的识别方法，其特征在于，包括：获取目标图像，其中，所述目标图像中包含待分类对象；对所述目标图像进行数据增强，得到第一图像和第二图像；将所述第一图像输入至第一识别模型，得到第一输出结果并根据所述第一输出结果确定所述目标图像的分类结果，将所述第二图像输入第二识别模型，得到第二输出结果；获取所述第一输出结果与所述第二输出结果的对比结果；在所述对比结果小于阈值的情况下，输出所述目标图像的分类结果。 2.根据权利要求1所述的方法，其特征在于，所述对所述目标图像进行数据增强，得到第一图像和第二图像包括：对所述目标图像进行第一度数的角度旋转，得到第一旋转图像；水平或竖直翻转所述第一旋转图像，得到第一翻转图像；对所述第一翻转图像进行随机裁剪，得到所述第一图像；对所述目标图像进行第二度数的角度旋转,得到第二旋转图像；水平或竖直翻转所述第二旋转图像，得到第二翻转图像；对所述第二翻转图像进行随机裁剪，得到所述第二图像。 3.根据权利要求1所述的方法，其特征在于，所述获取所述第一输出结果与所述第二输出结果的对比结果包括：计算所述第一输出结果和所述第二输出结果之间的余弦距离，得到所述对比结果。 4.根据权利要求1所述的方法，其特征在于，所述方法还包括：在所述对比结果大于或等于所述阈值的情况下，更新所述第一识别模型和所述第二识别模型的模型参数。 5.根据权利要求4所述的方法，其特征在于，所述在所述对比结果大于或等于所述阈值的情况下，更新所述第一识别模型的模型参数包括：调整所述第一识别模型的模型参数；使用调整后的所述第一识别模型识别所述第一图像，得到所述第一输出结果；在所述目标图像包括所述待分类对象的情况下，在所述对比结果仍大于或等于所述阈值的情况下，或所述分类结果与所述标注结果不同的情况下，继续调整所述第一识别模型的模型参数，直到所述对比结果小于所述阈值且所述分类结果与所述标注结果相同。 6.根据权利要求5所述的方法，其特征在于，所述在所述对比结果大于或等于所述阈值的情况下，更新所述第一识别模型的模型参数包括：调整所述第一识别模型的模型参数；使用调整后的所述第一识别模型识别所述第一图像，得到所述第一输出结果；在所述目标图像未包括所述待分类对象的情况下，在所述对比结果仍大于或等于所述阈值的情况下，继续调整所述第一识别模型的模型参数，直到所述对比结果小于所述阈值。 7.根据权利要求5所述的方法，其特征在于，所述在所述对比结果大于或等于所述阈值的情况下，更新所述第二识别模型的模型参数包括：获取更新后的所述第一识别模型的更新模型参数和所述第二识别模型的当前模型参数；根据所述第一识别模型的更新模型参数和所述第二识别模型的当前模型参数更新所权　利　要　求　书 1/2 页 2 CN 114972865 A 2述第二识别模型，得到所述第二识别模型的更新模型参数。 8.根据权利要求6所述的方法，其特征在于，所述根据所述第一识别模型的更新模型参数和所述第二识别模型的当前模型参数更新所述第二识别模型，得到所述第二识别模型的更新模型参数包括：将所述第一识别模型的更新模型参数乘以第一值，得到第一模型参数；将所述第二识别模型的当前模型参数乘以第二值，得到第二模型参数，其中，所述第一值和所述第二值的和为1；对所述第一模型参数和所述第二模型参数进行求和，得到所述第二识别模型的更新模型参数。 9.一种图像的识别装置，其特征在于，包括：第一获取模块，用于获取目标图像，其中，所述目标图像中包含待分类对象；处理模块，用于对所述目标图像进行数据增强，得到第一图像和第二图像；输入模块，用于将所述第一图像输入至第一识别模型，得到第一输出结果并根据所述第一输出结果确定所述目标图像的分类结果，将所述第二图像输入第二识别模型，得到第二输出结果；第二获取模块，用于获取所述第一输出结果与所述第二输出结果的对比结果；输出模块，用于在所述对比结果小于阈值的情况下，输出所述目标图像的分类结果。 10.一种计算机可读的存储介质，所述计算机可读的存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器运行时执行所述权利要求1至8任一项中所述的方法。 11.一种电子设备，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行所述权利要求1至8任一项中所述的方法。权　利　要　求　书 2/2 页 3 CN 114972865 A 3

专利 图像的识别方法、装置、存储介质以及电子设备

专利图像的识别方法、装置、存储介质以及电子设备