(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210578525.8
(22)申请日 2022.05.25
(71)申请人 北京明略昭辉科技有限公司
地址 100098 北京市海淀区北三环西路25
号27号楼二层2020室
(72)发明人 朱彦浩 胡郡郡 唐大闰
(74)专利代理 机构 北京华夏泰和知识产权代理
有限公司 1 1662
专利代理师 林鹏飞
(51)Int.Cl.
G06V 10/764(2022.01)
G06V 10/74(2022.01)
G06V 10/24(2022.01)
G06V 20/60(2022.01)
(54)发明名称
图像的识别方法、 装置、 存储介质以及电子
设备
(57)摘要
本发明公开了一种图像的识别方法、 装置、
存储介质以及电子设备。 该方法包括: 获取目标
图像, 其中, 目标图像中包含待分类对象; 对目标
图像进行数据增强, 得到第一图像和第二图像;
将第一图像输入至第一识别模型, 得到第一输出
结果并根据第一输出结果确定目标图像的分类
结果, 将第二图像输入第二识别模型, 得到第二
输出结果; 获取第一输出结果与第二输出结果的
对比结果; 在对比结果小于阈值的情况下, 输出
目标图像的分类结果。 本发明解决了训练模型的
网络性能低的技 术问题。
权利要求书2页 说明书10页 附图3页
CN 114972865 A
2022.08.30
CN 114972865 A
1.一种图像的识别方法, 其特 征在于, 包括:
获取目标图像, 其中, 所述目标图像中包 含待分类对象;
对所述目标图像进行 数据增强, 得到第一图像和第二图像;
将所述第一图像输入至第 一识别模型, 得到第 一输出结果并根据 所述第一输出结果确
定所述目标图像的分类结果, 将所述第二图像输入第二识别模型, 得到第二输出 结果;
获取所述第一输出 结果与所述第二输出 结果的对比结果;
在所述对比结果小于阈值的情况 下, 输出所述目标图像的分类结果。
2.根据权利要求1所述的方法, 其特征在于, 所述对所述目标图像进行数据增强, 得到
第一图像和第二图像包括:
对所述目标图像进行第一度数的角度旋转, 得到第一旋转图像;
水平或竖直翻转所述第一旋转图像, 得到第一翻转图像;
对所述第一翻转图像进行随机 裁剪, 得到所述第一图像;
对所述目标图像进行第二度数的角度旋转,得到第二旋转图像;
水平或竖直翻转所述第二旋转图像, 得到第二翻转图像;
对所述第二翻转图像进行随机 裁剪, 得到所述第二图像。
3.根据权利要求1所述的方法, 其特征在于, 所述获取所述第 一输出结果与 所述第二输
出结果的对比结果包括:
计算所述第一输出 结果和所述第二输出 结果之间的余弦距离, 得到所述对比结果。
4.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括:
在所述对比结果大于或等于所述阈值的情况下, 更新所述第 一识别模型和所述第 二识
别模型的模型参数。
5.根据权利要求4所述的方法, 其特征在于, 所述在所述对比结果大于或等于所述阈值
的情况下, 更新所述第一识别模型的模型参数包括:
调整所述第一识别模型的模型参数;
使用调整后的所述第一识别模型识别所述第一图像, 得到所述第一输出 结果;
在所述目标图像包括所述待分类对象的情况下, 在所述对比结果仍大于或等于所述阈
值的情况下, 或所述分类结果与所述标注结果不同的情况下, 继续调整所述第一识别模型
的模型参数, 直到所述对比结果小于所述阈值且所述分类结果与所述标注结果相同。
6.根据权利要求5所述的方法, 其特征在于, 所述在所述对比结果大于或等于所述阈值
的情况下, 更新所述第一识别模型的模型参数包括:
调整所述第一识别模型的模型参数;
使用调整后的所述第一识别模型识别所述第一图像, 得到所述第一输出 结果;
在所述目标图像未包括所述待分类对象的情况下, 在所述对比结果仍大于或等于所述
阈值的情况 下, 继续调整所述第一识别模型的模型参数, 直到所述对比结果小于所述阈值。
7.根据权利要求5所述的方法, 其特征在于, 所述在所述对比结果大于或等于所述阈值
的情况下, 更新所述第二识别模型的模型参数包括:
获取更新后的所述第一识别模型的更新模型参数和所述第二识别模型的当前模型参
数;
根据所述第一识别模型的更新模型参数和所述第二识别模型的当前模型参数更新所权 利 要 求 书 1/2 页
2
CN 114972865 A
2述第二识别模型, 得到所述第二识别模型的更新模型参数。
8.根据权利要求6所述的方法, 其特征在于, 所述根据所述第 一识别模型的更新模型参
数和所述第二识别模型的当前模型参数更新所述第二识别模型, 得到所述第二识别模型的
更新模型参数包括:
将所述第一识别模型的更新模型参数乘以第一 值, 得到第一模型参数;
将所述第 二识别模型的当前模型参数乘以第二值, 得到第 二模型参数, 其中, 所述第一
值和所述第二 值的和为1;
对所述第一模型参数和所述第 二模型参数进行求和, 得到所述第 二识别模型的更新模
型参数。
9.一种图像的识别装置, 其特 征在于, 包括:
第一获取模块, 用于获取目标图像, 其中, 所述目标图像中包 含待分类对象;
处理模块, 用于对所述目标图像进行 数据增强, 得到第一图像和第二图像;
输入模块, 用于将所述第一图像输入至第一识别模型, 得到第一输出结果并根据所述
第一输出结果确定所述 目标图像的分类结果, 将所述第二图像输入第二识别模型, 得到第
二输出结果;
第二获取模块, 用于获取 所述第一输出 结果与所述第二输出 结果的对比结果;
输出模块, 用于在所述对比结果小于阈值的情况 下, 输出所述目标图像的分类结果。
10.一种计算机可读的存储介质, 所述计算机可读的存储介质存储有计算机程序, 其特
征在于, 所述计算机程序被处 理器运行时执 行所述权利要求1至8任一项中所述的方法。
11.一种电子设备, 包括存储器和 处理器, 其特征在于, 所述存储器中存储有计算机程
序, 所述处理器被设置为通过所述计算机程序执行所述权利要求1至8任一项中所述的方
法。权 利 要 求 书 2/2 页
3
CN 114972865 A
3
专利 图像的识别方法、装置、存储介质以及电子设备
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:32:53上传分享