(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210983598.5
(22)申请日 2022.08.16
(71)申请人 浙江大华 技术股份有限公司
地址 310051 浙江省杭州市滨江区滨安路
1187号
(72)发明人 曾祁泽 殷俊 朱树磊
(74)专利代理 机构 深圳市威世博知识产权代理
事务所(普通 合伙) 44280
专利代理师 严翠霞
(51)Int.Cl.
G06V 10/44(2022.01)
G06V 10/74(2022.01)
G06V 40/16(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种网络模 型的训练方法、 目标识别方法及
相关设备
(57)摘要
本申请公开了一种网络模型的训练方法、 目
标识别方法及相关设备, 该训练方法包括: 获取
至少两个训练集; 获取与训练集数量对应的至少
两个网络模 型, 其中至少两个网络模 型具有相同
的网络结构; 利用各训练集中的训练样本图像对
对应的网络模 型进行迭代训练, 以使得网络模型
基于训练样 本图像对自身的网络参数进行调整;
响应于迭代训练达到预设的互学习条件, 在至少
两个网络模型的相同位置的网络参数之间进行
互学习; 响应于至少两个网络模型训练完成, 从
至少两个网络模 型中确定出最终的网络模型。 通
过上述方式, 本申请得到的网络模 型能够精确识
别多场景 下的图像 。
权利要求书3页 说明书11页 附图5页
CN 115471671 A
2022.12.13
CN 115471671 A
1.一种网络模型的训练方法, 其特 征在于, 包括:
获取至少两个训练集; 每个所述训练集分别包含不同应用场景下的多个训练样本图
像;
获取与所述训练集数量对应的至少两个网络模型, 其中所述至少两个网络模型具有相
同的网络结构;
利用各所述训练集中的训练样本图像对对应的所述网络模型进行迭代训练, 以使得所
述网络模型基于所述训练样本图像对自身的网络参数进行调整;
响应于所述迭代训练达到预设的互学习条件, 在所述至少两个网络模型的相同位置的
网络参数之间进行互学习;
响应于所述至少两个网络模型未训练完成, 返回所述利用各所述训练集中的训练样本
图像对对应的所述网络模型进行迭代训练的步骤;
响应于所述至少两个网络模型训练完成, 从所述至少两个网络模型中确定出最终的网
络模型。
2.根据权利要求1所述的网络模型的训练方法, 其特征在于, 所述响应于所述迭代训练
达到预设的互学习条件, 在所述至少两个网络模型的相同位置的网络参数之间进 行互学习
的步骤, 包括:
响应于各所述网络模型的当前迭代次数达到预设的次数阈值, 判定所述迭代训练达到
所述互学习条件。
3.根据权利要求1所述的网络模型的训练方法, 其特 征在于,
所述响应于所述迭代训练达到预设的互学习条件, 在所述至少两个网络模型的相同位
置的网络参数之间进行互学习的步骤, 还 包括:
从所述至少两个网络模型中选择任一网络模型作为待更新网络模型;
将所述待更新网络模型和其他网络模型中位置相同的网络参数进行加权求和, 以将求
和值作为所述待更新网络模型的互学习后的网络参数;
在所述待更新网络模型的网络参数更新完成后, 从所述至少两个网络模型中选择另一
网络模型作为待更新网络模型, 直至所有网络模型遍历完毕。
4.根据权利要求3所述的网络模型的训练方法, 其特征在于, 所述将所述待更新网络模
型和其他网络模型中位置相同的网络参数进行加权求和的步骤, 包括:
获取第一权 重与第二权 重;
以所述第一权重作为所述待更新网络模型的网络参数的权重值, 以所述第 二权重作为
其他网络模型的网络参数的权重值, 其中所述第一权重随所述迭代训练逐步减小, 并且/或
者所述第二权 重随所述迭代训练逐步增大。
5.根据权利要求4所述的网络模型的训练方法, 其特征在于, 所述获取第 一权重与第 二
权重的步骤, 包括:
基于所述至少两个网络模型的总数量、 当前迭代次数以及最大迭代次数, 计算得到所
述第一权 重, 其中所述第一权 重与所述当前迭代次数负相关;
基于所述第一权重与所述至少两个网络模型的总数量, 计算得到所述第二权重, 其中
所述第二权 重与所述第一权 重负相关。
6.根据权利要求1所述的网络模型的训练方法, 其特征在于, 所述响应于所述迭代训练权 利 要 求 书 1/3 页
2
CN 115471671 A
2达到预设的互学习条件, 在所述至少两个网络模型的相同位置的网络参数之间进 行互学习
的步骤, 还 包括:
获取待更新网络模型在互学习前的网络参数下的第一损失值以及在互学习后的网络
参数下对应的第二损失值;
将所述第一损失值与所述第二损失值相减, 得到损失变化 值;
基于所述损 失变化值, 计算得到更新概率值, 其中所述更新概率值与所述损 失变化值
正相关;
基于所述更新概率值, 确定是否利用所述互学习后的网络参数对所述互学习前的网络
参数进行 更新。
7.根据权利要求6所述的网络模型的训练方法, 其特征在于, 所述基于所述损失变化
值, 计算得到更新 概率值的步骤, 包括:
响应于所述损失变化 值大于预设的损失阈值, 确定所述更新 概率值为第一预设数值;
响应于所述损失变化值小于或等于所述损失阈值, 基于预设退火温度值与 所述损失变
化值计算得到所述更新概率值, 其中所述更新概率值进一步与所述退火温度值负相关, 所
述退火温度值随迭代训练逐步减小。
8.根据权利要求6所述的网络模型的训练方法, 其特征在于, 所述基于所述更新概率
值, 确定是否利用所述互学习后的网络参数对所述互学习 前的网络参数进行更新的步骤,
包括:
针对所述待更新网络模型的每 个所述网络参数, 在预设数值区间内生成一随机数;
响应于所述随机数大于所述更新概率值, 保持所述互学习前的网络参数不变, 响应于
所述随机数小于或等于所述更新概率值, 利用所述互学习后的网络参数对 所述互学习前的
网络参数进行 更新; 或者
响应于所述随机数小于或等于所述更新概率值, 保持所述互学习前的网络参数不变,
响应于所述随机数大于所述更新概率值, 利用所述互学习后的网络参数对 所述互学习前的
网络参数进行 更新。
9.一种目标识别方法, 其特 征在于, 包括:
将待识别图像输入网络模型, 得到目标对象的待识别特 征;
其中, 所述网络模型为利用权利要求1 ‑8中任一项所述的网络模型的训练方法训练得
到的最终的网络模型;
对所述待识别特 征与比对特 征进行相似度计算, 得到相似度值;
基于所述相似度值, 得到目标识别结果。
10.一种网络模型的训练装置, 其特征在于, 包括互相连接的存储器和处理器, 其中, 所
述存储器用于存储计算机程序, 所述计算机程序在被所述处理器执行时, 用于实现权利要
求1‑8中任一项所述的网络模型的训练方法。
11.一种目标识别装置, 其特征在于, 包括互相连接的存储器和处理器, 其中, 所述存储
器用于存储计算机程序, 所述计算机程序在被所述处理器执行时, 用于实现权利要求9所述
的目标识别方法。
12.一种计算机可读存储介质, 用于存储计算机程序, 其特征在于, 所述计算机程序在
被处理器执行时, 用于实现权利要求 1‑8中任一项 所述的网络模型的训练方法或权利要求9权 利 要 求 书 2/3 页
3
CN 115471671 A
3
专利 一种网络模型的训练方法、目标识别方法及相关设备
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:30:54上传分享