(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210913867.0
(22)申请日 2022.07.27
(71)申请人 浙江大华 技术股份有限公司
地址 310051 浙江省杭州市滨江区滨安路
1187号
(72)发明人 程博 刘天赐 邵明
(74)专利代理 机构 深圳市威世博知识产权代理
事务所(普通 合伙) 44280
专利代理师 严翠霞
(51)Int.Cl.
G06V 10/44(2022.01)
G06V 10/74(2022.01)
G06V 10/764(2022.01)
G06V 10/82(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
目标检测模 型训练方法、 设备及计算机可读
存储介质
(57)摘要
本申请公开了一种基于知识蒸馏的目标检
测模型训练方法、 设备及计算机可读存储介质。
该方法包括: 获取样本图像, 样本图像包括用于
对若干个目标进行检测的若干个正类锚框; 分别
利用目标检测学生模型和目标检测教师模型对
样本图像进行目标检测, 对应得到第一目标检测
结果和第二目标检测结果; 基于第一概率分布和
第二概率分布之间的差异, 构建第一蒸馏损失;
至少基于第一蒸馏损失, 调整目标检测学生模型
的参数, 蒸馏损失包括第一蒸馏损失。 通过上述
方式, 能够提高训练得到的目标检测学生模型的
目标检测能力。
权利要求书2页 说明书8页 附图2页
CN 115424032 A
2022.12.02
CN 115424032 A
1.一种基于知识蒸馏的目标检测模型训练方法, 其特 征在于, 包括:
获取样本图像, 所述样本图像包括用于对若干个目标进行检测的若干个正类锚框;
分别利用目标检测学生模型和目标检测教师模型对所述样本图像进行目标检测, 对应
得到第一目标检测结果和 第二目标检测结果, 所述第一目标检测结果和所述第二目标检测
结果包括各 所述正类锚框为前 景框的概 率;
基于第一概率分布和第二概率分布之间的差异, 构建第一蒸馏损 失, 所述第一概率分
布表征所述第一目标检测结果中各所述正类锚框为前景框的概率的分布特征, 所述第二概
率分布表征所述第二目标检测结果中各 所述正类锚框为前 景框的概 率的分布特 征;
至少基于所述第一蒸馏损失, 调整所述目标检测学生模型的参数。
2.根据权利要求1所述的方法, 其特征在于, 在所述基于第 一概率分布和第 二概率分布
之间的差异, 构建第一蒸馏损失之前, 还 包括:
对所述第一目标检测结果中各所述正类锚框为前景框的概率进行整合, 整合后的所述
第一目标检测结果中各 所述正类锚框为前 景框的概 率处在预设的概 率范围;
将整合后的所述第 一目标检测结果中各所述正类锚框为前景框的概率的分布特征, 确
定为所述第一 概率分布。
3.根据权利要求1所述的方法, 其特征在于, 在所述基于第 一概率分布和第 二概率分布
之间的差异, 构建第一蒸馏损失之前, 还 包括:
对所述第二目标检测结果中各所述正类锚框为前景框的概率进行整合, 整合后的所述
第二目标检测结果中各 所述正类锚框为前 景框的概 率处在预设的概 率范围;
将整合后的所述第 二目标检测结果中各所述正类锚框为前景框的概率的分布特征, 确
定为所述第二 概率分布。
4.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括:
分别利用所述目标检测学生模型和所述目标检测教师模型对所述样本图像进行特征
提取, 对应得到第一特 征图和第二特 征图;
获取所述第 一特征图和所述第 二特征图之间各个像素点的特征差异值, 所述像素点的
特征差异值为所述像素点在所述第一特征图中的特征与在所述第二特征图中的特征之间
的差异值;
获取各个所述像素点的权 重;
基于各个所述像素点的权重对各个所述像素点的特征差异值进行加权处理, 得到加权
处理结果;
基于所述加权处 理结果构建第二蒸馏损失;
所述至少基于所述第一蒸馏损失, 调整所述目标检测学生模型的参数, 包括:
基于所述第一蒸馏损失和所述第二蒸馏损失, 调整所述目标检测学生模型的参数。
5.根据权利要求 4所述的方法, 其特 征在于, 所述获取 各个所述像素点的权 重, 包括:
基于各个所述像素点在所述样本图像中的区域, 获取各个所述像素点的第 一权重影响
值; 其中, 所述像素点的权重与所述像素点的第一权重影响值正相关, 前景区域的像素点的
第一权重影响值大于背景区域的像素点的第一权 重影响值;
至少基于各个所述像素点的第一权 重影响值, 获取 各个所述像素点的权 重。
6.根据权利要求5所述的方法, 其特征在于, 所述第 一目标检测结果包括所述第 一特征权 利 要 求 书 1/2 页
2
CN 115424032 A
2图中各个所述像素点的第一目标分类结果, 所述第二目标检测结果包括所述第二特征图中
各个所述像素点的第二目标分类结果, 所述像素点的第一目标分类结果和所述像素点的第
二目标分类结果包括所述像素点属于各个所述目标的概 率;
在所述至少基于所述第 一权重影响值获取各个所述像素点的权重之前, 所述方法还包
括:
基于各个所述像素点的第一目标分类结果和各个所述像素点的第二目标分类结果之
间的差异 值, 获取各个所述像素点的第二权重影响值; 所述像素点的第二权重影响值, 与所
述像素点的第一目标分类结果和所述像素点的第二目标分类结果之间的差异值 正相关;
所述至少基于所述第一权 重影响值获取 各个所述像素点的权 重, 包括:
基于各个所述像素点的第 一权重影响值和各个所述像素点的第 二权重影响值, 获取各
个所述像素点的权 重, 所述像素点的第二权 重影响值与所述像素点的权 重正相关。
7.根据权利要求6所述的方法, 其特征在于, 所述基于各个所述像素点的第 一权重影响
值和各个所述像素点的第二权 重影响值, 获取 各个所述像素点的权 重, 包括:
针对每个所述像素点, 对所述像素点的第 一权重影响值和所述像素点的第 二权重影响
值进行点乘, 得到所述像素点的权 重。
8.根据权利要求1所述的方法, 其特征在于, 在所述分别利用目标检测学生模型和目标
检测教师模型对所述样 本图像进 行目标检测, 对应得到第一目标检测结果和 第二目标检测
结果之后, 所述方法还 包括:
针对每个所述目标, 获取所述目标的第 三概率分布和所述目标的第四概率分布之间的
第三子蒸馏损失, 所述目标的第三概率分布表征所述第一目标检测结果中用于检测所述目
标的各所述正类锚框为前景框的概率的分布特征, 所述目标的第四概率分布表征所述第二
目标检测结果中用于检测所述目标的各 所述正类锚框为前 景框的概 率的分布特 征;
对各所述目标的第三子蒸馏损失进行加权处 理, 得到第三蒸馏损失;
所述至少基于所述第一蒸馏损失, 调整所述目标检测学生模型的参数, 包括:
基于所述第一蒸馏损失和所述第三蒸馏损失, 调整所述目标检测学生模型的参数。
9.根据权利要求1所述的方法, 其特征在于, 所述样本 图像标注有真实目标检测结果,
所述方法还 包括:
基于所述真实目标检测结果和所述第一目标检测结果之间的差异, 构建原 始损失;
所述至少基于所述第一蒸馏损失, 调整所述目标检测学生模型的参数, 包括:
基于所述第一蒸馏损失和所述原 始损失, 调整所述目标检测学生模型的参数。
10.一种目标检测模型训练设备, 其特征在于, 包括处理器、 与所述处理器连接的存储
器, 其中,
所述存储器存储有程序指令;
所述处理器用于执行所述存储器存储的所述程序指令以实现权利要求1 ‑9中任一项所
述的方法。
11.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储程序指令,
所述程序指令能够被处 理器执行, 被执行时实现如权利要求1 ‑9中任一项所述的方法。权 利 要 求 书 2/2 页
3
CN 115424032 A
3
专利 目标检测模型训练方法、设备及计算机可读存储介质
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:30:56上传分享