(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210815301.4
(22)申请日 2022.07.08
(71)申请人 泰康保险集团股份有限公司
地址 100031 北京市西城区复兴门内大街
156号泰康人寿大厦
(72)发明人 于吉鹏 李驰 刘岩 赵庆隆
王子豪
(74)专利代理 机构 北京同达信恒知识产权代理
有限公司 1 1291
专利代理师 李海波
(51)Int.Cl.
G06V 10/774(2022.01)
G06V 20/40(2022.01)
G06V 40/10(2022.01)
G06V 10/42(2022.01)G06V 10/74(2022.01)
G06V 10/80(2022.01)
G06V 10/82(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种特征提取模 型的训练方法、 重识别方法
及装置
(57)摘要
本申请涉及信息处理技术领域, 尤其涉及一
种特征提取模型的训练方法、 重识别方法及装
置, 解决无法在存在遮挡干扰的情况下, 实现对
于视频中对象特征进行有效识别的问题, 方法
为: 获取样本数据集合; 基于所述样本数据集合
对初始特征提取网络和预训练的分类网络进行
多轮迭代训练, 在训练过程中, 将指定数目的样
本视频帧和预测特征图输入预训练的局部特征
提取网络, 得到前景增强向量, 并基于各前景增
强向量和对应的图像特征向量之间的向量差异,
计算损失值。 这样, 借助于模型训练过程中提取
的前景增强向量, 能够增强模型对于图像中关键
区域的注 意程度, 增强对于前景中关键区域的感
知, 减少背景信息的干扰, 增加训练得到的目标
特征提取模型的鲁棒 性。
权利要求书3页 说明书18页 附图5页
CN 115294420 A
2022.11.04
CN 115294420 A
1.一种特 征提取模型的训练方法, 其特 征在于, 包括:
获取样本数据集合, 其中, 每个样本数据中包括样本视频帧、 以及所述样本视频帧对应
的对象标签;
基于所述样本数据集合对初始特征提取网络和预训练的分类网络进行多轮迭代训练,
直至满足预设的收敛条件, 基于训练后的目标图像特征提取网络生成目标特征提取模型;
其中, 在一轮迭代训练过程中, 执 行以下操作:
读取指定数目的样本视频帧输入所述初始特征提取网络, 得到各预测特征图和图像特
征向量, 并采用所述分类网络基于各图像特征向量确定分类结果, 以及基于所述分类结果
与对应的对象标签之间的分类差异, 计算第一类损失值;
将所述指定数目的样本视频帧和预测特征图输入预训练 的局部特征提取网络, 得到每
个预测特征图各自对应的关键区域特征向量; 基于各关键区域特征向量, 对相 应的预测特
征图进行特征增强, 得到前景增强向量, 并基于各前景增强向量和对应的图像特征向量之
间的向量差异, 计算第二类损失值, 以及基于所述第一类损失值和所述第二类损失值调整
网络参数。
2.如权利要求1所述的方法, 其特 征在于, 所述计算第二损失之后, 进一 步包括:
针对每个预测特征图, 基于所述预测特征图中的各关键区域生成区域组集合, 其中, 所
述区域组集合中包括: 由两个对称肢体各自归属的关键区域构成的区域组, 以及由一个非
对称肢体归属的关键区域构成的区域组;
针对每个区域组集合, 获取对应各个区域组内的关键区域提取的关键区域特征向量,
并基于各个关键区域特征向量与对应的图像特征向量之间的向量差异, 计算第三类损失
值;
基于所述第一类损失值、 所述第二类损失值、 以及各个第三类损失值, 调整网络参数。
3.如权利要求2所述的方法, 其特征在于, 所述基于各个关键区域特征向量与对应的图
像特征向量之间的向量差异, 计算第三类损失值, 包括:
确定各个关键区域特征向量对应的图像特征向量, 并确定所述各个关键区域特征向量
和图像特 征向量对应的特 征通道数信息;
基于所述特征通道数信 息确定拆分后的各个特征维度范围, 并基于所述各个特征维度
范围, 分别将拆分后的、 对应相同特征维度范围的各个关键区域子特征向量和图像子特征
向量, 确定为 一组子特 征向量, 得到各组子特 征向量;
针对每组子特征向量, 分别计算各个关键区域子特征向量与图像子特征向量之间的向
量差异, 得到第三子损失; 基于各个第三子损失计算第三类损失值。
4.如权利要求1 ‑3任一项所述的方法, 其特征在于, 所述基于各关键区域特征向量, 对
相应的预测特 征图进行 特征增强, 得到前 景增强向量, 包括:
基于各关键区域特征向量与对应的预测特征图中各个位置的特征信息之间的融合结
果, 分别计算对于每 个预测特 征图中各个位置的注意力权 重;
基于各个注意力 权重计算对应的预测特征图中、 各个位置的特征信 息对应的加权 融合
结果, 并基于所述加权融合结果, 对相应的预测特征图、 对应的图像特征向量进行特征增
强, 得到前 景增强向量。
5.一种重识别方法, 其特 征在于, 包括:权 利 要 求 书 1/3 页
2
CN 115294420 A
2获取包含目标对象的目标图像帧, 并获取待处理视频帧集合, 其中, 每个待处理视频帧
关联有时间信息, 并且 对应一个从采集的一个原 始视频帧中、 裁 剪出的待识别对象;
采用已训练的目标特征提取模型, 基于所述目标视频帧提取出目标图像特征向量, 以
及分别基于各个待处理视频帧, 提取出待处理图像特征向量, 其中, 所述目标特征提取模型
是采用权利要求1 ‑4任一项所述的训练方法训练得到的;
计算所述目标图像特征向量与各个待处理图像特征向量之间的相似度, 并基于各个相
似度识别包 含所述目标对象的待处 理视频帧。
6.如权利要求5所述的方法, 其特 征在于, 所述获取待处 理视频帧集 合, 包括:
获取各个图像采集设备采集的原始视频流, 并针对每个原始视频流进行抽帧处理, 得
到各个原 始视频帧集 合;
针对每个原始视频帧, 识别所述原始视频帧中各个对象所在的区域, 并裁剪出所述原
始视频帧中的各个对 象所在的区域, 分别生成对应的各个待处理视频帧, 并将所述各个待
处理视频帧关联 所述原始视频帧对应的时间信息;
基于各个待处 理视频帧生成待处 理视频帧集 合。
7.一种特 征提取模型的训练装置, 其特 征在于, 包括:
获取单元, 用于获取样本数据集合, 其中, 每个样本数据中包括样本视频帧、 以及所述
样本视频帧对应的对象标签;
训练单元, 用于基于所述样本数据集合对初始特征提取网络和预训练 的分类网络进行
多轮迭代训练, 直至满足预设的收敛条件, 基于训练后的目标图像特征提取网络生成目标
特征提取模型; 其中, 在一轮迭代训练过程中, 执 行以下操作:
读取指定数目的样本视频帧输入所述初始特征提取网络, 得到各预测特征图和图像特
征向量, 并采用所述分类网络基于各图像特征向量确定分类结果, 以及基于所述分类结果
与对应的对象标签之间的分类差异, 计算第一类损失值;
将所述指定数目的样本视频帧和预测特征图输入预训练 的局部特征提取网络, 得到每
个预测特征图各自对应的关键区域特征向量; 基于各关键区域特征向量, 对相 应的预测特
征图进行特征增强, 得到前景增强向量, 并基于各前景增强向量和对应的图像特征向量之
间的向量差异, 计算第二类损失值, 以及基于所述第一类损失值和所述第二类损失值调整
网络参数。
8.一种重识别装置, 其特 征在于, 包括:
获取单元, 用于获取包含目标对象的目标图像帧, 并获取待处理视频帧集合, 其中, 每
个待处理视频帧关联有时间信息, 并且对应一个从采集的一个原始视频帧中、 裁剪出 的待
识别对象;
提取单元, 用于采用已训练的目标特征提取模型, 基于所述目标视频帧提取出目标图
像特征向量, 以及分别基于各个待处理视频帧, 提取出待处理图像特征向量, 其中, 所述目
标特征提取模型 是采用权利要求1 ‑4任一项所述的训练方法训练得到的;
计算单元, 用于计算所述目标图像特征向量与各个待处理图像特征向量之间的相似
度, 并基于各个相似度识别包 含所述目标对象的待处 理视频帧。
9.一种电子设备, 其特 征在于, 包括:
存储器, 用于存 储可执行指令;权 利 要 求 书 2/3 页
3
CN 115294420 A
3
专利 一种特征提取模型的训练方法、重识别方法及装置
文档预览
中文文档
27 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:28:55上传分享