(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211352999.7
(22)申请日 2022.11.01
(71)申请人 合肥的卢深视科技有限公司
地址 230091 安徽省合肥市高新区习友路
3333号中 国 (合肥) 国际智能语音产业
园研发中心 楼611-217室
(72)发明人 刘冲冲 付贤强 何武 朱海涛
户磊
(74)专利代理 机构 北京智晨知识产权代理有限
公司 11584
专利代理师 张婧
(51)Int.Cl.
G06V 40/16(2022.01)
G06V 10/774(2022.01)
G06V 10/82(2022.01)G06K 9/62(2022.01)
G06N 3/04(2006.01)
(54)发明名称
模型训练方法、 人脸识别方法、 电子设备及
存储介质
(57)摘要
本申请实施例涉及人脸识别领域, 公开了一
种模型训练方法、 人脸识别方法、 电子设备及存
储介质。 模型训练方法包括: 将人脸图像输入人
脸特征提取网络所得到的人脸特征中部分人脸
特征输入到前置有梯度反转层的第一群体特征
提取网络中, 得到第一群体特征, 构建第一特征
损失; 将剩余特征输入到第二群体特征提取网络
中, 得到第二群体特征; 根据第一群体特征和第
二群体特征对 人脸图像进行群体类别分类, 获取
人脸图像所属的群体类别, 构建第一分类损失;
基于第一特征损失和第一分类损失对人脸特征
提取网络、 第一群体特征提取网络和第二群体特
征提取网络进行联合训练, 得到训练好的人脸特
征提取网络。 训练好的人脸特征提取网络在不同
群体间表现一 致。
权利要求书3页 说明书9页 附图3页
CN 115410265 A
2022.11.29
CN 115410265 A
1.一种模型训练方法, 其特 征在于, 包括:
将人脸图像输入人脸特征提取网络所得到的人脸特征中, 部分人脸特征输入到前置有
梯度反转层的第一群体特征提取网络中, 得到第一群体特征, 并构建使每个身份的类中心
向量和与该类中心向量距离最近的类中心向量之间的夹角均靠近同一夹角值的第一特征
损失; 其中每个身份的所述类中心向量是根据对所述部 分人脸特征按对应身份进 行聚类后
获得;
将所述人脸特征中除所述部分人脸特征之外的剩余特征, 输入到第 二群体特征提取网
络中, 得到第二群 体特征;
根据所述第 一群体特征和所述第 二群体特征对所述人脸图像进行群体类别分类, 获取
所述人脸图像所属的群体类别, 并构建使 所述人脸图像所属的群体类别服从均匀分布的第
一分类损失;
基于所述第 一特征损失和所述第 一分类损失对所述人脸特征提取网络、 所述第 一群体
特征提取网络和所述第二群体特征提取网络进行联合训练, 得到训练好的人脸特征提取网
络。
2.根据权利要求1所述的模型训练方法, 其特征在于, 所述第 一群体特征提取网络和所
述第二群 体特征提取网络均 与第一分类网络连接;
所述根据 所述第一群体特征和所述第 二群体特征对所述人脸图像进行群体类别分类,
获取所述人脸图像所属的群 体类别, 包括:
对所述第一群 体特征和所述第二群 体特征进行拼接得到群 体特征;
采用所述第 一分类网络对所述群体特征进行群体类别分类, 得到所述群体特征对应的
人脸图像所属的群 体类别。
3.根据权利要求2所述的模型训练方法, 其特征在于, 所述联合训练的损失约束还包
括: 使所述群体特征和所述群体特征所属群体类别的类中心向量互相靠近的第二特征损
失。
4.根据权利要求1所述的模型训练方法, 其特征在于, 所述人脸特征提取网络还连接第
二分类网络;
所述方法还 包括:
将所述人脸特征中部分人脸特征输入到第 二分类网络 中, 得到所述部分人脸特征对应
的人脸图像所属的身份 类别;
其中, 所述联合训练的损 失约束还包括: 使相同身份人脸图像的所述部分人脸特征相
互靠近、 不同身份人脸图像的所述部分人脸特 征相互远离的第三特 征损失。
5.根据权利要求1 ‑4中任一项所述的模型训练方法, 其特征在于, 所述人脸特征提取网
络还连接第三分类网络;
所述方法还 包括:
将所述人脸特征输入到所述第 三分类网络中, 得到所述人脸特征对应的人脸图像所属
的身份类别;
其中, 所述联合训练的损 失约束还包括: 使相同身份人脸图像的所述人脸特征相互靠
近、 不同身份人脸图像的所述人脸特 征相互远离的第四特 征损失。
6.根据权利要求1所述的模型训练方法, 其特征在于, 采用如下公式构建所述第 一特征权 利 要 求 书 1/3 页
2
CN 115410265 A
2损失的损失函数:
其中, L1为第一特征损失的损失函数, α3为大于0的超 参数, K为身份类别的数量, θ’
k为第
k个身份的ni维类中心向量和与该类中心向量距离最近的第j个身份的ni维类中心向量之
间的夹角, θavg为所有θ’
k的平均值, fciw(k,ni)为第k个身份的ni维类中心向量, fciw(j,ni)为第
j个身份的n i维类中心向量, j≠k。
7.根据权利要求3所述的模型训练方法, 其特征在于, 采用如下公式构建所述第 一分类
损失和所述第二特 征损失对应的损失函数:
其中, L2为第一分类损失和第二特征损失对应的损失函数, B为人脸图像的数量, α4为大
于0的超参数, p为中间参数, cls(b,c)第b个人脸图像属于第c个群体类别的概率, cent er(c,r)
为预设的第c个群体类别的r维类中心向量, featr(b,r)为第b个人脸图像的r维群体特征, d
(A,B) 表示A和B的距离 。
8.根据权利要求4所述的模型训练方法, 其特征在于, 采用如下公式构建所述第 三特征
损失的损失函数:
其中, L3为第三特征损失的损失函数, B为人脸图像的数量, α2、 s和m为大于0的超参数, K
为身份类别的数量, θ*
yi(b)第b个人脸图像的ni 维人脸特征与该人脸图像所属身份类别的ni
维类中心向量之间的夹角, θ*
k为第b个人脸图像的ni维部分人脸特征与第k个身份的ni维类
中心向量之间的夹角, yi(b)为第b个人脸图像所属身份的索引, 所述部分人脸特征的维度权 利 要 求 书 2/3 页
3
CN 115410265 A
3
专利 模型训练方法、人脸识别方法、电子设备及存储介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:02上传分享