(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211339492.8
(22)申请日 2022.10.29
(71)申请人 南京理工大 学
地址 210018 江苏省南京市玄武区孝陵卫
街道孝陵卫 街200号
(72)发明人 刘华峰 黄丹 孙泽人 姚亚洲
(74)专利代理 机构 南京创略知识产权代理事务
所(普通合伙) 32358
专利代理师 刘文艳
(51)Int.Cl.
G06V 10/764(2022.01)
G06V 10/778(2022.01)
G06V 10/82(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于标签分布学习的含细粒度噪图像
分类方法
(57)摘要
本发明公开了一种基于标签分布学习的含
细粒度噪图像 分类方法, 首先采用双导师网络互
相推荐样 本的模式对输入图像进行计算, 并输出
样本计算结果, 接着通过样本选择模块和样本交
换模块能依次完成对样本计算结果的选择和交
换, 再输入至标签分布学习模块, 随后由标签分
布学习模块能对高损失值样本执行标签分布学
习, 并实时更新网络神经网络模型的参数, 再进
行损失校正, 然后构建用于提升双导师网络表征
学习能力的自监督学习模块, 而双导师网络使用
各自的损失函数进行更新; 本发 明能够克服因图
像数据集中的噪声导致的模型性能下降的情况,
提高了对含细粒度噪图像的分类识别能力, 且在
处理含细粒度噪图像分类具有高效性和优 越性。
权利要求书4页 说明书11页 附图2页
CN 115457337 A
2022.12.09
CN 115457337 A
1.一种基于标签分布学习的含细粒度噪图像分类方法, 其特 征在于: 包括以下步骤,
步骤 (A) , 采用双导师网络互相推荐样本的模式对输入图像进行计算, 并输出样本计算
结果;
步骤 (B) , 通过样本选择模块和样本交换模块能依次完成对样本计算结果的选择和交
换, 再输入至标签分布学习模块;
步骤 (C) , 由标签分布学习模块能对高损失值样本执行标签分布学习, 并实时更新网络
神经网络模型的参数, 再进行损失校正;
步骤 (D) , 构建用于提升双导师网络表征 学习能力的自监 督学习模块;
步骤 (E) , 双导师网络使用各自的损失函数进行 更新;
步骤 (F) , 由标签分布学习模块输出样本标签分布, 完成对输入图像的分类作业。
2.根据权利要求1所述的一种基于标签分布学习的含细粒度噪图像分类方法, 其特征
在于: 步骤 (A) , 采用双导师网络互相推荐样本的模式对输入图像进行计算, 并输出样本计
算结果, 其中双导师网络在 网络结构 中设置了两个结构相同的深度神经网络同时工作, 且
两个深度神经网络分别使用
和
表示, 输入图像中的样本
会被分别送入
和
中, 再利用损失函数
分别计算各个
在两个神经网络中的损失
, 损失函数如公式 (1) 所示,
其中,
, 且
,
表示样本图像
在
个类别上
的概率预测结果,
表示样本图像
属于第
类的独热标签。
3.根据权利要求2所述的一种基于标签分布学习的含细粒度噪图像分类方法, 其特征
在于: 步骤 (B) , 通过样 本选择模块和样本交换模块能依次完成对样本计算结果的选择和交
换, 再输入至标签分布学习模块, 其中具体步骤如下,
步骤 (B1) , 样本选择模块, 样本选择模块对输入的B进行损失值排序, 并分成了
和
、
和
, 其中
和
包含了
个损失最小的训练样本, 而
和
则包含
了剩下的样本, 具体步骤是设一个低损失划分比例
, 则
和
能定义为
如公式 (2) 所示, 并将训练集 通过损失值得 大小分为两个子集,
其中,
表示从输入样本B中由k网络选出的干净样本子集,
表示求取最优子集过
程中遍历的所有符合比例tau的子集,
为低损失划分比例,
表示从输入样本B中由k网
络选出的高损失样本 子集;
步骤 (B2) , 样本交换模块, 样本交换模块是将低损失样本视为干净样本并在两个神经权 利 要 求 书 1/4 页
2
CN 115457337 A
2网络中交换被分离的样本集, 再滤除由标签噪声引入的不同错误, 且
和
在干净样本
上的分类损失
和
分别如公式 (3) 和公式 (4) 所示,
。
4.根据权利要求3所述的一种基于标签分布学习的含细粒度噪图像分类方法, 其特征
在于: 步骤 (C) , 由标签分布学习模块能对高损失值样本执行标签分布学习, 并实时更新网
络神经网络模型的参数, 再进行损失校正, 其中标签分布学习模块的具体内容是采用
Kullback ‑Leibler散度损失指导标签分布训练、 采用基于Mixup技术的高损失样本与低损
失样本混合以及引入辅助性的一 致性损失函数, 具体步骤如下,
步骤 (C1) , 采用Kullback ‑Leibler散度损失指导标签分布训练, 通过采用Kullback ‑
Leibler散度定义损失, 并要维护 一个标签分布矩阵
, 且
矩阵的各个项中维护了样本
中的真实标签估计值
, 其中
是一个维度为
向量, 且
是分类任务的类别数, 而标签分布是样本
属于各个标签的归属度分布, Kullback ‑
Leibler散度损失
如公式 (5) 所示,
其中,
是分类任务的类别数,
是第
次更新网络时神经网络模型的参 数,
满足约
束
每个
引入了一个 隐变量
, 且
能在梯度回传的过程中自由地更新, 再
通过归一 化操作使得
变成
, 并能生成一个标签分布 矩阵;
步骤 (C2) , 采用基于 Mixup技术的高损失样本与低损失样本混合, 具体步骤如下,
步骤 (C21) , 对每一个样本
随机地从干 净样本集
中
抽取出干净样本
, 并相应建立新的样本
, 具体方法如公式 (6)
所示,
其中,
是一个从Beta 分布
中采样的权重参数, 且Mixup技术能确保样本
中至少含 有
的权重在正确的标签上;
步骤 (C22) , 设一个超参数
, 且被优化器使用的分类损失
和
如公式 (7) 和公
式 (8) 所示, 并得到标签分布学习的损失函数定义,权 利 要 求 书 2/4 页
3
CN 115457337 A
3
专利 一种基于标签分布学习的含细粒度噪图像分类方法
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:06上传分享