(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 20221080423 0.8
(22)申请日 2022.07.07
(71)申请人 大连海事大学
地址 116026 辽宁省大连市高新园区凌海
路1号
(72)发明人 屈雯 赵萌
(74)专利代理 机构 大连东方专利代理有限责任
公司 21212
专利代理师 姜威威 李洪福
(51)Int.Cl.
G06V 10/44(2022.01)
G06V 10/74(2022.01)
G06V 10/764(2022.01)
G06V 10/80(2022.01)
G06V 10/82(2022.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于视觉的物体可用性少样本分类方
法
(57)摘要
本发明一种基于视觉的物体可用性少样本
分类方法, 属于计算机视觉、 人工智能领域, 包括
以下步骤: 构建用于物体可用性分类的数据集;
对数据集进行预处理, 得到预处理后的数据集;
将预处理后的数据集划分为类别互斥的训练集、
验证集和测试集, 分别将训练集和测试集; 构建
可用性少样 本分类模型; 将训练集数据输入到可
用性少样 本分类模型中, 对可用性少样本分类模
型进行训练, 得到训练好的可用性少样本分类模
型; 将测试集数据输入到训练好的可用性少样本
分类模型中, 得到物体可用性少样本的分类; 该
方法的输出结果为未标注的查询图像的预测类
别, 该方法减少了由于类别分布 不平衡且样本有
限带来的过拟合现象。
权利要求书2页 说明书14页 附图4页
CN 115272695 A
2022.11.01
CN 115272695 A
1.一种基于 视觉的物体可用性少样本分类方法, 其特 征在于: 包括以下步骤:
构建用于物体可用性分类的数据集;
对数据集进行 预处理, 得到预处 理后的数据集;
将预处理后的数据集划分为类别互斥的训练集、 验证集和 测试集;
构建可用性少样本分类模型;
将训练集数据输入到可用性少样本分类模型中, 对可用性少样本分类模型进行训练,
得到训练好的可用性少样本分类模型;
将测试集数据输入到训练好的可用性少 样本分类模型中, 得到物体可用性少样本的分
类。
2.根据权利要求1所述的一种基于视觉的物体可用性少 样本分类方法, 其特征在于: 所
述可用性少样本分类模型包括多尺度特征提取模块、 基于自注意力的双重注意力模块和相
关性模块;
所述多尺度特 征提取模块用于对样本特 征进行提取;
所述基于自注意力的双重注意力模块包括 位置注意子模块和通道 注意子模块;
所述位置注意子模块对提取后的样本特征采用自注意力, 通过所有位置处 的特征加权
和来选择性 地聚合每 个位置的特 征, 使类似的特 征彼此相关, 得到样本位置特 征;
所述通道注意子模块分别通过整合所有通道映射之间的相关特性来选择性地强调相
互依赖的通道映射, 进 而得到样本通道特 征;
将样本位置特 征与样本通道特 征进行相加, 得到相加后特 征图;
将相加后的特 征图输入到相关性模块中, 得到样本图片的相似度。
3.根据权利要求1所述的一种基于视觉的物体可用性少 样本分类方法, 其特征在于: 所
述预处理指将数据集里图片尺寸统一到4 48×448。
4.根据权利要求1所述的一种基于视觉的物体可用性少 样本分类方法, 其特征在于: 所
述多尺度特征提取模块采用基于深度学习的多尺度特征融合卷积神经网络进 行特征提取,
去除与分类任务高度相关的全连接层, 输出为图像特 征。
5.根据权利要求1所述的一种基于视觉的物体可用性少 样本分类方法, 其特征在于: 所
述多尺度特征提取模块采用基于深度学习的多尺度特征融合卷积神经网络进 行特征提取,
去除与分类任务高度相关的全连接层, 输出为图像特 征的过程如下:
对输入的图像通过第一卷积层进行卷积操作, 即对输入的图像进行批归一化、 非线性
激活函数Relu以及最大池化操作, 输出 卷积操作后得图片;
卷积操作后得图片分别依次通过第 一残差层、 第 二残差层、 第三残差层和第四残差层,
得到三个不同阶段输出的不同尺度特 征图像;
三个不同阶段输出的不同尺度 特征图像按照自顶向下的顺序进行融合, 得到得是融合
后特征。
6.根据权利要求1所述的一种基于视觉的物体可用性少 样本分类方法, 其特征在于: 所
述第一残差层、 第二残差层、 第三残差层和第四残差层均包括: 两个基本块模块, 对于每个
残差层的基本块, 都是将输入经过两次的3 ×3卷积、 批归一化和非线性激活函数操作后与
输入进行跳跃 连接, 再通过非线性激活函数Relu得到每 个基本块的输出。
7.根据权利要求1所述的一种基于视觉的物体可用性少 样本分类方法, 其特征在于: 所权 利 要 求 书 1/2 页
2
CN 115272695 A
2述第一残差层有64个滤波器、 第二残差层有128个滤波器、 第三残差层有256个滤波器和第
四残差层有512个滤波器。
8.一种基于 视觉的物体可用性少样本分类装置, 其特 征在于: 包括:
构建模块 I: 用于构建用于物体可用性分类的数据集;
预处理模块: 用于对数据集进行预处理, 得到预处理后的数据集; 将预处理后的数据集
划分为类别互斥的训练集、 验证集和 测试集
构建模块 II: 用于构建可用性少样本分类模型;
训练模块: 用于将训练集数据输入到可用性少样本分类模型中, 对可用性少样本分类
模型进行训练, 得到训练好的可用性少样本分类模型;
分类模块, 用于将测试集数据输入到训练好的可用性少样本分类模型中, 得到物体可
用性少样本的分类。
9.一种计算机可读存储介质, 所述计算机可读存储介质中存储有包括计算机程序, 其
中, 所述计算机程序运行时, 执行所述权利要求 1‑7任一项所述的一种基于视觉的物体可用
性少样本分类方法。权 利 要 求 书 2/2 页
3
CN 115272695 A
3
专利 一种基于视觉的物体可用性少样本分类方法
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:28:55上传分享