专利 一种基于视觉的物体可用性少样本分类方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 20221080423 0.8 (22)申请日 2022.07.07 (71)申请人大连海事大学地址 116026 辽宁省大连市高新园区凌海路1号 (72)发明人屈雯　赵萌　 (74)专利代理机构大连东方专利代理有限责任公司 21212 专利代理师姜威威　李洪福 (51)Int.Cl. G06V 10/44(2022.01) G06V 10/74(2022.01) G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种基于视觉的物体可用性少样本分类方法 (57)摘要本发明一种基于视觉的物体可用性少样本分类方法，属于计算机视觉、人工智能领域，包括以下步骤：构建用于物体可用性分类的数据集；对数据集进行预处理，得到预处理后的数据集；将预处理后的数据集划分为类别互斥的训练集、验证集和测试集，分别将训练集和测试集；构建可用性少样本分类模型；将训练集数据输入到可用性少样本分类模型中，对可用性少样本分类模型进行训练，得到训练好的可用性少样本分类模型；将测试集数据输入到训练好的可用性少样本分类模型中，得到物体可用性少样本的分类；该方法的输出结果为未标注的查询图像的预测类别，该方法减少了由于类别分布不平衡且样本有限带来的过拟合现象。权利要求书2页说明书14页附图4页 CN 115272695 A 2022.11.01 CN 115272695 A 1.一种基于视觉的物体可用性少样本分类方法，其特征在于：包括以下步骤：构建用于物体可用性分类的数据集；对数据集进行预处理，得到预处理后的数据集；将预处理后的数据集划分为类别互斥的训练集、验证集和测试集；构建可用性少样本分类模型；将训练集数据输入到可用性少样本分类模型中，对可用性少样本分类模型进行训练，得到训练好的可用性少样本分类模型；将测试集数据输入到训练好的可用性少样本分类模型中，得到物体可用性少样本的分类。 2.根据权利要求1所述的一种基于视觉的物体可用性少样本分类方法，其特征在于：所述可用性少样本分类模型包括多尺度特征提取模块、基于自注意力的双重注意力模块和相关性模块；所述多尺度特征提取模块用于对样本特征进行提取；所述基于自注意力的双重注意力模块包括位置注意子模块和通道注意子模块；所述位置注意子模块对提取后的样本特征采用自注意力，通过所有位置处的特征加权和来选择性地聚合每个位置的特征，使类似的特征彼此相关，得到样本位置特征；所述通道注意子模块分别通过整合所有通道映射之间的相关特性来选择性地强调相互依赖的通道映射，进而得到样本通道特征；将样本位置特征与样本通道特征进行相加，得到相加后特征图；将相加后的特征图输入到相关性模块中，得到样本图片的相似度。 3.根据权利要求1所述的一种基于视觉的物体可用性少样本分类方法，其特征在于：所述预处理指将数据集里图片尺寸统一到4 48×448。 4.根据权利要求1所述的一种基于视觉的物体可用性少样本分类方法，其特征在于：所述多尺度特征提取模块采用基于深度学习的多尺度特征融合卷积神经网络进行特征提取，去除与分类任务高度相关的全连接层，输出为图像特征。 5.根据权利要求1所述的一种基于视觉的物体可用性少样本分类方法，其特征在于：所述多尺度特征提取模块采用基于深度学习的多尺度特征融合卷积神经网络进行特征提取，去除与分类任务高度相关的全连接层，输出为图像特征的过程如下：对输入的图像通过第一卷积层进行卷积操作，即对输入的图像进行批归一化、非线性激活函数Relu以及最大池化操作，输出卷积操作后得图片；卷积操作后得图片分别依次通过第一残差层、第二残差层、第三残差层和第四残差层，得到三个不同阶段输出的不同尺度特征图像；三个不同阶段输出的不同尺度特征图像按照自顶向下的顺序进行融合，得到得是融合后特征。 6.根据权利要求1所述的一种基于视觉的物体可用性少样本分类方法，其特征在于：所述第一残差层、第二残差层、第三残差层和第四残差层均包括：两个基本块模块，对于每个残差层的基本块，都是将输入经过两次的3 ×3卷积、批归一化和非线性激活函数操作后与输入进行跳跃连接，再通过非线性激活函数Relu得到每个基本块的输出。 7.根据权利要求1所述的一种基于视觉的物体可用性少样本分类方法，其特征在于：所权　利　要　求　书 1/2 页 2 CN 115272695 A 2述第一残差层有64个滤波器、第二残差层有128个滤波器、第三残差层有256个滤波器和第四残差层有512个滤波器。 8.一种基于视觉的物体可用性少样本分类装置，其特征在于：包括：构建模块 I：用于构建用于物体可用性分类的数据集；预处理模块：用于对数据集进行预处理，得到预处理后的数据集；将预处理后的数据集划分为类别互斥的训练集、验证集和测试集构建模块 II：用于构建可用性少样本分类模型；训练模块：用于将训练集数据输入到可用性少样本分类模型中，对可用性少样本分类模型进行训练，得到训练好的可用性少样本分类模型；分类模块，用于将测试集数据输入到训练好的可用性少样本分类模型中，得到物体可用性少样本的分类。 9.一种计算机可读存储介质，所述计算机可读存储介质中存储有包括计算机程序，其中，所述计算机程序运行时，执行所述权利要求 1‑7任一项所述的一种基于视觉的物体可用性少样本分类方法。权　利　要　求　书 2/2 页 3 CN 115272695 A 3

专利 一种基于视觉的物体可用性少样本分类方法

专利一种基于视觉的物体可用性少样本分类方法