(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210956353.3
(22)申请日 2022.08.10
(71)申请人 安徽大学
地址 230000 安徽省合肥市九龙路1 11号
(72)发明人 段章领 周行云 刘弨 王坤
仰劲涛 彭志 宋俊材 郭小辉
梁栋
(74)专利代理 机构 合肥汇融专利代理有限公司
34141
专利代理师 赵宗海
(51)Int.Cl.
G06V 20/10(2022.01)
G06V 20/40(2022.01)
G06V 10/74(2022.01)
G06V 10/764(2022.01)G06V 10/774(2022.01)
G06V 10/80(2022.01)
G06V 10/82(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种弱对比场景 下的矿石目标检测方法
(57)摘要
本发明提供一种弱对比场景下的矿石目标
检测方法, 其中包括: 通过工业摄像头获取图像
数据; 去除图像数据中的异常数据后标注图像,
接着对图像进行预处理数据增强; 将标注的数据
按8∶2的比例划分为训练集和验证集; 将自适应
激活函数应用到YOLOv5中提高弱对比场景下的
特征提取能力, 同时在残差模块中添加注意力融
合机制提高网络的特征融合能力, 得到改进的
YOLOv5模型; 该模型在弱对比场景下有更 强的泛
化能力, 能检测出更多矿石目标。 本发明还提供
了一种网络泛化能力的对比方法, 首先使用不同
的网络进行训练得到网络模型; 接着将泛化能力
最强的网络的推理结果作为测试集, 最后计算
RAP, RAP的大小可以反映各网络泛化能力差异。
权利要求书2页 说明书7页 附图3页
CN 115471740 A
2022.12.13
CN 115471740 A
1.一种弱对比场景下的矿石目标检测方法, 其特征在于, 所述矿石目标检测方法包括
以下步骤:
Ⅰ、 确定场景阶段: 确定所检测矿石检测场景为弱对比场景;
Ⅱ、 数据获取与预处理阶段: 获取弱对比场景下的矿石图片数据, 对图像数据进行标
注, 删除或修改异常标注数据, 将标注数据分为训练集和验证集, 对图像进行 数据增强;
Ⅲ、 创建网络阶段阶段: 将YOLOv5的backbone 中的CBS模块替换为CBA模块; 将YOLOv5中
的Res_Un it模块替换为Res_iAF F模块;
Ⅳ、 验证阶段: 使用训练完成的改进YOLOv5网络模型进行验证, 保留在验证集上效果最
好的网络;
Ⅴ、 泛化能力对比阶段: 使用改进YOLOv5模型对验证集进行推理, 推理的结果作 为测试
集, 并计算 其他网络在该测试集的RAP。
2.根据权利要求1所述一种弱对比场景下的矿石目标检测方法, 其特征在于, 所述数据
获取与预处 理阶段包括以下步骤:
①使用工业相机获取弱对比场景 下的视频流数据, 从视频流中提取矿石图片数据;
②使用LabelMe 软件对大块的矿石, 进行 标注;
③删除或修改不符合标注要求的数据, 最后将数据集按8 ∶2分为训练集和验证集;
④对训练集图像进行数据增强, 包括随机缩放, 随机翻转, mosaic增强, hsv色彩空间转
换。
3.根据权利要求2所述一种弱对比场景下的矿石目标检测方法, 其特征在于: 所述大块
的矿石的标准 为在图片中像素面积大于96 ×96。
4.根据权利要求1所述一种弱对比场景下的矿石目标检测方法, 其特征在于, 所述创建
网络阶段包括以下步骤:
①替换CBS模块中的Silu激活函数为meta ‑ACON激活函数, 生成CBA模块, meta ‑ACON激
活函数在ACON ‑C上生成, 且ACON ‑C函数如下式(1)所示:
fACON‑C(x)=(p1‑p2)x·σ [β(p1‑p2)x]+p2x (1)
其中p1, p2为超参数, 是Sigmoid函数, 初始值β =p1=1, p2=0, 具体来说, 令β 为式(2), 可
以使得ACON ‑C函数能够 在是否激活中切换, 此时ACON ‑C函数便是meta ‑ACON激活函数;
②将YOLOv5的backbone中的CBS模块替换为CBA模块, 用来学习是否激活相应特征, 提
高模型的特 征提取能力;
③弱对比场景下, 为了有效融合物体特征, 提出Res_iAFF模块, 为进行多尺度注意力融
合, L(X)和G(X)如式(3)和(4)所示:
L(X)=B(PWCo nv2( δ(B(PWCo nv1(X))))) (3)
G(X)=B(PWCo nv2( δ(B(PWCo nv1(g(X)))))) (4)
其中X∈RC×H×W是有C个通道, 大小为H ×W的特征图, g(X)表示对特征图X进行全局平均
池化, 以获取全局的特征, PWConv代表的是逐点(Point Wise)卷积, B代表的是批正则化
Batch Normalization(BN), δ表ReLU激活, X ′∈RC×H×W为经过多尺度注意力融合操作后的特
征图, 可以表示 为式(5):权 利 要 求 书 1/2 页
2
CN 115471740 A
2Res_AFF用Z可以表示 为公式(6):
其中, Y∈RC×H×W, 为X经过两个CBS模块的结果, Z∈RC×H×W,
表示初始特征整合, 此处选
择逐元素求和作 为初始值, 融合权重
在0到1之间,
用于平衡X和Y之间的权
重, 图中虚线表示
而Res_iAFF模块令其中
既可;
④使用Res_iAF F模块代替YOLOv5中的Res_un it模块, 提高模型的特 征融合能力。
5.根据权利要求1所述一种弱对比场景下的矿石目标检测方法, 其特征在于, 所述验证
阶段包括以下步骤:
①对改进的YOLOv5网络进行训练, 观察 loss曲线, 确保网络不 欠拟合和过拟合;
②保留在验证集上mAP最高的模型, 以及最后一轮的模型。
6.根据权利要求1所述一种弱对比场景下的矿石目标检测方法, 其特征在于, 所述泛化
能力对比阶段包括以下步骤:
①在验证集上, 使用泛化能力最强的网络W推理出最 好的检测结果, 记作R 1;
②去除R1中不符合预期或不符合逻辑的检测结果后的结果记作R2, 将R2 作为新的测
试集, 并计算 其他对比网络在R2上的AP;
③APiou=0.5占据更大 的比重, 为0.85, APiou=0.75和APiou=0.9分别占据0.1和0.05的比重,
RAP的计算如式(7)所示:
RAP=0.85 ×APiou=0.5+0.1×APiou=0.75+0.05×APiou=0.90 (7)。权 利 要 求 书 2/2 页
3
CN 115471740 A
3
专利 一种弱对比场景下的矿石目标检测方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:28:49上传分享