(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211018085.7
(22)申请日 2022.08.24
(71)申请人 安徽大学
地址 230039 安徽省合肥市蜀山区肥西路3
号
(72)发明人 程志友 刘思乾 汪传建 罗荣昊
程灿
(74)专利代理 机构 合肥国和专利代理事务所
(普通合伙) 34131
专利代理师 吴娜 张祥骞
(51)Int.Cl.
G06V 10/74(2022.01)
G06V 10/774(2022.01)
G06V 10/80(2022.01)
G06V 10/82(2022.01)
(54)发明名称
基于改进YOLOv5的小样本野生动物检测方
法
(57)摘要
本发明涉及一种基于改进YOLOv5的小样本
野生动物检测方法, 包括: 根据所采集的待检测
片区真实野生动物数据集对AwA2动物数据集进
行筛选, 筛选出的图像作为实验数据集; 对所采
集的待检测片区真实野生动物数据集进行筛选,
得到小样 本实验数据集; 对实验 数据集和小样本
实验数据集进行标注; 在YOL Ov5网络模型中加入
坐标注意力模块CA, 得到YOL Ov5‑CA网络模型; 采
用两阶段训练方法得到YOL Ov5‑CA‑TL网络模型,
检测待检测片区真实野生动物并进行可行性验
证。 本发明通过以所采集的待检测片区真实野生
动物数据集作为研究对象, 使用坐标注意力模块
CA有效解决了其他一些算法检测精度低的问题,
相对于传统方法, 大 大降低了人工成本 。
权利要求书3页 说明书6页 附图3页
CN 115393618 A
2022.11.25
CN 115393618 A
1.一种基于改进YOLOv5的小样本野生动物检测方法, 其特征在于: 该方法包括下列顺
序的步骤:
(1)下载AwA2动物数据集, 根据所采集的待检测片区真实野生动物数据集对AwA2动物
数据集进行筛选, 筛选出与待检测片区真实野生动物数据集相似的图像作为实验数据集,
将实验数据集划分为第一训练集和验证集;
(2)对所采集的待检测片区真实野生动物数据集进行筛选, 选择动物画面清晰、 像素质
量高的照片作为小样本实验数据集, 将小样本实验数据集划分为第二训练集和 测试集;
(3)对实验数据集和小样本实验数据集进行 标注;
(4)构建YOLOv5网络模型,在YOLOv5网络模型中加入坐标注意力模块CA, 得到YOLOv5 ‑
CA网络模型, 将标注后的第一训练集输入YOLOv5 ‑CA网络模型中进行训练;
(5)采用两阶段训练方法得到YOLOv5 ‑CA‑TL网络模型, 将标注后的测试集输入YOLOv5 ‑
CA‑TL网络模型中, 检测得到图片中的野生动物, 并进行 可行性验证。
2.根据权利 要求1所述的基于改进YOLOv5的小样本野生动物检测方法, 其特征在于: 在
步骤(3)中, 所述标注是指用Lab elimg工具对实验数据集和小样本实验数据集的图片中的
动物进行 标注, 标注格式为yo lo格式。
3.根据权利 要求1所述的基于改进YOLOv5的小样本野生动物检测方法, 其特征在于: 所
述步骤(4)具体包括以下步骤:
(4a)将YOLOv5网络模型主干网络 的第一个C3模块和最后一个C3模块替换为坐标注意
力模块CA, 然后, 将特征图分别编 码, 形成两个特征图, 分别对方向感知和对位置敏感; 将任
意中间张量X=[x1,x2,x3...,xC]∈RC×H×W作为输入,并输出一个同样长度的张量Y=[y1,y2,
y3...,yc], 对X使用尺寸(H,1)和(1,W)的池化核沿着水平和竖直两个方向对每个通道进行
编码, 高度为h的第c个通道的输出如下:
宽度为w的第c个通道的输出如下:
其中, H为池化核的高度, W 为池化核的宽度, XC为第c个通道的张量, h为X的高度;
公式(1)、 (2)是特征 聚合的两个变换, 它们分别沿着两个空间方向进行 聚合, 返回两个
方向感知注意力图; 坐标注意力模块CA在级联之前生成两个特征层, 之后共用一个1 ×1的
卷积操作变换, 如公式(3)所示:
f= δ(F1([Zh,Zw])) (3)
式中, δ为非线性激活函数, F1为1×1的卷积变 换, f是中间特征映射, 是在水平和垂直两
个方向上, 对空间信息进行特征编码后的结果; 然后沿着空间维数将f分解为2个单独的张
量,fh∈RC/r×H和fw∈RC/r×W,然后利用另外两个1 ×1的卷积变换Fh和Fw分别将fh和fw变换为成
含有相同特 征层数的张量到X,得到:
gh=σ(Fh(fh)) (4)
gw=σ(Fw(fw)) (5)
式中, Fh、 Fw均为1×1的卷积变换, σ 是sigmoid激活函数, 在变换过程中, 使用缩减比r来权 利 要 求 书 1/3 页
2
CN 115393618 A
2减少f分的通道数, 然后对 输出gh和gw进行扩展, 分别作为加权权重, 坐 标注意力模块CA最后
的输出如公式(6)所示:
式中, yc(i,j)表示输出的第c个通道中(i,j)的数值, xc(i,j)表示第c个通道中(i,j)的
数值,
表示第c个通道中高度为h的第i个数值,
表示第c个通道中宽度为w的第
j个数值;
(4b)将经标注后的第一训练集调整为640 ×640的图像, 输入至YOLOv5 ‑CA网络模型中,
得到1024个1 ×1的输出矩阵。
4.根据权利 要求1所述的基于改进YOLOv5的小样本野生动物检测方法, 其特征在于: 所
述步骤(4)中的YOLOv5 ‑CA网络模型 具体包括:
第一层: 该层为深度神经网络的Focus层, 将640 ×640的图像转化为RGB三个通道,
Focus层将每个通道上的特征图进行每隔一个像素取一个值的操作, 获得4个独立的特征
层, 将这4个特征层进行堆叠, 此时将宽高维度上的信息转换到通道维度, 输入通道扩充四
倍, 再进行 特征的提取, 得到 64个尺寸 为320×320的输出矩阵作为第二层的输入矩阵;
第二层: 该层定义128个2 ×2的卷积核, 每一个卷积核具有滤波器的作用, 用于深度神
经网络的学习和提取特征, 该层 使用BN归一化和SiLU激活函数, 得到128个尺寸为160 ×160
的输出矩阵作为第三层的输入矩阵;
第三层: 该层为坐标注意力模块CA, 得到128个尺寸为160 ×160的输出矩阵作为第四层
的输入矩阵;
第四层: 该层为卷积层, 定义256个2 ×2的卷积核, 每一个卷积核具有滤波器的作用, 用
于深度神经网络的学习和提取特征, 该层 使用BN归一化和SiLU激活函数, 得到256个尺 寸为
80×80的输出矩阵作为第五层的输入矩阵;
第五层: 该层为C3模块, 包含3个标准卷积层以及多个Bottleneck模块, C3模块是对残
差特征进行学习的主要模块, 分为两支, 一支使用多个Bott leneck模块堆叠和3个标准卷积
层, 另一支仅经过1个基本卷积层, 最后将 两支进行通道上的拼接操作, 得到256个尺 寸为80
×80的输出矩阵作为第六层的输入矩阵;
第六层: 该层为卷积层, 定义512个2 ×2的卷积核, 每一个卷积核具有滤波器的作用, 用
于深度神经网络的学习和提取特征, 该层 使用BN归一化和SiLU激活函数, 得到512个尺 寸为
40×40的输出矩阵作为第七层的输入矩阵;
第七层: 该层为C3模块, 将输入矩阵在通道维度上划分为两个分支, 一支经过多个
Bottleneck堆叠和3个标准卷积层, 另一支仅经过1个基本卷积层, 最后将两支进行通道上
的拼接操作, 得到 512个尺寸 为40×40的输出矩阵作为第八层的输入矩阵;
第八层: 该层为卷积层, 定义1024个2 ×2的卷积核, 每一个卷积核具有滤波器的作用,
用于深度神经网络的学习和提取特征, 该层使用BN归一化和SiLU激活函数, 得到1024个尺
寸为20×20的输出矩阵作为第九层的输入矩阵;
第九层: 该层为SPP模块, 将输入矩阵串行通过多个5 ×5大小的MaxPool层, 得到1024个
尺寸为20×20的输出矩阵作为第十层的输入矩阵;
第十层: 该层为 坐标注意力模块CA, 得到1024个尺寸 为1×1的输出矩阵。权 利 要 求 书 2/3 页
3
CN 115393618 A
3
专利 基于改进YOLOv5的小样本野生动物检测方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:28:47上传分享