(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210759294.0
(22)申请日 2022.06.30
(71)申请人 西安电子科技大 学
地址 710071 陕西省西安市太白南路2号
(72)发明人 郭亮 祁文平 李亚超 熊涛
荆丹 许晴 吕艳 邢孟道
(74)专利代理 机构 西安嘉思特知识产权代理事
务所(普通 合伙) 6123 0
专利代理师 万艳艳
(51)Int.Cl.
G06V 20/10(2022.01)
G06V 10/764(2022.01)
G06V 10/766(2022.01)
G06V 10/774(2022.01)
G06V 10/80(2022.01)G06V 10/82(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
基于深度学习的遥感影像任意方向目标检
测方法
(57)摘要
本发明公开了一种基于深度学习的遥感影
像任意方向目标检测方法, 包括: 获取遥感影像
数据集, 并将其划分为训练集和测试集; 对训练
集进行数据增强并进行标记; 构建具有SAN结构
的深度学习网络模型; 基于构建的网络模型设计
OVAL_IOU损失函数, 并利用训练集对网络模型进
行训练; 利用训练好的网络模型对测试集进行测
试, 得到检测结果; 对检测结果进行后处理, 得到
最终的目标位置信息。 本发明提供的方法克服了
现有技术中虚警率高和漏检率高的问题, 提升了
检测精度和检测效率。
权利要求书2页 说明书9页 附图3页
CN 115115936 A
2022.09.27
CN 115115936 A
1.一种基于深度学习的遥感影 像任意方向目标检测方法, 其特 征在于, 包括:
获取遥感影 像数据集, 并将其划分为训练集和 测试集;
对所述训练集进行 数据增强并进行 标记;
构建具有SAN结构的深度学习网络模型;
基于构建的网络模型设计OVAL_IOU损失函数, 并利用所述训练集对网络模型进行训
练;
利用训练好的网络模型对所述测试集进行测试, 得到检测结果;
对所述检测结果进行后处 理, 得到最终的目标位置信息 。
2.根据权利要求1所述的基于深度学习的遥感影像任意方向目标检测方法, 其特征在
于, 对所述训练集进行 数据增强, 并进行 标记包括:
将所述训练集的数据切割成合 适的尺寸并对其进行 数据增强;
采用OpenCV 表示法对训练集中的目标框进行 标记;
将OpenCV 表示法转 化为长边表示法, 则训练集中的目标框标记为:
{xc,yc,w_l,h_l, θ _l};
其中, (xc,yc)是目标框的中心坐标, w表示x轴顺时针旋转碰到的第一条边, h为相邻的
另一边, w_l>=h_l, θ为旋转经过的角度, θ∈(0 °,90°], θ_l表示x轴顺时针旋转到w_l经过
的角度, θ _l∈(0 °,180°]。
3.根据权利要求1所述的基于深度学习的遥感影像任意方向目标检测方法, 其特征在
于, 构建具有SAN结构的深度学习网络模型包括:
采用darknet53作 为主干特征提取网络搭建深度学习网络框架, 其包括特征提取模块、
SAN模块、 特 征融合模块以及特 征整合模块; 其中,
所述特征提取模块以待检图像作为输入, 经 过特征提取后, 输出 特征图至SAN模块;
所述SAN模块用于对特征提取模块输出的特征图进行特征增强, 并输出增强的特征图
至特征融合模块;
所述特征融合模块用于根据注意力模块输出的特征图, 将语义信 息丰富的深层特征上
采样并与轮廓信息 丰富的浅层特 征进行融合, 得到融合特 征;
所述特征整合模块用于对所述融合特 征进行特征整合, 得到不同尺度的检测结果。
4.根据权利要求3所述的基于深度学习的遥感影像任意方向目标检测方法, 其特征在
于, 所述SAN模块包括CAM模块和S ‑SAM模块, 以从不同角度对特征图进行权重划分, 从而实
现特征增强。
5.根据权利要求1所述的基于深度学习的遥感影像任意方向目标检测方法, 其特征在
于, 所述损失函数为:
Loss=Lconf+Lcls+Lattention+Lreg
其中, Lconf表示置信度损失, Lcls表示类别损失, Lattention表示注意力损失, Lreg表示位置
回归损失。
6.根据权利要求5所述的基于深度学习的遥感影像任意方向目标检测方法, 其特征在权 利 要 求 书 1/2 页
2
CN 115115936 A
2于, 所述置信度损失Lconf的计算公式为:
其中, N表示所有预测框的数量;
表示第k个预测框内是否有目标, 有为1, 否则为0;
表示第k个预测框内是否没有目标, 没有为1, 否则为0; pk表示第k个预测框中含有目标
的概率, yk表示第k个预测框中是否有目标的标签值, yk=1表示有目标, yk=0表示没有目
标; BCE为交叉熵损失函数。
7.根据权利要求5所述的基于深度学习的遥感影像任意方向目标检测方法, 其特征在
于, 所述类别损失Lcls的计算公式为:
其中, N表示所有预测框的数量,
为二进制值,
表示第n个预测框 中包含目标,
表示第n个预测框中不包含目标, BCE为交叉熵损失函数, pn(c)表示第n个预测框为
第c类的概 率, tn(c)为对应的标签值。
8.根据权利要求5所述的基于深度学习的遥感影像任意方向目标检测方法, 其特征在
于, 所述注意力损失Lattention的计算公式为:
其中, h,w分别表示特征层 经过S‑SAM模块后前景得分图的高和宽, BCE为交叉熵损失函
数, uij表示第i,j位置像素的前景得分,
表示对应位置的标签值, 当该位置属于前景时
否则
9.根据权利要求5所述的基于深度学习的遥感影像任意方向目标检测方法, 其特征在
于, 所述位置回归损失Lreg的计算公式为:
其中, N表示所有预测框的数量;
为二进制值,
表示第n个预测框中包含目标,
表示第n个预测框 中不包含目标, OVAL_IOU为用椭圆近似计算两个任意方向矩形框
IOU的函数。
10.根据权利要求1所述的基于深度 学习的遥感影像任意方向目标检测方法, 其特征在
于, 对所述测试 结果进行后处 理, 得到目标的位置信息包括:
根据所述检测结果计算每 个网格的置信度值;
根据所述检测结果和锚框位置信息计算预测框;
基于所述置信度值对所述预测框进行筛 选, 以得到最终的目标位置信息 。权 利 要 求 书 2/2 页
3
CN 115115936 A
3
专利 基于深度学习的遥感影像任意方向目标检测方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:30:29上传分享