专利基于深度学习的遥感影像任意方向目标检测方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210759294.0 (22)申请日 2022.06.30 (71)申请人西安电子科技大学地址 710071 陕西省西安市太白南路2号 (72)发明人郭亮　祁文平　李亚超　熊涛　荆丹　许晴　吕艳　邢孟道　 (74)专利代理机构西安嘉思特知识产权代理事务所(普通合伙) 6123 0 专利代理师万艳艳 (51)Int.Cl. G06V 20/10(2022.01) G06V 10/764(2022.01) G06V 10/766(2022.01) G06V 10/774(2022.01) G06V 10/80(2022.01)G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称基于深度学习的遥感影像任意方向目标检测方法 (57)摘要本发明公开了一种基于深度学习的遥感影像任意方向目标检测方法，包括：获取遥感影像数据集，并将其划分为训练集和测试集；对训练集进行数据增强并进行标记；构建具有SAN结构的深度学习网络模型；基于构建的网络模型设计 OVAL_IOU损失函数，并利用训练集对网络模型进行训练；利用训练好的网络模型对测试集进行测试，得到检测结果；对检测结果进行后处理，得到最终的目标位置信息。本发明提供的方法克服了现有技术中虚警率高和漏检率高的问题，提升了检测精度和检测效率。权利要求书2页说明书9页附图3页 CN 115115936 A 2022.09.27 CN 115115936 A 1.一种基于深度学习的遥感影像任意方向目标检测方法，其特征在于，包括：获取遥感影像数据集，并将其划分为训练集和测试集；对所述训练集进行数据增强并进行标记；构建具有SAN结构的深度学习网络模型；基于构建的网络模型设计OVAL_IOU损失函数，并利用所述训练集对网络模型进行训练；利用训练好的网络模型对所述测试集进行测试，得到检测结果；对所述检测结果进行后处理，得到最终的目标位置信息。 2.根据权利要求1所述的基于深度学习的遥感影像任意方向目标检测方法，其特征在于，对所述训练集进行数据增强，并进行标记包括：将所述训练集的数据切割成合适的尺寸并对其进行数据增强；采用OpenCV 表示法对训练集中的目标框进行标记；将OpenCV 表示法转化为长边表示法，则训练集中的目标框标记为： {xc,yc,w_l,h_l, θ _l}；其中， (xc,yc)是目标框的中心坐标， w表示x轴顺时针旋转碰到的第一条边， h为相邻的另一边， w_l＞＝h_l， θ为旋转经过的角度， θ∈(0 °,90°]， θ_l表示x轴顺时针旋转到w_l经过的角度， θ _l∈(0 °,180°]。 3.根据权利要求1所述的基于深度学习的遥感影像任意方向目标检测方法，其特征在于，构建具有SAN结构的深度学习网络模型包括：采用darknet53作为主干特征提取网络搭建深度学习网络框架，其包括特征提取模块、 SAN模块、特征融合模块以及特征整合模块；其中，所述特征提取模块以待检图像作为输入，经过特征提取后，输出特征图至SAN模块；所述SAN模块用于对特征提取模块输出的特征图进行特征增强，并输出增强的特征图至特征融合模块；所述特征融合模块用于根据注意力模块输出的特征图，将语义信息丰富的深层特征上采样并与轮廓信息丰富的浅层特征进行融合，得到融合特征；所述特征整合模块用于对所述融合特征进行特征整合，得到不同尺度的检测结果。 4.根据权利要求3所述的基于深度学习的遥感影像任意方向目标检测方法，其特征在于，所述SAN模块包括CAM模块和S ‑SAM模块，以从不同角度对特征图进行权重划分，从而实现特征增强。 5.根据权利要求1所述的基于深度学习的遥感影像任意方向目标检测方法，其特征在于，所述损失函数为： Loss＝Lconf+Lcls+Lattention+Lreg 其中， Lconf表示置信度损失， Lcls表示类别损失， Lattention表示注意力损失， Lreg表示位置回归损失。 6.根据权利要求5所述的基于深度学习的遥感影像任意方向目标检测方法，其特征在权　利　要　求　书 1/2 页 2 CN 115115936 A 2于，所述置信度损失Lconf的计算公式为：其中， N表示所有预测框的数量；表示第k个预测框内是否有目标，有为1，否则为0；表示第k个预测框内是否没有目标，没有为1，否则为0； pk表示第k个预测框中含有目标的概率， yk表示第k个预测框中是否有目标的标签值， yk＝1表示有目标， yk＝0表示没有目标； BCE为交叉熵损失函数。 7.根据权利要求5所述的基于深度学习的遥感影像任意方向目标检测方法，其特征在于，所述类别损失Lcls的计算公式为：其中， N表示所有预测框的数量，为二进制值，表示第n个预测框中包含目标，表示第n个预测框中不包含目标， BCE为交叉熵损失函数， pn(c)表示第n个预测框为第c类的概率， tn(c)为对应的标签值。 8.根据权利要求5所述的基于深度学习的遥感影像任意方向目标检测方法，其特征在于，所述注意力损失Lattention的计算公式为：其中， h,w分别表示特征层经过S‑SAM模块后前景得分图的高和宽， BCE为交叉熵损失函数， uij表示第i,j位置像素的前景得分，表示对应位置的标签值，当该位置属于前景时否则 9.根据权利要求5所述的基于深度学习的遥感影像任意方向目标检测方法，其特征在于，所述位置回归损失Lreg的计算公式为：其中， N表示所有预测框的数量；为二进制值，表示第n个预测框中包含目标，表示第n个预测框中不包含目标， OVAL_IOU为用椭圆近似计算两个任意方向矩形框 IOU的函数。 10.根据权利要求1所述的基于深度学习的遥感影像任意方向目标检测方法，其特征在于，对所述测试结果进行后处理，得到目标的位置信息包括：根据所述检测结果计算每个网格的置信度值；根据所述检测结果和锚框位置信息计算预测框；基于所述置信度值对所述预测框进行筛选，以得到最终的目标位置信息。权　利　要　求　书 2/2 页 3 CN 115115936 A 3

专利 基于深度学习的遥感影像任意方向目标检测方法

专利基于深度学习的遥感影像任意方向目标检测方法