说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211023424.0 (22)申请日 2022.08.25 (71)申请人 北京工业大 学 地址 100124 北京市朝阳区平乐园10 0号 (72)发明人 李嘉锋 黄万 郑永煜 卓力  (74)专利代理 机构 北京思海天达知识产权代理 有限公司 1 1203 专利代理师 刘萍 (51)Int.Cl. G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 20/70(2022.01) G06V 10/774(2022.01) G06V 10/764(2022.01) G06V 10/74(2022.01)G06V 10/26(2022.01) (54)发明名称 一种面向轨道交通的高效语义分割方法 (57)摘要 一种面向轨道交通的高效语义分割方法涉 及计算机视觉图像技术领域。 本发 明采用轨道分 割数据集、 城市景观分割数据集混合。 网络包含 特征提取模块、 金字塔池化模块、 注意力优化模 块、 对象注意力模块、 特征融合模块、 分割头模 块。 通过训练网络, 使其能够对轨道与背景进行 准确分割以及对城市道路与背景进行准确分割, 并且达到足够快的速度以满足 实时性要求。 权利要求书2页 说明书6页 附图4页 CN 115393683 A 2022.11.25 CN 115393683 A 1.一种面向轨道交通的高效语义分割方法, 其特征在于, 包括数据集建立与高效图像 分割网络设计; 数据集建立: 采用轨道分割数据集、 城市景观分割数据集混合; 高效图像分割网络: 网络包含特征提取模块、 金字塔池化模块、 注意力优化模块、 对象 注意力模块、 特 征融合模块、 分割头模块; 通过训练网络, 对轨道与背景进行准确分割以及对 城市道路与背景进行分割; 所述数据集的制作, 具体步骤如下: 对于采集到的轨道交通运行视频数据; 把每一张图像划分割成四类: 轨道类和危险类 以及背景类, 其中背 景类标签为0, 轨道类标签为 1, 危险类标签为2; 使用公开的城市景观数 据集作为扩展; 高效图像分割网络由以下几个模块构 成, 包括特征提取模块、 金字塔池化模块、 对象注 意力模块、 注意力优化模块、 特 征融合模块、 分割头模块。 2.一种面向轨道 交通的高效语义分割方法, 其特征在于, 包括以下步骤: 输入 网络的图 片初始尺寸大小为3 ×1024×512, 经过特征提取网络后得到不同大小的特征图用于后续处 理; 首先经过阶段一中 “ConvBNRelu ”函数即卷积核大小为3步长为2的卷积以及批量归一化 和Relu激活函数作用后得到输出大小为32 ×512×256的特征图, 然后经过阶段二中 “ConvBNRelu ”函数即卷积核大小为3步长为2的卷积以及批量归一化和Relu激活函数作用 后输出大小为64 ×256×128的特征图; 再经过阶段三中 “ConvBNRelu ”函数即卷积核大小为 3步长为1的卷积以及批量归一化、 Relu激活函数和 “Conv2D”函数即卷积核大小为1步长为2 的卷积和批量归一化的共同作用后得到大小为256 ×128×64的特征图; 将该特征作为分割 头模块的输入, 经过分割头模块作用后输出将作为特征融合模块的空间信息输入, 将该特 征图定义为特征图A; 同时将该特征图继续经过阶段四进行下采样, 通过 “ConvBNRelu ”函数 即卷积核大小为3步长为 1的卷积以及批量归一化、 Relu激活函数和 “Conv2D”函数即卷积核 大小为1步长为2的卷积和批量归一化的共同作用后得到大小为512 ×64×32的特征图, 然 后将该特征图通过注 意力优化模块作用后输出大小为 128×64×32的特征作为上下文信息 的一部分, 定义为特征图B; 接下来对512 ×64×32的特征图继续下采样, 通过阶段五中 “ConvBNRelu ”函数即卷积核大小为3步长为1的卷积以及批量归一化、 Relu激活函数和 “Conv2D”函数即卷积核大小为1步长为2的卷积和批量归一化的共同作用后得到大小为 1024×32×16的特征图; 将该特征图通过金字塔池化模块作用后输出大小为1024 ×32×16 的特征图, 然后输入到对象注 意力模块, 后输出大小为 1024×32×16的特征图, 再经过平均 池化操作下采样特征图、 再通过 “ConvBNRelu ”操作改变特征的通道数为128, 利用双 线性插 值上采样特征图得到大小为128 ×32×16的特征图, 将此特征图定义为特征图C; 同时阶段 五输出的特征经过注意力优化模块后输出大小为128 ×32×16的特征图, 将其定义为特征 图D; 将特征图C和特征图D进行叠加, 得到大小为128 ×32×16的特征图然后通过上采样操 作得到大小为128 ×64×32的特征图, 将其定义为特征图E,再将特征图B和特征图E进行叠 加, 得到大小为128 ×64×32的特征图, 经过上采样后得到大小为128 ×128×64的特征图, 将其定义为特征图F, 特征图F作为输入向特征融合模块提供了上下文信息, 而 特征图A作为 输入向特征融合模块提供了空间信息; 经特征融合模块作用后输出大小256 ×128×64的特 征图, 经过4×上采样输出最终结果Pd∈RH×W, 将最终输出Pd∈RH×W与真值gb∈RH×W计算Loss;权 利 要 求 书 1/2 页 2 CN 115393683 A 2总的Loss函数为detail  loss函数, detail  loss函数由二元交叉熵损失函数和dice   loss函数构成; dice loss函数表达式为: 其中i表示第i个 像素, ∈是拉普拉斯平 滑项; ∈的存在是为了防止分母为0; 二元交叉熵损失函数表达式为: 其中Pd表示最终输出, gd表示真值, b表示第b个样本, N表示有N个样本; 训练设置: 训练迭代次数设为320000, 每次训练一个样本即Batch  Size=12, 使用动量为0.9、 权 重衰减为4.0e‑5的小批量随机梯度下降优化 算法。权 利 要 求 书 2/2 页 3 CN 115393683 A 3

PDF文档 专利 一种面向轨道交通的高效语义分割方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种面向轨道交通的高效语义分割方法 第 1 页 专利 一种面向轨道交通的高效语义分割方法 第 2 页 专利 一种面向轨道交通的高效语义分割方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:28:47上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。