说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210940698.X (22)申请日 2022.08.06 (71)申请人 武汉纺织大 学 地址 430073 湖北省武汉市洪山区纺织路 一号 (72)发明人 陈佳 李熙洋 胡新荣 熊明福  (74)专利代理 机构 武汉泰山北斗专利代理事务 所(特殊普通 合伙) 42250 专利代理师 程千慧 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 10/764(2022.01) G06V 10/74(2022.01)G06V 10/44(2022.01) G06N 3/04(2006.01) (54)发明名称 一种利用基于Graphormer的上下文推理网 络进行图片预测分类的方法 (57)摘要 本发明涉及一种利用基于Graphormer 的上 下文推理网络进行图片预测分类的方法, 本发明 提出了一种基于Graphormer的上下文推理模型, 设计了一种度的中心性关系编码, 该方法能够有 针对性在区域间传播上下文信息, 从而提高小目 标检测的效率, 利用Transformer对图结构中节 点之间的语义和空间布局关系, 以及节点本身的 度中心性进行建模和推断, 在提取小目标语义特 征的同时尽可能保留其空间信息, 有效解决了小 目标的误检与漏检问题。 权利要求书2页 说明书7页 附图5页 CN 115457345 A 2022.12.09 CN 115457345 A 1.一种利用基于Graphormer的上下文推理网络进行图片预测分类的方法, 其特征在 于, 包括以下步骤: 步骤1、 对输入图片进行 特征提取, 将提取的特 征输入到RPN网络生成区域建议; 步骤2、 上下文关系建模模块利用生成的区域建议构造图结构模型, 图结构模型中的每 条边包含中心性编码、 语义编码以及空间布局编码信息, 其中, 根据目标结点的度的多少构 建中心性编码, 基于初始区域特征的稀疏语义关系构建语义编 码以及基于位置和形状信息 的稀疏空间布局关系构建空间布局编码; 步骤3、 上下文关系推理模块通过Transformer聚合节点之间的三种编码信息, 并进一 步与初始特征融合来更新节点信息, 然后使用Softmax函数得到所有节点的输出概率分布, 得到每个节点的属于各类别的概率, 将概率最大 的类别作为节点的标签, 最后输出所有节 点的标签作为输入图片的分类结果。 2.根据权利 要求1所述的利用基于Graphormer的上下文推理网络进行图片预测分类的 方法, 其特征在于, 所述步骤2中, 中心性编码是根据每个节点的度为每个节点分配的可学 习嵌入向量。 3.根据权利 要求1所述的利用基于Graphormer的上下文推理网络进行图片预测分类的 方法, 其特征在于, 所述步骤2中, 通过计算每条边的语义相似度, 将 语义相似度输入多层感 知 器 即 可 得 到 每 条 边 的 语 义 编 码 ;边 ei j的 语 义 相 似 度 计 算 公 式 为 : 其中δ(i, j)是指示器函数, 如果边eij两端的 节点i和节点j个彼此高度重叠则等于0, 否则等于1, PO∈Rn×d是给定的初始区域特征库, d是 初始区域特征的维度, f( ·,·)是定义的一个可学习的语义相关度函数, 用来计算原始全 连通图中每个成对初 始节点特征 的语义相关度, Φ( ·)是将初始区域特征 投影到潜在表示的投影函数。 4.根据权利 要求1所述的利用基于Graphormer的上下文推理网络进行图片预测分类的 方法, 其特征在于, 所述步骤2中, 通过计算每条边的空间布局相似度, 将空间布局相似度输 入多层感知器即可 得到每条边的空间布局编码; 边eij的空间布局相似度s ″ij计算公式为: 其中 分别是边eij两端的节点i 和节点j的区域 坐标, 和 分别是节点 i和节点j的空间相似度和空间距离 权重: 其中λ为尺度参数, 是节点i和节点j中心之间的空间距离 。 5.根据权利 要求1所述的利用基于Graphormer的上下文推理网络进行图片预测分类的 方法, 其特 征在于, 所述 步骤2具体包括以下步骤: 步骤2.1、 对节点进行更新, 对第l层第i个节点即节点i更新的步骤为: 令节点i的初始权 利 要 求 书 1/2 页 2 CN 115457345 A 2节点特征Vi表示为xi, 并与中心节点特征 矩阵相加得到 表示节 点i的隐藏特征h, 其 中d是隐藏维度, 把节点特征 和图结构中其他节点特征 作为自 注意力模块的 输入 , 然后分 别与三个权值矩阵 和 相乘得到向量 Q、 K和V; 将向量Q和向量K进行点积计算, 得到节点i的相关性权重A, 然后对节点i的相关性权重 A进行归一化, 将语义编码s ′ij和空间编码s ″ij作为权重A的偏置项进行矩阵相加计算, 通过 softmax函数将节 点i的权重A转换成[0,1]之间的概率分布, 再使每个节 点的概率分布与向 量V进行点积计算, 最后, 把 点积计算的结果进行累加得到节点 i更新后的节点特 征 步骤2.2、 对所有节点进行更新后, 当前Graphormer层输出的所有节点更新后的特征序 列H(l+1); 步骤2.3、 将特征序列H(l+1)输入到Decoder中进行自注意力权重的计算, 得到更新后节 点特征序列H(l); 步骤2.4、 将更新后节点特征序列H(l)输入到全连接层FC经过一次线性变换, 其中每个 节点都会接入一个全连接层, 使用Softmax函数得到所有节 点的输出的概率分布, 得到每个 节点的属于各类别的概率, 将概率最大 的类别作为节点的标签, 得到输入图片 中所有节点 的预测输出 结果。 6.根据权利 要求1所述的利用基于Graphormer的上下文推理网络进行图片预测分类的 方法, 其特征在于, 在测试阶段, 所述上下文关系建模模块和上下文关系推理模块为经过了 训练阶段的最 终模块, 在训练阶段, 步骤1 中输入的图片为训练集中的图片, 步骤3中还包括 以下步骤: 进行损失函数计算, 通过最小化损失函数对上下文关系建模模块和上下文关系 推理模块的参数进行调整, 训练完毕后得到最终模块。权 利 要 求 书 2/2 页 3 CN 115457345 A 3

PDF文档 专利 一种利用基于Graphormer的上下文推理网络进行图片预测分类的方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种利用基于Graphormer的上下文推理网络进行图片预测分类的方法 第 1 页 专利 一种利用基于Graphormer的上下文推理网络进行图片预测分类的方法 第 2 页 专利 一种利用基于Graphormer的上下文推理网络进行图片预测分类的方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:28:50上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。