专利 基于姿态与样式归一化的换衣行人重识别方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 20221075158 8.9 (22)申请日 2022.06.29 (71)申请人江苏大学地址 212013 江苏省镇江市京口区学府路 301号江苏大学申请人镇江昭远智能科技有限公司　南京昭视智能科技有限公司 (72)发明人成科扬　梁赛　司宇　张海烽　严浏阳　沈维杰　 (51)Int.Cl. G06V 40/10(2022.01) G06V 20/52(2022.01) G06V 10/44(2022.01) G06V 10/74(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称基于姿态与样式归一化的换衣行人重识别方法 (57)摘要本发明公开了一种基于姿态与样式归一化的换衣行人重识别方法。该方法首先引入姿态服装互换模型，利用生成对抗网络将身穿不同服装的同一ID的两张图像进行服装与姿态的互换。然后，通过样式归一化模块对图像进行样式擦除并利用内容注意力模块对丢失内容中的干扰特征和有用特征进行提取，从而保证特征的鲁棒性。最后，采用双通道特征融合模型进行行人匹配，将行人的局部语义特征与全局特征进行融合，通过欧氏距离度量，输出行人的身份信息。本发明公开的换衣行人重识别方法能够解决换衣场景下无法进行换衣行人识别的问题。权利要求书2页说明书6页附图3页 CN 115100684 A 2022.09.23 CN 115100684 A 1.一种基于姿态与样式归一化的换衣行人重识别方法，其特征在于，包括以下步骤：步骤1.1：使用姿态编码器与服装外观编码器对目标图库与检索图库中的行人进行姿态特征与服装外观特征的提取，并利用解码器进行交叉重建与自我重建。步骤1.2：将生成的行人图像通过归一化模块进行样式擦除，利用内容注意力机制恢复因擦除丢失的内容鉴别性特征；步骤1.3：擦除后的行人特征通过双通道结构将利用姿态估计获取的行人局部特征和利用主干网络提取的全局特征进行特征融合；步骤1.4：通过欧氏距离度量，输出行人的身份信息。 2.根据权利要求1所述的一种姿态与样式归一化的换衣行人重识别方法，其特征在于，所述步骤1.1中行人姿态服装互换的方法如下：步骤2.1：利用姿态编码器与外观编码器分别对行人的姿态与服装外观进行特征提取, 其中姿态编码器是浅层网络，先经过四个卷积层进行特征提取，然后接着四个跳跃连接块，其中每个卷积层的输入输出通道都为256，卷积核的大小为3x3，步幅和填充都为1，随后进行组归一化并采用线性整流函数作为激活函数。在进行姿态编码时先对原始输入图像1 × 256×128进行灰度化操作即通道数设为1，并经过两个下采样层，防止外观信息进行干扰，姿态编码器输出的姿态特征尺寸为128 ×64×32；服装外观编码器则是利用在ImageNet上预训练好的ResNet50进行改进，其中删除了全局平均池化层和完全连接层，取而代之的是最大池化层，输出的服装外观代码尺寸为2048×4×1。步骤2.2：将解耦出的行人姿态特征与服装外观特征交叉组合，利用解码器生成同一姿态不同服装以及同一服装不同姿态的行人图像；步骤2.3：通过判别器来判断生成的图像是否逼真，并采用对抗性损失来匹配生成图像的分布与实际数据分布，其中对抗约束如下：其中xi∈Dquery， Dquery＝{xi|i＝1,2,...,n}， Dquery是指query里的目标行人数据集，其中 n是数据集中的样本数量。 D是判别器， G是生成器， fip, 分别代表xi的姿态特征和xj的服装外观特征，其中xj∈Dgallery， Dgallery是指gallery里的行人数据集, fia分别代表xj的姿态特征和xi的服装外观特征。 3.根据权利要求2所述的行人姿态服装互换方法，其特征在于，步骤2.2中姿态服装特征交叉生成的方法为：步骤3.1：利用姿态编码器和服装外观编码器提取姿态特征和服装外观特征，在提取姿态特征时将原始图像转化为灰度图，使得网络在提取姿态特征时更倾向于空间结构特征，从而确保提取的姿态特征不包含其他噪声。步骤3.2：将提取到的姿态特征与服装外观特征交叉融合后进行图像生成，并对生成的图像进行二次编码，利用重建损失对解耦出的特征进行约束，重建损失如下：权　利　要　求　书 1/2 页 2 CN 115100684 A 2其中Ep是指姿态编码器， Ea是服装外观编码器，是对原始图像xi中的姿态特征fip与生成图像所解耦出的姿态特征进行距离计算，其中fip＝Ep(xi)，同理，是对原始图像xj中的服装外观特征与生成图像所解耦出的服装外观特征进行距离计算。 4.根据权利要求1所述的一种基于姿态与样式归一化的换衣行人重识别方法，其特征在于，所述步骤1.2中通过归一化模块进行样式擦除的方法：步骤4.1：将生成的一组姿态服装互换行图像通过实例归一化操作进行样式擦除；步骤4.2：将输入特征与实例归一化后的特征做差，得到实例归一化过程中擦除掉的剩余特征；步骤4.3：采用通道注意力机制从剩余特征中提取内容相关特征；步骤4.4：将内容相关特征与实例归一化后的的特征进行特征融合，获取不具有样式风格的行人特征。 5.根据权利要求4所述的通道注意力机制，其特征在于，步骤4.3中的基于通道注意力机制的内容特征提取方法为：步骤5.1：将每个通道的d＝h ×w维特征向量作为一个特征节点，从而形成一个具有c个节点的图Gc，每个特征节点与其它节点的关系通过嵌入函数映射到亲和矩阵步骤5.2：将每一行节点的关系向量表示为每一列节点的关系向量表示为将其在空间上进行展平，然后使用1X1卷积层进行批量归一化，通过ReLU激活来执行映射变换，从而实现节点关系的嵌入，并获得通道注意力α，其表示为： α ＝g(Di)＝σ(W2δ(W1 pool(Di))) 其中δ(·)， σ(·)分别表示ReLU激活函数和sigmoid激活函数， Di是指剩余特征， Di＝Fi‑Fi＝Fi‑IN(Fi)， IN是实例归一化操作， Fi是输入的原始特征， Fi是进行实例归一化后的特征。步骤5.3：将剩余特征与通道注意力结合从而获得内容相关特征Di+，将内容相关特征与实例归一化特征连接，从而获取不具有样式风格的鲁棒行人特征。权　利　要　求　书 2/2 页 3 CN 115100684 A 3

专利 基于姿态与样式归一化的换衣行人重识别方法

专利基于姿态与样式归一化的换衣行人重识别方法