专利 图像识别方法和装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211083800.5 (22)申请日 2022.09.06 (71)申请人通号通信信息集团有限公司地址 100070 北京市丰台区汽车博物馆南路1号院中国通号大厦A座6 01室 (72)发明人罗静　郭宇鹏　毛少将　王晓　雷庆庆　李沛然　 (74)专利代理机构北京天昊联合知识产权代理有限公司 1 1112 专利代理师彭瑞欣　姜春咸 (51)Int.Cl. G06V 40/10(2022.01) G06V 10/82(2022.01) G06V 10/74(2022.01) G06V 10/80(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称图像识别方法和装置 (57)摘要本申请公开一种图像识别方法和装置，涉及图像识别技术领域。方法包括：获取待检测行人图像及其对应的多个局部区域图像；依据整体图像识别模型对待检测行人图像进行识别，获得整体识别结果；分别将多个局部区域图像输入至与局部区域图像对应的局部区域识别模型中进行识别，确定多个局部识别结果；依据整体识别结果和多个局部识别结果，确定待检测行人图像中的行人属性特征；其中，整体图像识别模型和局部区域识别模型均是基于训练样本图像对卷积神经网络进行训练获得的模型，卷积神经网络是基于通道注意力机制和自定义网络训练参数确定的网络。能够降低系统的实现复杂度，降低对行人的识别成本，并提高对待检测行人的识别准确性。权利要求书2页说明书11页附图4页 CN 115331262 A 2022.11.11 CN 115331262 A 1.一种图像识别方法，其特征在于，所述方法包括：获取待检测行人图像及其对应的多个局部区域图像；依据整体图像识别模型对所述待检测行人图像进行识别，获得整体识别结果；分别将多个所述局部区域图像输入至与所述局部区域图像对应的局部区域识别模型中进行识别，确定多个局部识别结果；依据所述整体识别结果和多个所述局部识别结果，确定所述待检测行人图像中的行人属性特征；其中，所述整体图像识别模型和所述局部区域识别模型均是基于训练样本图像对卷积神经网络进行训练获得的模型，所述卷积神经网络是基于通道注意力机制和自定义网络训练参数确定的网络。 2.根据权利要求1所述的方法，其特征在于，所述局部区域识别模型包括：头部识别模型、躯干区域识别模型和四肢区域识别模型中的至少一种；多个所述局部区域图像包括：头部区域图像，躯干区域图像和四肢区域图像中的至少一种。 3.根据权利要求2所述的方法，其特征在于，所述分别将多个所述局部区域图像输入至与所述局部区域图像对应的局部区域识别模型中进行识别，确定多个局部识别结果，包括：在确定所述局部区域识别模型包括所述头部识别模型的情况下，将所述头部区域图像输入至所述头部识别模型中进行识别，获得头部识别结果；在确定所述局部区域识别模型包括所述躯干区域识别模型的情况下，将所述躯干区域图像输入至所述躯干区域识别模型中进行识别，获得躯干识别结果；在确定所述局部区域识别模型包括所述四肢区域识别模型的情况下，将所述四肢区域图像输入至所述四肢区域识别模型中进行识别，获得四肢识别结果。 4.根据权利要求1所述的方法，其特征在于，所述依据整体图像识别模型对所述待检测行人图像进行识别，获得整体识别结果之前，还包括：获取多个训练样本图像，所述训练样本图像包括：整体样本图像和多个局部样本图像；依据多个所述整体样本图像对所述卷积神经网络进行训练，获得所述整体图像识别模型；依据预设局部特征，从多个所述局部样本图像中筛选获得与所述预设局部特征相对应的待处理局部样本图像；依据所述待处理局部样本图像对所述卷积神经网络进行训练，获得与所述局部区域图像对应的局部区域识别模型。 5.根据权利要求4所述的方法，其特征在于，所述依据所述待处理局部样本图像对所述卷积神经网络进行训练，获得与所述局部区域图像对应的局部区域识别模型，包括：对所述待处理局部样本图像进行批量标准化处理，获得所述待处理局部样本图像对应的图像特征；依据所述通道注意力机制，对所述待处理局部样本图像对应的图像特征进行相似度处理，获得与所述待处理局部样本图像对应的图像特征匹配的注意力特征；将所述待处理局部样本图像对应的图像特征及其匹配的注意力特征进行加权融合，确定融合后的图像特征；对所述融合的图像特征进行激活处理和最大值池化处理，获得所述与所述局部区域图权　利　要　求　书 1/2 页 2 CN 115331262 A 2像对应的局部区域识别模型。 6.根据权利要求4或5所述的方法，其特征在于，所述依据多个所述整体样本图像对所述卷积神经网络进行训练，获得所述整体图像识别模型之前，还包括：依据所述预设局部特征，分别对多个所述局部样本图像进行标注，生成标注信息，其中，所述标注信息与所述局部样本图像中的局部特征相匹配；所述依据预设局部特征，从多个所述局部样本图像中筛选获得与所述预设局部特征相对应的待处理局部样本图像，包括：依据所述标注信息，对多个所述局部样本图像进行筛选，获得至少一个与所述标注信息对应的待处理局部样本图像；其中，所述预设局部特征包括：头部区域特征、躯干区域特征和四肢区域特征中的至少一种。 7.根据权利要求1所述的方法，其特征在于，所述获取待检测行人图像及其对应的多个局部区域图像，包括：获取所述待检测行人图像；依据预设区域的数量，对所述待检测行人图像进行多个所述预设区域的裁剪，获得多个待处理图像；依据预设尺寸，分别对多个所述待处理图像进行缩放处理，获得多个所述局部区域图像。 8.根据权利要求1所述的方法，其特征在于，所述行人属性特征，包括：行人的体态特征、所述行人的衣着特征和所述行人携带的物品特征中的至少一种。 9.根据权利要求1所述的方法，其特征在于，所述自定义网络训练参数，包括：卷积层的属性参数、激活层的属性参数、池化层的属性参数、全连接层的属性参数、所述卷积层的数量、所述激活层的数量、所述池化层的数量、通道注意力机制对应的处理层数中至少一种；所述卷积层的属性参数包括：所述卷积层对应的卷积核的尺寸、卷积步长和卷积核的数量中的至少一种。 10.一种图像识别装置，其包括：获取模块，被配置为获取待检测行人图像及其对应的多个局部区域图像；整体识别模块，被配置为依据整体图像识别模型对所述待检测行人图像进行识别，获得整体识别结果；局部识别模块，被配置为分别将多个所述局部区域图像输入至与所述局部区域图像对应的局部区域识别模型中进行识别，确定多个局部识别结果；属性特征确定模块，被配置为依据所述整体识别结果和多个所述局部识别结果，确定所述待检测行人图像中的行人属性特征；其中，所述整体图像识别模型和所述局部区域识别模型均是基于训练样本图像对卷积神经网络进行训练获得的模型。权　利　要　求　书 2/2 页 3 CN 115331262 A 3

专利 图像识别方法和装置

专利图像识别方法和装置