说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211083800.5 (22)申请日 2022.09.06 (71)申请人 通号通信信息集团有限公司 地址 100070 北京市丰台区汽车博物馆南 路1号院中国通 号大厦A座6 01室 (72)发明人 罗静 郭宇鹏 毛少将 王晓  雷庆庆 李沛然  (74)专利代理 机构 北京天昊联合知识产权代理 有限公司 1 1112 专利代理师 彭瑞欣 姜春咸 (51)Int.Cl. G06V 40/10(2022.01) G06V 10/82(2022.01) G06V 10/74(2022.01) G06V 10/80(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 图像识别方法和装置 (57)摘要 本申请公开一种图像识别方法和装置, 涉及 图像识别技术领域。 方法包括: 获取待检测行人 图像及其对应的多个局部区域图像; 依据整体图 像识别模型对待检测行人图像进行识别, 获得整 体识别结果; 分别将多个局部区域图像输入至与 局部区域图像对应的局部区域识别模型中进行 识别, 确定多个局部识别结果; 依据整体识别结 果和多个局部识别结果, 确定待检测行人图像中 的行人属性特征; 其中, 整体图像识别模型和局 部区域识别模型均是基于训练样本图像对卷积 神经网络进行训练获得的模型, 卷积神经网络是 基于通道注意力机制和自定义网络训练参数确 定的网络。 能够降低系统的实现复杂度, 降低对 行人的识别成本, 并提高对待检测行人的识别准 确性。 权利要求书2页 说明书11页 附图4页 CN 115331262 A 2022.11.11 CN 115331262 A 1.一种图像识别方法, 其特 征在于, 所述方法包括: 获取待检测行 人图像及其对应的多个局部区域图像; 依据整体图像识别模型对所述待检测行 人图像进行识别, 获得整体识别结果; 分别将多个所述局部区域图像输入至与所述局部区域图像对应的局部区域识别模型 中进行识别, 确定多个局部识别结果; 依据所述整体识别结果和多个所述局部识别结果, 确定所述待检测行人图像中的行人 属性特征; 其中, 所述整体图像识别模型和所述局部区域识别模型均是基于训练样本图像 对卷积神经网络进行训练获得的模型, 所述卷积神经网络是基于通道注意力机制和自定义 网络训练参数确定的网络 。 2.根据权利要求1所述的方法, 其特征在于, 所述局部区域识别模型包括: 头部识别模 型、 躯干区域识别模型和四肢区域识别模型中的至少一种; 多个所述局部区域图像包括: 头部区域图像, 躯干区域图像和四肢区域图像中的至少 一种。 3.根据权利要求2所述的方法, 其特征在于, 所述分别将多个所述局部区域图像输入至 与所述局部区域图像对应的局部区域识别模型中进行识别, 确定多个局部识别结果, 包括: 在确定所述局部区域识别模型包括所述头部识别模型的情况下, 将所述头部区域图像 输入至所述头 部识别模型中进行识别, 获得头 部识别结果; 在确定所述局部区域识别模型包括所述躯干区域识别模型的情况下, 将所述躯干区域 图像输入至所述躯 干区域识别模型中进行识别, 获得躯 干识别结果; 在确定所述局部区域识别模型包括所述 四肢区域识别模型的情况下, 将所述 四肢区域 图像输入至所述四肢区域识别模型中进行识别, 获得四肢识别结果。 4.根据权利要求1所述的方法, 其特征在于, 所述依据整体图像识别模型对所述待检测 行人图像进行识别, 获得整体识别结果之前, 还 包括: 获取多个训练样本图像, 所述训练样本图像包括: 整体样本图像和多个局部样本图像; 依据多个所述整体样本图像对所述卷积神经网络进行训练, 获得所述整体图像识别模 型; 依据预设局部特征, 从多个所述局部样本图像中筛选获得与 所述预设局部特征相对应 的待处理局部样本图像; 依据所述待处理局部样本图像对所述卷积神经网络进行训练, 获得与 所述局部区域图 像对应的局部区域识别模型。 5.根据权利要求4所述的方法, 其特征在于, 所述依据所述待处理局部样本图像对所述 卷积神经网络进行训练, 获得与所述局部区域图像对应的局部区域识别模型, 包括: 对所述待处理局部样本图像进行批量标准化处理, 获得所述待处理局部样本图像对应 的图像特 征; 依据所述通道注意力 机制, 对所述待处理局部样本图像对应的图像特征进行相似度处 理, 获得与所述待处 理局部样本图像对应的图像特 征匹配的注意力特 征; 将所述待处理局部样本图像对应的图像特征及其匹配的注意力特征进行加权融合, 确 定融合后的图像特 征; 对所述融合的图像特征进行激活处理和最大值池化处理, 获得所述与 所述局部区域图权 利 要 求 书 1/2 页 2 CN 115331262 A 2像对应的局部区域识别模型。 6.根据权利要求4或5所述的方法, 其特征在于, 所述依据多个所述整体样本 图像对所 述卷积神经网络进行训练, 获得 所述整体图像识别模型之前, 还 包括: 依据所述预设局部特征, 分别对多个所述局部样本图像进行标注, 生成标注信息, 其 中, 所述标注信息与所述局部样本图像中的局部特 征相匹配; 所述依据 预设局部特征, 从多个所述局部样本图像中筛选获得与所述预设局部特征相 对应的待处 理局部样本图像, 包括: 依据所述标注信息, 对多个所述局部样本 图像进行筛选, 获得至少一个与所述标注信 息对应的待处 理局部样本图像; 其中, 所述预设局部特征包括: 头部区域特征、 躯干区域特征和四肢区域特征中的至少 一种。 7.根据权利要求1所述的方法, 其特征在于, 所述获取待检测行人图像及其对应的多个 局部区域图像, 包括: 获取所述待检测行 人图像; 依据预设区域的数量, 对所述待检测行人图像进行多个所述预设区域的裁剪, 获得多 个待处理图像; 依据预设尺寸, 分别对多个所述待处理图像进行缩放处理, 获得多个所述局部区域图 像。 8.根据权利要求1所述的方法, 其特征在于, 所述行人属性特征, 包括: 行人的体态特 征、 所述行 人的衣着特 征和所述行 人携带的物品特 征中的至少一种。 9.根据权利要求1所述的方法, 其特征在于, 所述自定义网络训练参数, 包括: 卷积层的 属性参数、 激活层的属性参数、 池化层的属性参数、 全连接层的属 性参数、 所述卷积层的数 量、 所述激活层的数量、 所述池化层的数量、 通道 注意力机制对应的处 理层数中至少一种; 所述卷积层的属性参数包括: 所述卷积层对应的卷积核的尺寸、 卷积步长和卷积核的 数量中的至少一种。 10.一种图像识别装置, 其包括: 获取模块, 被 配置为获取待检测行 人图像及其对应的多个局部区域图像; 整体识别模块, 被配置为依据整体图像识别模型对所述待检测行人图像进行识别, 获 得整体识别结果; 局部识别模块, 被配置为分别将多个所述局部区域图像输入至与所述局部区域图像对 应的局部区域识别模型中进行识别, 确定多个局部识别结果; 属性特征确定模块, 被配置为依据所述整体识别结果和多个所述局部识别结果, 确定 所述待检测行人图像中的行人属性特征; 其中, 所述整体图像识别模型和所述局部区域识 别模型均是基于训练样本图像对卷积神经网络进行训练获得的模型。权 利 要 求 书 2/2 页 3 CN 115331262 A 3

PDF文档 专利 图像识别方法和装置

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像识别方法和装置 第 1 页 专利 图像识别方法和装置 第 2 页 专利 图像识别方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:28:45上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。