说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211092986.0 (22)申请日 2022.09.08 (71)申请人 深圳市维海 德技术股份有限公司 地址 518100 广东省深圳市宝安区新 安街 道鸿辉工业园2号2- 3层 (72)发明人 陈涛 裴炜冬 郑永勤 廖家仙  (74)专利代理 机构 深圳市世纪恒程知识产权代 理事务所 4 4287 专利代理师 丁志新 (51)Int.Cl. H04N 5/232(2006.01) G10L 21/0216(2013.01) G10L 25/51(2013.01) G06V 10/74(2022.01) G06V 40/10(2022.01)G06V 40/16(2022.01) G06V 40/40(2022.01) (54)发明名称 基于声音定位的目标跟踪 方法、 电子 设备及 可读存储介质 (57)摘要 本申请公开了一种基于声音定位的目标跟 踪方法、 电子设备及可读存储介质, 涉及目标跟 踪技术领域, 所述基于声音定位的目标跟踪 方法 包括: 获取目标教室区域的讲台区域图像, 识别 所述讲台区域图像中的至少一个活体对象; 采集 各所述活体对象的音 频信号, 依据各所述音 频信 号的声学参数, 定位目标跟踪对象所处的目标声 源位置; 依据所述目标声源位置, 对所述目标跟 踪对象进行目标特写跟踪。 本申请解决了现有技 术中目标跟踪的准确性较低的技 术问题。 权利要求书2页 说明书14页 附图3页 CN 115174818 A 2022.10.11 CN 115174818 A 1.一种基于声音定位的目标跟踪方法, 其特征在于, 所述基于声音定位的目标跟踪方 法包括: 获取目标教室区域的讲台区域图像, 识别所述讲台区域图像中的至少一个活体对象; 采集各所述活体对象的音频信号, 依据各所述音频信号的声学参数, 定位目标跟踪对 象所处的目标声源位置; 依据所述目标声源位置, 对所述目标跟踪对象进行目标 特写跟踪。 2.如权利要求1所述基于声音定位的目标跟踪方法, 其特征在于, 所述获取目标教室区 域的讲台区域图像, 识别所述讲台区域图像中的至少一个活体对象的步骤 包括: 获取所述讲台区域的可见光图像, 通过目标检测得到所述可见光图像下的各人脸检测 框、 各人头检测框和各 人身检测框; 将各所述人脸检测框、 各所述人头检测框和各所述人身检测框进行多框合并, 得到各 可见光检测框; 获取所述讲台区域的红外图像, 通过目标检测得到所述红外图像下的各 行人检测框; 对各所述可见光检测框和各 所述行人检测框进行目标匹配, 得到各 所述活体对象。 3.如权利要求2所述基于声音定位的目标跟踪方法, 其特征在于, 所述对各所述可见光 检测框和各 所述行人检测框进行目标匹配, 得到各 所述活体对象的步骤 包括: 对各所述可见光检测框和各所述行人检测框进行相似度匹配, 得到第一匹配代价矩 阵; 获取所述第 一匹配代价矩阵中的第 一最优匹配代价值, 将所述第 一最优匹配代价值作 为第一匹配结果; 依据所述第一匹配结果, 确定对应的各目标可见光检测框和各目标行人检测框, 将所 述目标可见光检测框与目标 行人检测框内共同的目标 行人作为所述活体对象。 4.如权利要求2所述基于声音定位的目标跟踪方法, 其特征在于, 所述将各所述人脸检 测框、 各所述人头检测框和各所述人身检测框进行多框合并, 得到各可见光检测框的步骤 包括: 将各所述人脸检测框与各 所述人头检测框进行匹配, 得到第二匹配结果; 将各所述人头检测框与各 所述人身检测框进行匹配, 得到第三匹配结果; 依据所述第二匹配结果和所述第三匹配结果, 进行多框合并, 得到所述 可见光检测框 。 5.如权利要求4所述基于声音定位的目标跟踪方法, 其特征在于, 所述将各所述人脸检 测框与各 所述人头检测框进行匹配, 得到第二匹配结果的步骤 包括: 对各所述人脸检测框与各 所述人头检测框进行重 叠度匹配, 得到第二匹配代价矩阵; 获取所述第 二匹配代价矩阵中的第 二最优匹配代价值, 将所述第 二最优匹配代价值作 为所述第二匹配结果。 6.如权利要求4所述基于声音定位的目标跟踪方法, 其特征在于, 所述将各所述人头检 测框与各 所述人身检测框进行匹配, 得到第三匹配结果的步骤 包括: 对各所述人头检测框与各所述人身检测框进行重叠度匹配和相似度匹配, 得到第 三匹 配代价矩阵; 获取所述第 三匹配代价矩阵中的第 三最优匹配代价值, 将所述第 三最优匹配代价值作权 利 要 求 书 1/2 页 2 CN 115174818 A 2为所述第三匹配结果。 7.如权利要求1所述基于声音定位的目标跟踪方法, 其特征在于, 所述采集各所述活体 对象的音频信号, 依据各所述音频信号的声学参数, 定位 目标跟踪对 象所处的目标声源位 置的步骤 包括: 通过麦克风阵列模块采集各 所述音频信号; 对各所述音频信号进行增强处 理, 得到与各 所述音频信号对应的拾音 波束; 依据各所述拾音波束的声学参数, 定位所述目标声源位置 。 8.如权利要求7所述基于声音定位的目标跟踪方法, 其特征在于, 所述依据各所述拾音 波束的声学参数, 定位所述目标声源位置的步骤 包括: 获取各所述拾音波束的接收时间, 依据各所述接收时间, 确定各所述拾音波束的接收 先后顺序; 依据所述接收先后顺序, 确定水平目标声源方位; 依据所述水平目标声源方位, 定位所述目标声源位置 。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 至少一个处 理器; 以及, 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处 理器执行, 以使所述至少一个处理器能够执行权利要求 1至8中任一项 所述的基于声音定位 的目标跟踪方法的步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有实现基 于声音定位的目标跟踪方法的程序, 所述实现基于声音定位的目标跟踪方法的程序被处理 器执行以实现如权利要求1至8中任一项所述基于声 音定位的目标跟踪方法的步骤。权 利 要 求 书 2/2 页 3 CN 115174818 A 3

PDF文档 专利 基于声音定位的目标跟踪方法、电子设备及可读存储介质

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于声音定位的目标跟踪方法、电子设备及可读存储介质 第 1 页 专利 基于声音定位的目标跟踪方法、电子设备及可读存储介质 第 2 页 专利 基于声音定位的目标跟踪方法、电子设备及可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:30:46上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。