专利 基于声音定位的目标跟踪方法、电子设备及可读存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211092986.0 (22)申请日 2022.09.08 (71)申请人深圳市维海德技术股份有限公司地址 518100 广东省深圳市宝安区新安街道鸿辉工业园2号2- 3层 (72)发明人陈涛　裴炜冬　郑永勤　廖家仙　 (74)专利代理机构深圳市世纪恒程知识产权代理事务所 4 4287 专利代理师丁志新 (51)Int.Cl. H04N 5/232(2006.01) G10L 21/0216(2013.01) G10L 25/51(2013.01) G06V 10/74(2022.01) G06V 40/10(2022.01)G06V 40/16(2022.01) G06V 40/40(2022.01) (54)发明名称基于声音定位的目标跟踪方法、电子设备及可读存储介质 (57)摘要本申请公开了一种基于声音定位的目标跟踪方法、电子设备及可读存储介质，涉及目标跟踪技术领域，所述基于声音定位的目标跟踪方法包括：获取目标教室区域的讲台区域图像，识别所述讲台区域图像中的至少一个活体对象；采集各所述活体对象的音频信号，依据各所述音频信号的声学参数，定位目标跟踪对象所处的目标声源位置；依据所述目标声源位置，对所述目标跟踪对象进行目标特写跟踪。本申请解决了现有技术中目标跟踪的准确性较低的技术问题。权利要求书2页说明书14页附图3页 CN 115174818 A 2022.10.11 CN 115174818 A 1.一种基于声音定位的目标跟踪方法，其特征在于，所述基于声音定位的目标跟踪方法包括：获取目标教室区域的讲台区域图像，识别所述讲台区域图像中的至少一个活体对象；采集各所述活体对象的音频信号，依据各所述音频信号的声学参数，定位目标跟踪对象所处的目标声源位置；依据所述目标声源位置，对所述目标跟踪对象进行目标特写跟踪。 2.如权利要求1所述基于声音定位的目标跟踪方法，其特征在于，所述获取目标教室区域的讲台区域图像，识别所述讲台区域图像中的至少一个活体对象的步骤包括：获取所述讲台区域的可见光图像，通过目标检测得到所述可见光图像下的各人脸检测框、各人头检测框和各人身检测框；将各所述人脸检测框、各所述人头检测框和各所述人身检测框进行多框合并，得到各可见光检测框；获取所述讲台区域的红外图像，通过目标检测得到所述红外图像下的各行人检测框；对各所述可见光检测框和各所述行人检测框进行目标匹配，得到各所述活体对象。 3.如权利要求2所述基于声音定位的目标跟踪方法，其特征在于，所述对各所述可见光检测框和各所述行人检测框进行目标匹配，得到各所述活体对象的步骤包括：对各所述可见光检测框和各所述行人检测框进行相似度匹配，得到第一匹配代价矩阵；获取所述第一匹配代价矩阵中的第一最优匹配代价值，将所述第一最优匹配代价值作为第一匹配结果；依据所述第一匹配结果，确定对应的各目标可见光检测框和各目标行人检测框，将所述目标可见光检测框与目标行人检测框内共同的目标行人作为所述活体对象。 4.如权利要求2所述基于声音定位的目标跟踪方法，其特征在于，所述将各所述人脸检测框、各所述人头检测框和各所述人身检测框进行多框合并，得到各可见光检测框的步骤包括：将各所述人脸检测框与各所述人头检测框进行匹配，得到第二匹配结果；将各所述人头检测框与各所述人身检测框进行匹配，得到第三匹配结果；依据所述第二匹配结果和所述第三匹配结果，进行多框合并，得到所述可见光检测框。 5.如权利要求4所述基于声音定位的目标跟踪方法，其特征在于，所述将各所述人脸检测框与各所述人头检测框进行匹配，得到第二匹配结果的步骤包括：对各所述人脸检测框与各所述人头检测框进行重叠度匹配，得到第二匹配代价矩阵；获取所述第二匹配代价矩阵中的第二最优匹配代价值，将所述第二最优匹配代价值作为所述第二匹配结果。 6.如权利要求4所述基于声音定位的目标跟踪方法，其特征在于，所述将各所述人头检测框与各所述人身检测框进行匹配，得到第三匹配结果的步骤包括：对各所述人头检测框与各所述人身检测框进行重叠度匹配和相似度匹配，得到第三匹配代价矩阵；获取所述第三匹配代价矩阵中的第三最优匹配代价值，将所述第三最优匹配代价值作权　利　要　求　书 1/2 页 2 CN 115174818 A 2为所述第三匹配结果。 7.如权利要求1所述基于声音定位的目标跟踪方法，其特征在于，所述采集各所述活体对象的音频信号，依据各所述音频信号的声学参数，定位目标跟踪对象所处的目标声源位置的步骤包括：通过麦克风阵列模块采集各所述音频信号；对各所述音频信号进行增强处理，得到与各所述音频信号对应的拾音波束；依据各所述拾音波束的声学参数，定位所述目标声源位置。 8.如权利要求7所述基于声音定位的目标跟踪方法，其特征在于，所述依据各所述拾音波束的声学参数，定位所述目标声源位置的步骤包括：获取各所述拾音波束的接收时间，依据各所述接收时间，确定各所述拾音波束的接收先后顺序；依据所述接收先后顺序，确定水平目标声源方位；依据所述水平目标声源方位，定位所述目标声源位置。 9.一种电子设备，其特征在于，所述电子设备包括：至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求 1至8中任一项所述的基于声音定位的目标跟踪方法的步骤。 10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有实现基于声音定位的目标跟踪方法的程序，所述实现基于声音定位的目标跟踪方法的程序被处理器执行以实现如权利要求1至8中任一项所述基于声音定位的目标跟踪方法的步骤。权　利　要　求　书 2/2 页 3 CN 115174818 A 3

专利 基于声音定位的目标跟踪方法、电子设备及可读存储介质

专利基于声音定位的目标跟踪方法、电子设备及可读存储介质