(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210618307.2
(22)申请日 2022.06.01
(71)申请人 北京字节跳动网络技 术有限公司
地址 100041 北京市石景山区实兴大街3 0
号院3号楼 2层B-0035房间
(72)发明人 杨飞 刘亮 洪进栋 王红阳
李想
(74)专利代理 机构 北京中知法苑知识产权代理
有限公司 1 1226
专利代理师 李明
(51)Int.Cl.
G06V 20/40(2022.01)
G06V 10/44(2022.01)
G06V 10/74(2022.01)
G06V 10/762(2022.01)G06V 10/764(2022.01)
(54)发明名称
一种视频识别方法及装置
(57)摘要
本公开提供了一种视频识别方法及装置, 该
方法将满足聚类条件的第一参考视频作为样本,
将其对应的第二特征向量与待识别视频对应的
第一特征向量进行对比, 得到目标相似度, 并根
据目标相似度判断待识别视频是否属于目标类
型的视频, 由于聚类后的第一参考视频集合中的
第一参考视频对应的观看用户对于喜爱的视频
类型更加专一, 使得该第一参考视频更能够与目
标类型的视频一致, 进而提高判断待识别视频是
否为目标类型的视频的精确度。
权利要求书2页 说明书13页 附图4页
CN 114926771 A
2022.08.19
CN 114926771 A
1.一种视频识别方法, 其特 征在于, 包括:
获取待识别视频;
获取所述待识别视频的第 一特征向量; 所述第 一特征向量包含所述待识别视频的观看
用户群体的属性特 征;
获取第一参考视频集合中多个第 一参考视频分别对应的第 二特征向量; 所述第 一参考
视频为目标类型的视频; 所述第一参考视频集合中包括满足聚类条件的至少一个聚类类别
中的多个第一参考视频, 其中所述聚类类别满足聚类条件是指: 所述聚类类别包括的第一
参考视频的数量大于预设数量, 且该聚类类别中的各个第一参考视频的第二特征向量之间
的相似度大于设定阈值;
基于所述第一参考视频集合中每个第一参考视频的所述第二特征向量分别与所述第
一特征向量之间的目标相似度, 确定所述待识别视频 是否属于所述目标类型的视频。
2.根据权利要求1所述的方法, 其特征在于, 根据以下步骤确定所述第一参考视频集
合:
获取所述目标类型的多个第一 参考视频的第二特 征向量;
将所述第二特征向量输入至预先训练好的目标密度聚类模型, 得到聚类成功的第 一参
考视频集合; 所述目标密度聚类模型为根据目标类型的多个第二参考视频以及携带有类型
标签的多个训练视频样本, 从配置有不同模型参数的密度聚类模型中确定的。
3.根据权利要求2所述的方法, 其特征在于, 根据以下步骤训练所述目标密度聚类模
型:
获取目标类型的多个第 二参考视频的第 三特征向量, 以及多个训练视频样本的第四特
征向量;
将所述第三特征向量分别输入至配置有不同模型参数的密度聚类模型, 得到不同模型
参数下聚类成功的第二 参考视频集 合;
针对任一所述第 二参考视频集合, 基于该第 二参考视频集合中各个第 二参考视频对应
的所述第三特征向量与所述训练视频样本对应的第四特征向量之 间的目标相似度, 确定所
述训练视频样本的测试结果; 所述测试结果指示有所述训练视频样本是否属于所述目标类
型的视频;
基于不同模型参数下的各个训练视频样本的测试结果及其对应的类型标签, 确定所述
密度聚类模型对应的目标模型参数, 并将配置所述目标模型参数的密度聚类模型作为训练
好的目标密度聚类模型。
4.根据权利要求1所述的方法, 其特征在于, 所述第 一特征向量为所述待识别 视频在达
到目标展现量时的特 征向量;
通过以下步骤确定所述目标展现量:
获取目标类型的第三 参考视频在达 到多个不同的展现量时的第五特 征向量;
确定所述第 三参考视频在达到所述多个不同的展现量中预设展现量 时, 与在达到所述
多个不同的展现量中除所述预设展现量外的其它展现量时, 分别对应的第五特征向量之间
的目标相似度;
将所述目标相似度的变化趋势指示的平缓临界点对应的第五特征向量作为目标特征
向量;权 利 要 求 书 1/2 页
2
CN 114926771 A
2将所述目标 特征向量对应的展现量作为所述目标展现量。
5.根据权利要求 4所述的方法, 其特 征在于, 确定所述目标相似度, 包括:
确定所述第 三参考视频在达到所述多个不同的展现量中预设展现量 时, 与在达到所述
多个不同的展现量中除所述预设展现量外的其他展现量时, 分别对应的第五特征向量之间
的余弦相似度及欧氏距离相似度;
分别确定所述欧氏距离相似度及所述余弦相似度的变化趋势指示的平缓临界点所对
应的展现量;
将所述欧氏距离相似度及所述余弦相似度中平缓临界点所对应的展现量最低的相似
度作为所述目标相似度。
6.根据权利要求1所述的方法, 其特征在于, 所述基于所述第 一参考视频集合中每个第
一参考视频的所述第二特征向量分别与所述第一特征向量之间的目标相似度, 确定所述待
识别视频 是否属于所述目标类型的视频, 包括:
确定得到的各个所述目标相似度中, 是否存在大于预设阈值的目标相似度;
若存在, 则确定所述待识别视频属于所述目标类型。
7.一种视频识别装置, 其特 征在于, 包括:
第一获取模块, 用于获取待识别视频; 以及, 获取所述待识别视频的第一特征向量; 所
述第一特 征向量包 含所述待识别视频的观看用户群 体的属性特 征;
第二获取模块, 用于获取第 一参考视频集合中多个第 一参考视频分别对应的第 二特征
向量; 所述第一参考视频为 目标类型 的视频; 所述第一参考视频集合中包括满足聚类条件
的至少一个聚类类别中的多个第一参考视频, 其中所述聚类类别满足聚类条件是指: 所述
聚类类别包括的第一参考视频的数量大于预设数量, 且该聚类类别中的各个第一参考视频
的第二特 征向量之间的相似度大于设定阈值;
第一确定模块, 用于基于所述第 一参考视频集合中每个第 一参考视频的所述第 二特征
向量分别与所述第一特征向量之间的目标相似度, 确定所述待识别视频是否属于所述目标
类型的视频。
8.根据权利要求7 所述的装置, 其特 征在于, 所述装置还 包括第二确定模块, 用于:
获取所述目标类型的多个第一 参考视频的第二特 征向量;
将所述第二特征向量输入至预先训练好的目标密度聚类模型, 得到聚类成功的第 一参
考视频集合; 所述目标密度聚类模型为根据目标类型的多个第二参考视频以及携带有类型
标签的多个训练视频样本, 从配置有不同模型参数的密度聚类模型中确定的。
9.一种电子设备, 其特征在于, 包括: 处理器、 存储器和总线, 所述存储器存储有所述处
理器可执行 的机器可读指令, 当电子设备运行时, 所述处理器与所述存储器之间通过总线
通信, 所述机器可读指令被所述处理器执行时执行如权利要求1至6任一所述的视频识别方
法的步骤。
10.一种计算机可读存储介质, 其特征在于, 该计算机可读存储介质上存储有计算机程
序, 该计算机程序被处理器运行时执行如权利要求1至6任意一项 所述的视频识别方法的步
骤。权 利 要 求 书 2/2 页
3
CN 114926771 A
3
专利 一种视频识别方法及装置
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:31:04上传分享