说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210877964.9 (22)申请日 2022.07.25 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 熊鹏飞 梁健豪  (74)专利代理 机构 北京派特恩知识产权代理有 限公司 1 1270 专利代理师 王花丽 蒋雅洁 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/80(2022.01) G06V 10/74(2022.01) (54)发明名称 视频的处 理方法、 装置、 设备及存 储介质 (57)摘要 本申请提供了一种视频的处理方法、 装置、 设备、 存储介质及计算机程序产品, 可应用于云 技术、 人工智能、 智慧交通、 辅助驾驶等各种场 景; 方法包括: 将待处理视频中的各个图像帧, 分 别划分为第一数量的第一图像块; 针对待处理视 频中的目标图像帧, 获取参考图像帧与目标图像 帧间的距离, 并基于距离, 将参考图像帧划分为 第二数量的第二图像块, 第二数量与距离负相 关; 针对目标图像帧中的各第一图像块, 以目标 图像帧以及参考图像帧包括的第二图像块为参 考, 对第一图像块进行特征提取, 得到第一图像 块的图像块特征; 对各图像帧包括的第一图像块 的图像块特征进行特征聚合, 得到视频的视频特 征; 通过本申请, 能够提高视频特 征的提取效率。 权利要求书3页 说明书17页 附图6页 CN 115223083 A 2022.10.21 CN 115223083 A 1.一种视频的处 理方法, 其特 征在于, 所述方法包括: 将待处理视频中的各个图像帧, 分别划分为第一数量的第一图像块; 针对所述待处理视频中的目标图像帧, 获取参考图像帧与所述目标图像帧间的距离, 并基于所述距离, 将所述 参考图像帧划分为第二数量的第二图像块; 其中, 所述参考图像帧, 为所述待处理视频中除所述目标图像帧之外的图像帧, 所述第 二数量与所述距离负相关; 针对所述目标图像帧中的各所述第 一图像块, 以所述目标图像帧 以及所述参考图像帧 包括的第二图像块为参考, 对所述第一图像块进行特征提取, 得到所述第一图像块的图像 块特征; 对各所述图像帧包括的第 一图像块的图像块特征进行特征聚合, 得到所述待处理视频 的视频特征。 2.如权利要求1所述的方法, 其特征在于, 所述获取参考图像帧与所述目标图像帧间的 距离, 包括: 获取所述参考图像帧与所述目标图像帧之间的图像帧的帧数量, 并将所述帧数量作为 所述参考图像帧与所述目标图像帧间的距离 。 3.如权利要求1所述的方法, 其特征在于, 所述获取参考图像帧与所述目标图像帧间的 距离, 包括: 获取所述参考图像帧的播放时间点、 与所述目标图像帧的播放时间点间的时间间隔, 并将所述时间 间隔作为所述 参考图像帧与所述目标图像帧间的距离 。 4.如权利要求1所述的方法, 其特征在于, 所述基于所述距离, 将所述参考图像帧划分 为第二数量的第二图像块之前, 所述方法还 包括: 获取距离和 划分数量间的映射关系, 所述划分数量, 用于所述 参考图像帧的划分; 基于所述距离以及所述映射关系, 确定所述距离对应的目标划分数量, 并将所述目标 划分数量作为所述第二数量。 5.如权利要求1所述的方法, 其特征在于, 所述基于所述距离, 将所述参考图像帧划分 为第二数量的第二图像块之前, 所述方法还 包括: 获取所述参考图像帧对应的多个距离区间, 每个所述距离区间关联有相应的划分数 量, 所述划分数量, 用于所述 参考图像帧的划分; 从所述多个距离区间中, 确定所述距离所处的目标距离区间, 并将所述目标距离区间 对应的划分数量作为所述第二数量。 6.如权利要求1所述的方法, 其特征在于, 所述以所述目标图像帧 以及所述参考图像帧 包括的第二图像块为参考, 对所述第一图像块进行特征提取, 得到所述第一图像块的图像 块特征, 包括: 获取所述目标图像帧包括的第 一图像块的块向量, 并获取所述参考图像帧包括的第 二 图像块的块向量; 分别确定各 所述块向量与所述第一图像块的块向量之间的向量相似度; 基于各所述块向量对应的向量相似度, 对多个所述块向量进行第一聚合处理, 得到所 述第一图像块的聚合特 征; 将所述第一图像块的块向量和所述 聚合特征进行第 二聚合处理, 得到所述第 一图像块权 利 要 求 书 1/3 页 2 CN 115223083 A 2的图像块特 征。 7.如权利要求6所述的方法, 其特征在于, 所述基于各所述块向量对应的向量相似度, 对多个所述 块向量进行第一聚合处 理, 得到所述第一图像块的聚合特 征, 包括: 对各所述块向量对应的向量相似度进行归一化处理, 并将处理得到的结果作为相应块 向量的向量权 重; 基于各所述块向量的向量权重, 对多个所述块向量进行加权求和 处理, 得到所述第一 图像块的聚合特 征。 8.如权利要求6所述的方法, 其特征在于, 所述块向量包括查询向量、 键向量以及值向 量; 所述分别确定各 所述块向量与所述第一图像块的块向量之间的向量相似度, 包括: 分别确定各所述图像块的键向量、 与所述第一图像块的查询向量之间的相似度, 并将 所述相似度作为所述向量相似度; 所述基于各所述块向量对应的向量相似度, 对多个所述块向量进行第一聚合处理, 得 到所述第一图像块的聚合特 征, 包括: 基于各所述块向量对应的向量相似度, 对多个所述值向量进行第一聚合处理, 得到所 述第一图像块的聚合特 征。 9.如权利要求6所述的方法, 其特征在于, 所述块向量包括查询向量、 键向量以及值向 量; 所述获取 所述参考图像帧包括的第二图像块的块向量, 包括: 将所述参考图像帧包括的第 二图像块进行向量转换, 得到所述第 二图像块的图像块向 量; 对所述图像块向量进行线性投影处理, 得到所述第二图像块的第一中间查询向量、 第 一中间键向量以及第一中间值向量; 对所述第一中间查询向量进行第一池化处 理, 得到所述 查询向量; 对所述第一中间键向量进行第二池化处理, 并基于所述距离, 对所述第二池化处理得 到的结果进行处 理, 得到所述键向量; 对所述第一中间值向量进行第三池化处理, 并基于所述距离, 对所述第三池化处理得 到的结果进行处 理, 得到所述 值向量。 10.如权利要求9所述的方法, 其特征在于, 所述基于所述距离, 对所述第 二池化处理得 到的结果进行处 理, 得到所述键向量, 包括: 当所述距离达到距离阈值时, 对所述第二池化处理得到的结果进行第一特征提取处 理, 得到所述键向量; 当所述距离未达到所述距离 阈值时, 对所述第 二池化处理得到的结果进行第 二特征提 取处理, 得到所述键向量; 其中, 所述第一特征提取处理所得到的特征的稠密程度, 低于所述第二特征提取处理 所得到的特 征的稠密程度。 11.如权利要求1所述的方法, 其特征在于, 所述以所述目标图像帧以及所述参考图像 帧包括的第二图像块为参考, 对所述第一图像块进行特征提取, 得到所述第一图像块的图 像块特征, 包括: 以所述目标图像帧 以及所述参考图像帧包括的第 二图像块为参考, 对所述第 一图像块 进行至少两次的特 征提取, 得到每次特 征提取所得到的中间图像块特 征;权 利 要 求 书 2/3 页 3 CN 115223083 A 3

PDF文档 专利 视频的处理方法、装置、设备及存储介质

文档预览
中文文档 27 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 视频的处理方法、装置、设备及存储介质 第 1 页 专利 视频的处理方法、装置、设备及存储介质 第 2 页 专利 视频的处理方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:28:52上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。