(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211364427.0
(22)申请日 2022.11.02
(71)申请人 清智汽车 科技 (苏州) 有限公司
地址 215131 江苏省苏州市相城区高铁新
城太阳路2 266号5幢11层1110-B室
(72)发明人 陈睐 石驰宇 周艳宗 李亚伟
(51)Int.Cl.
G06V 10/774(2022.01)
G06V 10/82(2022.01)
G06V 10/74(2022.01)
G06N 3/08(2006.01)
G06N 3/04(2006.01)
(54)发明名称
自动驾驶样本集的数据筛 选方法和装置
(57)摘要
本申请公开了一种自动驾驶样本集的数据
筛选方法和装置。 其中, 该方法包括: 接收样本筛
选请求, 所述样本筛选请求用于请求筛选出能够
提升模型 组中第一模型的识别准确率的样本, 所
述模型组中的所述第一模型和第二模型用于执
行相同的任务, 所述第一模型部署在车载终端上
运行, 所述第二模型部署在服务器上运行; 在确
定待筛选的原始样本能够提升所述第一模型的
识别准确率的情况下, 将所述原始样本存入样本
集合, 所述样本集合用于训练所述第一模型。 本
申请解决了样本 筛选的效率较低的技 术问题。
权利要求书2页 说明书9页 附图2页
CN 115512187 A
2022.12.23
CN 115512187 A
1.一种自动驾驶样本集的数据筛 选方法, 其特 征在于, 包括:
接收样本筛选请求, 其中, 所述样本筛选请求用于请求筛选出能够提升模型组中第一
模型的识别准确率的样本, 所述模型组中的所述第一模型和第二模型用于执行相同的任
务, 所述第一模型部署在车 载终端上运行, 所述第二模型部署在服 务器上运行;
在确定待筛选的原始样本能够提升所述第 一模型的识别准确率的情况下, 将所述原始
样本存入样本集 合, 其中, 所述样本集 合用于训练所述第一模型。
2.根据权利要求1所述的方法, 其特征在于, 在将所述原始样本存入样本集合之前, 所
述方法包括按照如下条件中的至少之一确定所述原始样本是否为能够提升所述第一模型
的识别准确率的样本:
确定所述原 始样本是否为所述第一模型 预测效果 不佳的样本;
确定所述原 始样本是否为所述样本集 合中分布较少的样本;
确定所述原 始样本是否属于需要生效的场景;
确定所述原 始样本是否属于 重复度较高的场景。
3.根据权利要求2所述的方法, 其特征在于, 确定所述原始样本是否为 能够提升所述第
一模型的识别准确率的样本, 包括:
将所述原 始样本输入场景识别模型中, 得到场景识别结果;
在所述场景识别结果不属于预设场景集合的情况下, 确定所述原始样本不是能够提升
所述第一模型的识别准确率的样本, 其中, 所述预设场景集 合用于保存需要生效的场景;
在所述场景识别结果属于所述预设场景集合的情况下, 根据对所述原始样本的画质分
析结果确定所述原 始样本是否为能够提升所述第一模型的识别准确率的样本 。
4.根据权利要求3所述的方法, 其特征在于, 根据对所述原始样本的画质分析结果确定
所述原始样本是否为能够提升所述第一模型的识别准确率的样本, 包括:
将所述原 始样本输入图像清晰度的判断模型, 得到所述原 始样本的清晰度分值;
在所述原始样本的清晰度分值低于清晰度阈值的情况下, 确定所述原始样本不是能够
提升所述第一模型的识别准确率的样本;
在所述原始样本的清晰度分值不低于所述清晰度阈值的情况下, 根据困难样本的选择
结果确定所述原 始样本是否为能够提升所述第一模型的识别准确率的样本 。
5.根据权利要求4所述的方法, 其特征在于, 根据困难样本的选择结果确定所述原始样
本是否为能够提升所述第一模型的识别准确率的样本, 包括:
将所述原始样本分别 输入所述第 一模型和所述第 二模型, 得到所述第 一模型输出的第
一结果和所述第二模型输出的第二结果;
在所述第一结果与 所述第二结果之间的差值未达到第 一阈值的情况下, 确定所述原始
样本不是能够提升所述第一模型的识别准确率的困难样本;
在所述第一结果与 所述第二结果之间的差值达到所述第 一阈值的情况下, 根据对所述
原始样本的去重结果确定所述原始样本是否为能够提升所述第一模型的识别准确 率的样
本。
6.根据权利要求5所述的方法, 其特征在于, 根据对所述原始样本的去重结果确定所述
原始样本是否为能够提升所述第一模型的识别准确率的样本, 包括:
在所述原始样本为第 一次筛选出来的困难样本的情况下, 确定所述原始样本是能够提权 利 要 求 书 1/2 页
2
CN 115512187 A
2升所述第一模型的识别准确率的样本;
在所述原始样本不为第 一次筛选出来的困难样本的情况下, 根据 所述原始样本与已选
出样本的相似度确定所述原 始样本是否为能够提升所述第一模型的识别准确率的样本 。
7.根据权利要求6所述的方法, 其特征在于, 根据 所述原始样本与已选出样本的相似度
确定所述原 始样本是否为能够提升所述第一模型的识别准确率的样本, 包括:
在所述原始样本与已选出样本之间的相似度达到第 二阈值的情况下, 确定所述原始样
本不是能够提升所述第一模型的识别准确率的样本;
在所述原始样本与已选出样本之间的相似度 未达到所述第 二阈值的情况下, 确定所述
原始样本是能够提升所述第一模型的识别准确率的样本 。
8.一种自动驾驶样本集的数据筛 选装置, 其特 征在于, 包括:
接收单元, 用于接收样本筛选请求, 其中, 所述样本筛选请求用于请求筛选出能够提升
模型组中第一模型的识别准确率的样本, 所述模型组中的所述第一模型和 第二模型用于执
行相同的任务, 所述第一模型部署在车 载终端上运行, 所述第二模型部署在服 务器上运行;
筛选单元, 用于在确定待筛选的原始样本能够提升所述第 一模型的识别准确率的情况
下, 将所述原 始样本存 入样本集 合, 其中, 所述样本集 合用于训练所述第一模型。
9.一种存储介质, 其特征在于, 所述存储介质包括存储的程序, 其中, 所述程序运行时
执行上述权利要求1至7任一项中所述的方法。
10.一种电子装置, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运
行的计算机程序, 其特征在于, 所述处理器通过所述计算机程序执行上述权利要求1至7任
一项中所述的方法。权 利 要 求 书 2/2 页
3
CN 115512187 A
3
专利 自动驾驶样本集的数据筛选方法和装置
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:00上传分享