(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211081341.7
(22)申请日 2022.09.06
(71)申请人 浙江清华长三角研究院
地址 314050 浙江省嘉兴 市亚太路70 5号A
座915
(72)发明人 曾涛
(74)专利代理 机构 杭州衡峰知识产权代理事务
所(普通合伙) 33426
专利代理师 陈修伟
(51)Int.Cl.
G06F 16/27(2019.01)
H04L 12/40(2006.01)
(54)发明名称
车载CAN总线数据的批量处理方法、 装置设
备和存储介质
(57)摘要
本发明实施例提供车载CAN总线数据的批量
处理方法、 装置设备和存储介质, 涉及汽车数据
保存技术领域。 批量处理方法包含步骤S1至步骤
S5。 S1、 读取BLF格式的CAN总线数据文件。 S2、 根
据解析协议, 解析读取的CAN总线数据, 获取结构
化数据。 S3、 对结构化数据进行缺失值处理, 异常
值处理, 获取第一处理数据。 S4、 对第一处理数据
进行数据补齐处理, 获取第二处理数据。 S5、 将第
二处理数据保存为CSV 格式, 并保存至MySQL数据
库。 批量处理方法处理后的数据既可以方便查看
数据, 又可以存储体量较大的数据的功能。 为后
续对智能网联数据进行高效查看、 利用、 挖掘提
供了便捷基础。
权利要求书2页 说明书7页 附图5页
CN 115455116 A
2022.12.09
CN 115455116 A
1.一种车 载CAN总线数据的批量处 理方法, 其特 征在于, 包 含:
读取BLF格式的CAN总线数据文件;
根据解析协议, 解析读取的CAN总线数据, 获取 结构化数据;
对所述结构化数据进行缺失值处 理, 异常值处 理, 获取第一处 理数据;
对所述第一处 理数据进行 数据补齐处 理, 获取第二处 理数据;
将所述第二处 理数据保存为CSV格式, 并保存至 MySQL数据库。
2.根据权利 要求1所述的车载CAN总线数据的批量处理方法, 其特征在于, 读取BLF格 式
的CAN总线数据文件, 具体包括:
获取目标文件夹;
遍历所述目标文件夹内的所有 文件, 并判断文件格式是否为BLF;
当判断文件格式为BLF时, 执 行后续步骤。
3.根据权利要求1所述的车载CAN总线数据的批量处理方法, 其特征在于, 根据解析协
议, 解析读取的CAN总线数据, 获取 结构化数据, 具体包括:
根据CSV库的CAN.BLFReader, 解析BLF格式的CAN总线数据文件, 获取 结构化数据。
4.根据权利 要求3所述的车载CAN总线数据的批量处理方法, 其特征在于, 根据CSV库的
CAN.BLFReader, 解析BLF格式的CAN总线数据文件, 获取 结构化数据, 具体包括:
根据CSV库的CAN.B LFReader, 解析B LF格式的CAN总线数据文件, 获取迭代器形式类集,
并根据所述迭代器形式类集进行list处理, 获取BLF文件类; 其中, 每个BLF文件类中包含对
应的CAN信息;
分别对各个BLF文件类: 遍历BLF文件类包含的信息, 获取信息ID、 符号位和编码类型,
并根据信号起始 位置、 长短、 补偿值、 标度值、 符号位、 编 码类型进行物理数据的计算物理数
据, 然后将所述物理数据, 及其对应的时间和信息ID写入预 先创建的CSV文件。
5.根据权利要求1所述的车载CAN总线数据的批量处理方法, 其特征在于, 对所述结构
化数据进行缺失值处 理, 异常值处 理, 获取第一处 理数据, 具体包括:
根据所述结构化数据, 对CAN总线数据属性进行异常检测;
当检测到异常是 数据属性取值 为空时, 采用相邻记录的平均值进行填充;
当判断到异常是 数据取值异常大时, 删除异常值并采用相邻记录的平均值进行填充;
当判断到异常是数据采集时间为1970年1月1日时, 删除该时间并根据异常数据前后的
时间, 按照线性差值进行填充。
6.根据权利要求5所述的车载CAN总线数据的批量处理方法, 其特征在于, 对所述结构
化数据进行缺失值处 理, 异常值处 理, 获取第一处 理数据, 还 包括:
对缺失值处理, 异常值处理后的数据进行标准化转换, 获取所述第一处理数据; 标准化
转换模型vz为:
式中, v表示转换前的数值、
表示数值的平均值, std(v)表示
数值的标准差 。
7.根据权利要求1所述的车载CAN总线数据的批量处理方法, 其特征在于, 所述第一处
理数据中包 含车辆参数 数据和车速数据;
对所述第一处 理数据进行 数据补齐处 理, 获取第二处 理数据, 具体包括:
对所述第一处理数据中的车速数据, 进行下采样; 下采样间隔为车数数据的最小采样权 利 要 求 书 1/2 页
2
CN 115455116 A
2周期的10倍;
对所述第一处理数据中的车辆参数数据, 以车速数据的时间为基准, 向前向后搜索有
效数据, 进行 数据对齐, 获取 所述第二处 理数据。
8.一种车 载CAN总线数据的批量处 理装置, 其特 征在于, 包 含:
读取模块, 用于读取BLF格式的CAN总线数据文件;
解析模块, 用于根据解析协议, 解析读取的CAN总线数据, 获取 结构化数据;
第一处理模块, 用于对所述结构化数据进行缺失值处理, 异常值处理, 获取第 一处理数
据;
第二处理模块, 用于对所述第一处 理数据进行 数据补齐处 理, 获取第二处 理数据;
保存模块, 用于将所述第二处 理数据保存为CSV格式, 并保存至 MySQL数据库。
9.一种车载CAN总线数据的批量处理设备, 其特征在于, 包括处理器、 存储器, 以及存储
在所述存储器内的计算机程序; 所述计算机程序能够被所述处理器执行, 以实现如权利要
求1至7任意 一项所述的车 载CAN总线数据的批量处 理方法。
10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质包括存储的计算
机程序, 其中, 在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权
利要求1至7任意 一项所述的车 载CAN总线数据的批量处 理方法。权 利 要 求 书 2/2 页
3
CN 115455116 A
3
专利 车载CAN总线数据的批量处理方法、装置设备和存储介质
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 00:51:01上传分享