说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211230628.1 (22)申请日 2022.09.30 (71)申请人 联想 (北京) 有限公司 地址 100085 北京市海淀区上地西路6号2 幢2层201- H2-6 (72)发明人 吴高 张成松  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 鲁丽美 (51)Int.Cl. G06F 16/2458(2019.01) G06F 16/2455(2019.01) (54)发明名称 数据处理方法、 装置和电子设备 (57)摘要 本申请公开一种数据处理方法、 装置和电子 设备, 该方法包括: 获取待处理数据, 提取待处理 数据的数据特性信息, 对待处理数据执行与其数 据特性信息相关的质量判定处理, 得到待处理数 据的第一质量确定结果, 并确定用户对待处理数 据的需求信息, 根据用户对待处理处理的需求信 息和待处理处理的第一质量确定结果, 确定待处 理数据的数据质量, 得到待处理数据的第二质量 确定结果。 权利要求书2页 说明书11页 附图4页 CN 115495503 A 2022.12.20 CN 115495503 A 1.一种数据处 理方法, 所述方法包括: 获取待处 理数据; 提取所述待处 理数据的数据特性信息; 对所述待处理数据执行与 所述数据 特性信息相关的质量判定处理, 得到所述待处理数 据的第一质量确定结果; 确定用户对所述待处 理数据的需求信息; 根据所述需求信息和所述第一质量确定结果, 确定所述待处理数据的数据质量, 得到 所述待处 理数据的第二质量确定结果。 2.根据权利要求1所述的方法, 所述待处理数据的数据特性信 息, 包括所述待处理数据 的不同维度数据特 征; 所述对所述待处理数据 执行与所述数据特性信 息相关的质量判定处理, 得到所述待处 理数据的第一质量确定结果, 包括: 根据预设的数据质量评分规则, 确定所述待处理数据的不同维度 数据特征分别对应的 质量评分; 根据所述不同维度数据特征分别对应的质量评分, 确定所述待处理数据对应的 综合得分; 和/或, 根据所述待处理数据的相似数据的质量等级, 确定所述待处理数据的质量等 级; 所述相似数据的质量等级为通过结合业务场景需求对所述相似数据的不同维度数据特 征的质量评分进行处 理所得的结果; 其中, 所述第 一质量确定结果包括所述综合得分和所述待处理数据的质量等级中的至 少一种。 3.根据权利要求2所述的方法, 所述待处理数据包括待处理数据表中的数据, 所述待处 理数据表包括至少一个字段; 所述待处理数据的不同维度数据特征包括: 所述待处理数据表和/或所述待处理数据 表的字段在数据的完整性、 唯一性、 有效性、 一致性、 准确性和及时性中至少部分维度对应 的特征; 所述数据质量评分规则包括表级规则、 字段级规则、 跨表规则和跨字段规则中的至少 部分规则; 其中, 所述表级规则和所述跨表规则用于对所述待处理数据表的相 应维度数据 特征进行评 分, 所述字段级规则和所述跨字段规则用于对所述待处理数据 表的字段的相应 维度数据特 征进行评分。 4.根据权利要求2所述的方法, 所述根据所述待处理数据的相似数据的质量等级, 确定 所述待处 理数据的质量 等级, 包括: 获取所述待处 理数据的预设类型 数据信息和质量评价数据; 将所述待处理数据的预设类型数据信息和质量评价数据输入预先构建的第一处理模 型, 得到所述第一处理模型基于所述待处理数据的相似数据的质量等级输出的所述待处理 数据的质量 等级; 其中, 所述待处理数据的相似数据为: 与所述待处理数据在对应的预设类型数据信息 和质量评价数据方面满足相似性要求的数据。 5.根据权利要求1所述的方法, 所述确定用户对所述待处 理数据的需求信息, 包括: 获取所述用户在所述待处 理数据所属应用系统中的行为信息;权 利 要 求 书 1/2 页 2 CN 115495503 A 2将所述行为信 息输入预先构建的第 二处理模型, 得到所述第 二处理模型输出的所述用 户对所述待处理数据的需求场景类型预测结果, 作为所述用户对所述待处理数据的需求信 息; 其中, 不同的需求场景类型表征用户在使用所述待处理数据时对所述待处理数据的数 据质量的不同要求。 6.根据权利要求5所述的方法, 所述行为信息包括所述用户在所述待处理数据所属系 统的数据访问日志、 数据开 发日志、 功能使用日志、 系统登录日志和历史评价数据中的至少 部分信息 。 7.根据权利要求5所述的方法, 所述根据所述需求信 息和所述第 一质量确定结果, 确定 所述待处 理数据的数据质量, 得到所述待处 理数据的第二质量确定结果, 包括: 将所述需求场景类型和所述待处理数据的第一质量确定结果输入预先构建的第三处 理模型, 得到所述第三处理模型输出 的所述待处理数据的质量等级, 作为所述第二质量确 定结果; 其中, 所述需求场景类型对所述第三处理模型的用于产生输出结果的处理过程的影 响, 与所述需求场景类型表征的用户在使用所述待处理数据时对所述待处理数据的数据质 量要求的高低程度相关。 8.根据权利要求1所述的方法, 在得到所述待处理数据的第 二质量确定结果之后, 还包 括: 生成对应于所述第二质量确定结果的提 示信息, 并向所述用户反馈所述 提示信息; 或, 根据不同待处理数据分别对应的第二质量确定结果, 从所述不同待处理数据中选 取满足质量条件的目标 数据, 以向用户推送所述目标 数据。 9.一种数据处 理装置, 所述装置包括: 获取单元, 用于获取待处 理的待处 理数据; 提取单元, 用于提取 所述待处 理数据的数据特性信息; 第一质量确定单元, 用于对所述待处理数据 执行与所述数据特性信 息相关的质量判定 处理, 得到所述待处 理数据的第一质量确定结果; 需求确定单 元, 用于确定用户对所述待处 理数据的需求信息; 第二质量确定单元, 用于根据所述需求信息和所述第一质量确定结果, 确定所述待处 理数据的数据质量, 得到所述待处 理数据的第二质量确定结果。 10.一种电子设备, 包括: 存储器, 用于 至少存储一组计算机指令集; 处理器, 用于通过调用并执行所述存储器 中存储的所述指令集, 实现如权利要求1 ‑8任 一项所述的数据处 理方法。权 利 要 求 书 2/2 页 3 CN 115495503 A 3

PDF文档 专利 数据处理方法、装置和电子设备

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据处理方法、装置和电子设备 第 1 页 专利 数据处理方法、装置和电子设备 第 2 页 专利 数据处理方法、装置和电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:30:05上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。