(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111630275.X
(22)申请日 2021.12.28
(71)申请人 安徽海螺信息技 术工程有限责任公
司
地址 241000 安徽省芜湖市镜湖区文化路
39号
(72)发明人 宋登科 谷从发 林宜文 潘尧
马鹏程
(74)专利代理 机构 芜湖思诚知识产权代理有限
公司 34138
代理人 项磊
(51)Int.Cl.
G06Q 10/06(2012.01)
G06Q 10/10(2012.01)
(54)发明名称
一种对水泥生产经 营数据的治理方法
(57)摘要
本发明公开了一种水泥生产经营数据的治
理方法, 包括: 一、 数据集成, 在整体的业务系统
和应用的基础之上建立建立一个数据模型, 按照
数据模型将业务系统的数据或文件数据通过全
量、 增量的方式加载到中台数据库; 二、 数据标准
化, 实现数据的要素维度的梳理、 关联关系的构
筑及关系与维度的汇总形成全面的资源库数据
集; 三、 数据开发, 制定数据开发规范, 对存在的
数据相关问题针对性地提供相应解决方案, 实现
全流程数据处理; 四、 数据质量管理, 根据质量问
题对数据质量进行预测评分, 设置预警阈值预
警, 并通过治理评估报告和健康分指标体现治理
成效。 本发明解决了数据集成程度差、 数据的统
一管理困难以及无法监控数据质量的问题。
权利要求书2页 说明书8页 附图4页
CN 114298550 A
2022.04.08
CN 114298550 A
1.一种水泥生产经 营数据的治理方法, 其特 征在于: 包括:
一、 数据集成, 在整体的业务系统和应用的基础 之上建立建立一个数据模型, 识别了企
业内部跨功能、 跨部门、 跨组织的共享或冗余数据, 按照数据模型将业务系统的数据或文件
数据通过全量、 增量的方式加载到中 台数据库;
二、 数据标准化, 对数据进行全面标准化, 实现数据的要素维度的梳理、 关联关系的构
筑及关系与维度的汇总形成全面的资源库数据集;
三、 数据开发, 制定数据开发规范, 对存在的数据相关问题针对性地提供相应解决方
案, 实现全流 程数据处 理;
四、 数据质量管理, 针对数据在生命周期的每个阶段的各类数据质量问题, 进行识别、
度量、 监控、 预警一系列管理活动, 根据质量问题对数据质量进行预测评分, 设置预警阈值
预警, 并通过治理评估报告和健康分指标体现治理成效。
2.根据权利要求1所述的一种水泥生产 经营数据的治理方法, 其特征在于: 数据集成中
建立的数据模型主要划分成主题域模型和概念性模型, 在两者之间逐级扩展; 主题域模型
在数据模型中处于第一层次, 基本原则就是按照需求来划分, 对某个主题进行分析后确定
的主题边界; 概念性模型在数据模型中处于第二层次, 将 每个主题 域进一步细分为 “概念”,
概念模型是一种高阶数据模型, 以实体—关系理论为基础, 通过主题域形式描述概念化的
结构。
3.根据权利要求1或2所述的一种水泥生产经营数据的治理方法, 其特征在于: 数据集
成中建立的数据模型按照实体链路整理数据, 收集所有相关的数据, 按照各实体ID作为唯
一记录标识, 构建整体明细数据, 形成以实体ID为基础的销售信息大宽表; 按照实体链路中
的实体在业务系统中的存放方式, 获取描述各个实体的维度, 进 行维度表的整体设计, 涉及
的实体依据实体链路相关联。
4.根据权利要求1所述的一种水泥生产经营数据的治理方法, 其特征在于: 数据集成
中, 将组织管理体系、 供应商信息、 物料信息、 各工序生产数据、 能源消耗数据进 行批量离线
抽取, 即批量数据离线同步迁移; 而对销量 等数据进行增量数据实时采集。
5.根据权利要求1所述的一种水泥生产 经营数据的治理方法, 其特征在于: 数据标准化
包括: 1)接入 数据在原始库中实现标准化, 原始库分为数据准备区和数据标准层, 数据准备
区对平台汇聚的数据资源提供数据 的临时存储, 数据标准层提供对数据的转换、 加载、 清
洗、 字段统一、 数据去重及数据归一 化等操作, 实现数据资源的全面标准 化;
2)标准化完成后的数据, 在资源库中实现要素维度的梳理、 关联关系的构筑及关系与
维度的汇总, 数据资源在数据明细层阶段, 根据主题方向构建主题明细, 利用元数据及数据
血缘关系提供数据溯源及查询能力; 完成数据明细层的工作, 在数据汇总层对事实明细数
据按照特定维度进行汇总, 再去重、 合并后形成全面的资源库数据集。
6.根据权利要求1或5所述的一种水泥生产经营数据的治理方法, 其特征在于: 数据标
准化构建统一、 规范、 可共享的全域数据体系, 具体方法包括:
(1)确定主数据 标准, 在集成的数据上进行主数据标准的制定, 单个系统进行维护系统
的数据以对应系统中的数据标准为准, 对于多个系统都有进行维护的且存在差异的信息,
通过梳理建立映射表进行关联;
(2)制定命名模型规范, 通过规范相关业务描述的事实表、 字典表, 将字段名称统一归权 利 要 求 书 1/2 页
2
CN 114298550 A
2并、 设定业务模型表命名统一规范, 实现数据释义统一、 相同业务字段表述描述统一、 业务
模型表名与注释直观反 映相关数据域与业务过程; 在此基础上构建数据公共层, 建立数据
标准管理规范, 数据 表的命名规则如: ods_{单位简称}_{业务库简写 标识}_{业务库原始表
名}[_分区标识]。
7.根据权利要求6所述的一种水泥生产 经营数据的治理方法, 其特征在于: 数据开发对
全流程产生的数据相关问题针对性地提供相应解决方案, 形成相应的治理项; 治理时通过
触发治理项检测, 实现从触发治理项检测、 生 成治理项问题、 查看并处理治理项问题的一系
列流程以解决问题, 完成数据治理。
8.根据权利要求1或7所述的一种水泥生产经营数据的治理方法, 其特征在于: 数据质
量管理的监控过程如下:
事前: 定义数据质量类型、 数据质量 等级, 并明确质量分析步骤。
事中: 对应配置各类型数据的数据质量标准, 对数据进行数据质量稽核, 发现异常数据
时发出异常数据结果告警。
事后: 对数据质量产生和变化进行原因分析、 影响分析, 再根据分析结果进行数据质量
流程优化以提高数据质量。
9.根据权利要求8所述的一种水泥生产 经营数据的治理方法, 其特征在于: 对数据质量
进行预测评分是基于治理项, 按照定义的健康分模型进行量化评估, 最终通过治理评估报
告及治理排行榜中的健康分来体现当前所取得的治理成效, 健康分是依据在数据生产、 数
据流通及数据管理中的用户行为、 数据特性、 任务性质这些元数据, 使用数据处理及机器学
习技术, 对各类型数据进 行综合处理和评估, 通过个人、 工作空间维度客观呈现数据资产状
态的综合分值; 治理评估报告能选择从不同视角查看整体的治理成效, 或从不同子维度查
看各维度的治理成效, 便于发现并分析治理项问题较多的维度, 进一步开展后续的集中治
理工作。
10.根据权利要求9所述的一种水泥生产经营数据的治理方法, 其特征在于: 健康分体
系依托不同元数据, 建设了 “存储、 计算、 研发、 质量和安全 ”五大健康度领域, 并构建 “存储
健康分、 计算健康分、 研发健康分、 质量健康分和安全健康分 ”五大健康分指标; 上述健康度
领域对应分别针对数据存储、 数据计算、 任务研发、 质量监控和数据安全方面出现的问题进
行统计分析, 对各种问题设定相应权 重进行评分。权 利 要 求 书 2/2 页
3
CN 114298550 A
3
专利 一种对水泥生产经营数据的治理方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 20:07:30上传分享