(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211021932.5
(22)申请日 2022.08.24
(71)申请人 厦门美亚亿安信息科技有限公司
地址 361012 福建省厦门市 火炬高新区软
件园一期思明软件园3号创新大厦C区
3F-A1254
(72)发明人 庄晓明 林晓东 吴少华 吴江煌
许佳裕 陈俊兴 卢振业
(74)专利代理 机构 厦门福贝知识产权代理事务
所(普通合伙) 35235
专利代理师 郭涵炜
(51)Int.Cl.
G06F 16/2455(2019.01)
G06K 9/62(2022.01)
G06F 16/906(2019.01)G06Q 10/10(2012.01)
G06Q 30/06(2012.01)
(54)发明名称
一种业务系统数据的收集方法和系统
(57)摘要
本发明公开了一种业务系统数据的收集方
法和系统, 包括对企业内部数据进行解译, 基于
全量数据提取技术, 提取目标业务系统中的所有
业务数据, 业务数据包括招投标采购系统、 供应
商系统和财务系统的数据; 对业务数据进行数据
分析, 通过数据关系证据推理运算获取数据关联
关系的强弱与准确性; 基于数据特征项对业务数
据进行匹配, 提取价值数据; 利用特征项集比对
引擎对价值数据的类型和值进行比对, 持久化存
储正确信息。 本申请可智 能化对数据进行关联、
融合、 推导计算等, 并辨识数据真实准确程度和
数据间的相关性权重, 减 轻招投标审计监察人员
在审计调查过程中人工 检索及计算大量的数据。
权利要求书2页 说明书8页 附图2页
CN 115391399 A
2022.11.25
CN 115391399 A
1.一种业 务系统数据的收集方法, 其特 征在于, 包括:
S1: 对企业内部数据进行解译, 基于全量数据提取技术, 提取目标业务系统中的所有业
务数据, 所述 业务数据包括招投标采购系统、 供应商系统和财务系统的数据;
S2: 对所述业务数据进行数据分析, 通过数据关系证据推理运算获取数据关联关系的
强弱与准确性;
S3: 基于数据特 征项对所述 业务数据进行匹配, 提取价 值数据;
S4: 利用特征项集比对引擎对所述价值数据的类型和值进行比对, 持久化存储正确信
息。
2.根据权利要求1所述的业务系统数据的收集方法, 其特征在于, 所述S2中通过数据关
系证据推理运 算获取数据关联关系的强弱与准确性具体包括:
S21: 确定从业务系统内读取到的样本数据
与业务区间分布
匹配相似度, 并获得
所有样本对匹配的相似度和an,j;
S22: 计算获得单一特征似然函数表
其中, yn为各样本特征值
类别, δn为样本个数;
S23: 将所述特 征似然函数表输入
获得信度矩阵表;
S24: 对证据推理规则下的证据进行融合, 获得特征的
在类别yn中的信度
S25: 获取属性Xi的可靠性
其中, Qi表示能够直接根据属性Xi判断为某
个具体类的样本数量。
3.根据权利要求1所述的业务系统数据的收集方法, 其特征在于, 所述S3 中基于数据 特
征项对所述 业务数据进行匹配具体包括类型匹配、 语义匹配和数据质量匹配。
4.根据权利要求1所述的业 务系统数据的收集方法, 其特 征在于, 所述S4具体包括:
S41: 将真实样例数据集作为检验样本, 获取到的数据作为训练样本, 对特征项集进行
值归一化处理, 将读取到的训练样本数据归一 化至[0,1]的区间内;
S42: 创建神经网络, 设置训练参数对BP神经网络的训练参数, 并进行训练;
S43: 读取检验样本, 输入所述神经网络中进行测试, 分析结果并统计样本识别的正确
率, 若样本识别准确率低则生成特 征项集参考。
5.根据权利要求4所述的业务系统数据的收集方法, 其特征在于, 所述训练参数包括精
度、 次数和固定值。
6.一种计算机可读存储介质, 其上存储有一或多个计算机程序, 其特征在于, 该一或多
个计算机程序被 计算机处 理器执行时实施权利要求1至 5中任一项所述的方法。
7.一种业 务系统数据的收集系统, 其特 征在于, 所述系统包括:
全量数据提取单元: 配置用于对企业内部数据进行解译, 基于全量数据提取技术, 提取
目标业务系统中的所有业务数据, 所述业务数据包括招投标采购系统、 供应商系统和财务权 利 要 求 书 1/2 页
2
CN 115391399 A
2系统的数据;
数据分析单元: 配置用于对所述业务数据进行数据分析, 通过数据关系证据推理运算
获取数据关联关系的强弱与准确性;
数据匹配单 元: 配置用于基于数据特 征项对所述 业务数据进行匹配, 提取价 值数据;
数据存储单元: 配置用于利用特征项集比对引擎对所述价值数据的类型和值进行比
对, 持久化存 储正确信息 。
8.根据权利要求7所述的业务系统数据的收集系统, 其特征在于, 所述数据分析单元中
通过数据关系证据推理运算获取数据关联关系的强弱与准确 性具体包括确定读取到的样
本数据
与业务区间分布
匹配相似度, 并获得所有样本对匹配的相似度和an,j; 计算获
得单一特征似然函数表
其中, yn为各样本特征值类别, δn为样本
个数; 将所述特征似然函数表输入
获得信度矩阵表; 对证据推理规则下的
证据进行融合, 获得特征的
在类别yn中的信度
获取属
性Xi的可靠性
其中, Qi表示能够直接根据属性Xi判断为某个具体类的样本
数量。
9.根据权利要求7所述的业务系统数据的收集系统, 其特征在于, 所述数据匹配单元中
基于数据特 征项对所述 业务数据进行匹配具体包括类型匹配、 语义匹配和数据质量匹配。
10.根据权利要求7所述的业务系统数据的收集系统, 其特征在于, 所述数据存储单元
中利用特征项集比对引擎对所述价值数据的类型和值进行比对具体包括: 将真实样例数据
集作为检验样本, 获取到的数据作为训练样本, 对 特征项集进 行值归一化处理, 将读取到的
训练样本数据归一化至[ 0,1]的区间内; 创建神经网络, 设置训练参数对BP神经网络的训练
参数, 并进行训练; 读取检验样本, 输入所述神经网络中进行测试, 分析结果并统计样本识
别的正确率, 若样本识别准确率低则生成特 征项集参考。权 利 要 求 书 2/2 页
3
CN 115391399 A
3
专利 一种业务系统数据的收集方法和系统
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:29:51上传分享