说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202211081038.7 (22)申请日 2022.09.06 (65)同一申请的已公布的文献号 申请公布号 CN 115147096 A (43)申请公布日 2022.10.04 (73)专利权人 京华信息科技股份有限公司 地址 510520 广东省广州市天河区高普路 138号京华信息大楼中座 (72)发明人 李思伟 李锦洲 池沐霖 张旭君  申鑫  (74)专利代理 机构 广州专理知识产权代理事务 所(普通合伙) 44493 专利代理师 张凤 (51)Int.Cl. G06Q 10/10(2012.01)G06V 30/414(2022.01) G06V 30/416(2022.01) G06V 30/148(2022.01) (56)对比文件 CN 112990780 A,2021.0 6.18 田娥.机车小辅修 业务流程Petri网建模的 研究. 《现代制造 工程》 .2012,(第6期),第124- 128页. 归思超等.基于行为的自动化 流程建模推荐 方法. 《计算机集成制造系统》 .2020,(第0 6期), 审查员 洪利燕 (54)发明名称 一种基于OCR的流 程快速建模方法及系统 (57)摘要 本发明公开了一种基于OCR的流程快速建模 方法及系统, 先获取待建模流程的流程图集, 并 根据预设的OCR识别模型, 对所述流程图集中的 每个流程图进行识别, 获得每个流程图各自对应 的第一流程数据; 遍历所有第一流程数据, 将流 程节点相同的流程数据进行加权融合, 生成所述 待建模流程的第二流程数据; 根据所述第二流程 数据, 构建待建模流程的第一流程模型。 本发明 技术方案能够通过OCR识别技术实现流程模型的 快速建立, 提高流程模型的建立速度和多应用场 景的适用性。 权利要求书3页 说明书11页 附图2页 CN 115147096 B 2022.11.18 CN 115147096 B 1.一种基于OCR的流 程快速建模方法, 其特 征在于, 包括: 获取待建模流程的流程图集, 并根据预设的OCR识别模型, 对所述流程图集中的每个流 程图进行识别, 获得每个流程图各自对应的第一流程数据; 其中, 第一流程数据是由所述 OCR识别模型识别出的字符特征而表征, 且每个第一流程数据包括: 若干个流程节点、 每个 流程节点的节点类型以及每 个流程节点的流向; 遍历所有第一流程数据, 将流程节点相同的流程数据进行加权融合, 生成所述待建模 流程的第二流程数据; 其中, 所述第二流程数据中的各个流程节点均不相同; 所述加权融合 包括节点类型融合和节点 流向融合; 根据所述第二 流程数据, 构建待建模流 程的第一 流程模型; 所述遍历所有第一流程数据, 将流程节点相同的流程数据进行加权融合, 生成所述待 建模流程的第二流程数据, 具体为: 将各第一流程数据之 间的流程节点进 行字符特征比对, 将比对结果符合预设条件的所有流程节点对作为待融合节点对; 对每个待融合节点对进 行 节点类型融合和节点流向融合, 生成若干个融合后的流程节点; 根据融合后的流程节点和 未融合的流 程节点, 生成所述待建模流 程的第二 流程数据; 所述对每个待融合节点对进行节点类型融合和节点流向融合, 生成若干个融合后的流 程节点, 具体为: 判断各待融合节点对之间是否存在相同的流程节点; 若存在, 则将具有相 同流程节点的所有待融合节点对进行节点对间的第一节点类型融合和 第一节点流向融合; 若不存在, 则将不具有相同流程节点的待融合节 点对进行节点对内的第二节点类型融合和 第二节点 流向融合; 所述第一节点类型融合为: 计算待融合节点对内各流程节点的节点类型出现频次, 并 将出现频次最高的节点类型作为融合后流 程节点的节点类型; 所述第一节点流向融合为: 根据预设的流向初始权重, 对待融合节点对内各流程节点 的流向进行权 重计算, 将权 重最高的流向作为融合后流 程节点的流向; 所述第二节点类型融合为: 若待融合节点对内流程节点的节点类型相同, 则将相同的 节点类型作为融合后流程节点的节点类型; 若待融合节点对内流程节点的节点类型不相 同, 则响应用户输入的操作, 确定融合后流 程节点的节点类型; 所述第二节点流向融合为: 若待融合节点对内流程节点的流向相同, 则将相同的流向 作为融合后流程节点的流向; 若待融合节点对内流程节点的流向不相同, 则根据预设的流 向初始权重, 对待融合节点对内流程节点的流向进行权重计算, 将权重最高的流向作为融 合后流程节点的流向。 2.根据权利要求1所述的基于OCR的流程快速建模方法, 其特征在于, 所述根据预设的 OCR识别模型, 对所述 流程图集中的每 个流程图进行识别, 具体为: 通过所述OCR识别模型, 对待识别流程图进行区域划分, 获得若干个带文字字符的子区 域, 并确定每 个子区域对应的区域类型和区域 流向; 对每个子区域的文字字符进行字符切割和字符特征提取, 获得每个子区域对应的若干 个字符特 征; 根据每个子区域各自的区域类型、 区域流向和所述若干个字符特征, 判断各子区域是 否为流程节点, 并根据确定为 流程节点的所有子区域, 生成所述第一 流程数据。 3.根据权利要求2所述的基于OCR的流程快速建模方法, 其特征在于, 所述根据所述第权 利 要 求 书 1/3 页 2 CN 115147096 B 2二流程数据, 构建待建模流 程的第一 流程模型, 具体为: 根据所述第二流程数据中各流程节点的流向, 确定各流程节点之间的关系, 并根据各 流程节点的节点类型, 构建待建模流程的第一流程模型; 其中, 所述第一流程模 型中记录了 各流程节点在进行融合时的流向权 重。 4.根据权利要求3所述的基于OCR的流程快速建模方法, 其特征在于, 在所述构建待建 模流程的第一 流程模型之后, 还 包括: 获取第三流程 图, 并根据预设的OCR识别模型, 对所述第三流程 图进行识别, 获得所述 第三流程图对应的第三 流程数据; 其中, 所述第三 流程图为所述 流程图集之外的流 程图; 依次判断所述第三流程数据中的流程节点是否与所述第一流程模型中的流程节点相 同; 当相同时, 根据第一流程模型记录的流向权重, 结合第 三流程数据, 重新计算相同流程 节点的流向权 重, 并根据第一计算结果, 更新所述第一 流程模型及记录的流向权 重; 当不相同时, 根据不相同流 程节点的节点类型和流向, 更新所述第一 流程模型。 5.根据权利要求3所述的基于OCR的流程快速建模方法, 其特征在于, 在所述构建待建 模流程的第一 流程模型之后, 还 包括: 获取第四流程 图, 并根据预设的OCR识别模型, 对所述第四流程 图进行识别, 获得所述 第四流程图对应的第四流 程数据; 其中, 所述第四流 程图为所述 流程图集内的任一 流程图; 查询所述第 一流程模型, 将与所述第四流程数据中流程节点相同的节点作为待调 整节 点; 根据待调整节点在所述第 一流程模型记录的流向权重, 剔除第四流程数据中各流程节 点的流向对流向权重的影响, 重新计算待调整节 点的流向权重, 并根据第二计算结果, 更新 所述第一 流程模型及记录的流向权 重。 6.一种基于OCR的流程快速建模系统, 其特征在于, 包括: 第一获取模块、 加权融合模块 和构建模块; 其中, 所述第一获取模块用于获取待建模流程的流程图集, 并根据预设的OCR识别模 型, 对所述流程图集中的每个流程图进 行识别, 获得每个流程图各自对应的第一流程数据; 其中, 第一流程数据是由所述OCR识别模型识别出的字 符特征而表征, 且每个第一流程数据 包括: 若干个流 程节点、 每 个流程节点的节点类型以及每 个流程节点的流向; 所述加权 融合模块用于遍历所有第 一流程数据, 将流程节点相同的流程数据进行加权 融合, 生成所述待建模流程的第二流程数据; 其中, 所述第二流程数据中的各个流程节点均 不相同; 所述加权融合包括节点类型融合和节点 流向融合; 所述构建模块用于根据所述第二 流程数据, 构建待建模流 程的第一 流程模型; 所述加权 融合模块用于遍历所有第 一流程数据, 将流程节点相同的流程数据进行加权 融合, 生成所述待建模流程的第二流程数据, 具体为: 将各第一流程数据之 间的流程节点进 行字符特征比对, 将比对结果符合预设条件的所有流程节点对作为待融合节点对; 对每个 待融合节点对进行节点类型融合和节点流向融合, 生成若干个融合后的流程节点; 根据融 合后的流 程节点和未融合的流 程节点, 生成所述待建模流 程的第二 流程数据; 所述加权 融合模块用于对每个待融合节点对进行节点类型融合和节点流向融合, 生成 若干个融合后的流程节点, 具体为: 判断各待融合节点对之间是否存在相同的流程节点; 若权 利 要 求 书 2/3 页 3 CN 115147096 B 3

PDF文档 专利 一种基于OCR的流程快速建模方法及系统

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于OCR的流程快速建模方法及系统 第 1 页 专利 一种基于OCR的流程快速建模方法及系统 第 2 页 专利 一种基于OCR的流程快速建模方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:29:33上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。