(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111605348.X
(22)申请日 2021.12.25
(71)申请人 北京云集智造科技有限公司
地址 100000 北京市朝阳区来广营西路5号
院5号楼5层5 06室
(72)发明人 朱品燕 曲鹏达 熊亚军 李碧落
夏浩 苗贺
(74)专利代理 机构 北京博识智 信专利代理事务
所(普通合伙) 16067
专利代理师 李悦
(51)Int.Cl.
G06F 40/289(2020.01)
G06Q 10/10(2012.01)
(54)发明名称
一种外部规章制度在企业内部执行落实的
方法
(57)摘要
本发明公开了一种外部规章制度在企业内
部执行落实的方法, 包括以下步骤,(1)文件拆分
模块, 系统通过自定义正则进行文本拆分, 将文
本拆分为段落; (2)词库扩展, 采用了四个模块来
处理, 分别是分词自定义模块, 同义词补充模块,
缩略词补充模块和停用词补充模块; (3)文本匹
配度计算, 系统将段落文本进行智能分词, 加载
词库扩展模 块对分词进行过滤, 根据TextRank算
法得出关键词若干个, 找出与每条外规匹配度较
高的多个内规, 最终可得到与外部规章制度匹配
度较高的多个内部规章制度本发明的精确度大
大提高; 减少人工合规投入的重复性工作量, 缩
短周期。 减少对相关专 家的依赖 。
权利要求书1页 说明书3页 附图2页
CN 114528829 A
2022.05.24
CN 114528829 A
1.一种外 部规章制度在企业内部执 行落实的方法, 其特 征在于: 包括以下步骤,
(1)文件拆分模块, 系统通过自定义 正则进行文本拆分, 将文本拆分为段落;
(2)词库扩展, 采用了四个模块来处理, 分别是分词自定义模块, 同义词补充模块, 缩略
词补充模块和停用词补充模块;
(3)文本匹配度计算, 系统将段落文本进行智能分词, 加载词库扩展模块对分词进行过
滤, 根据TextR ank算法得出关键词若干个, 找出与每条外规匹配度较高的多个内规, 包括以
下子步骤:
a、 首先需要将段落文本通过jieba分词工具进行智能分词, 将分词结果通过我们自定
义的词语过滤模块进 行过滤, 词语过滤模块包括了词性过滤, 同义词过滤, 停用词过滤和缩
略词过滤四部分;
b、 将分词结果通过Text Rank算法分别计算出每段文本最有影响力的若干词语, 假设外
部规章制度关键词与内部规章制度关键词集合交集的数量为N, 外部规章制度文本段落的
关键词数量为M, 即N/M作为两段文本之间的匹配度, 将匹配度进 行排序, 即可得到与外部规
章制度匹配度较高的多个内部规 章制度。
2.根据权利要求1所述的一种外部规章制度在企业内部执行落实的方法, 其特征在于:
所述文件拆分模块包括以下两个部分:
(1)正则库是基于客户提供的文件目录结构进行总结, 针对不同层级的目录标题, 生成
文本拆分规则;
(2)将不同格式的文件转换成txt文本, 程序读取txt文本, 根据换行符首 次切分文本内
容, 采用递归, 用定义 好的多层级正则库对文本进行拆分, 取 得每个层级的段落信息 。权 利 要 求 书 1/1 页
2
CN 114528829 A
2一种外部规章制度在企业内部执行落实的方 法
技术领域
[0001]本发明涉及文本自动匹配领域, 具体是指一种外部规章制度在企业内部执行落实
的方法。
背景技术
[0002]通常企业需要对上级领导单位下发的规章制度进行落地化处理。 处理过程为: 合
规部门发起, 由专人对下发的规章制度进行手动拆分, 将对应的外规下发给相关的部门负
责人。 相关部门负责人会通过人工手段将下发的外部规章制度在内部制度中进行查找, 如
果查找到, 提交对应的内规条目及内规全文附件, 交给合规部门进 行审核。 经合规部门审核
后, 如过确认无误, 流程结束。 如果相关部门负责人找 不到对应的内规, 则由合规部门发起,
相应部门去 按照外部规章在内部进行落实。 现有技 术通常存在以下缺 点:
[0003](1)人工对比的对比效率过低, 具体表 现在人员需要手动调取内部规章制度, 与外
部规章制度文件进行肉眼逐一匹配, 使得时间人力成本大 大增加。
[0004](2)人工对比的匹配程度高低没有一套标准去衡量, 受主观人为因素影响从而造
成匹配效果 不稳定。
[0005](3)人工对比特别依赖专家的经验以及专家的信任度, 有可能出现专家离职现象,
导致无法正常运行。
[0006]因此, 一种外部规章制度在企业内部执行落实的方法成为整个社会亟待解决的问
题。
发明内容
[0007]为解决上述技术问题, 本发明提供的技术方案为: 一种外部规章制度在企业内部
执行落实的方法, 包括以下步骤,
[0008](1)文件拆分模块, 系统通过自定义 正则进行文本拆分, 将文本拆分为段落;
[0009](2)词库扩展, 采用了四个模块来处理, 分别是分词自定义模块, 同义词 补充模块,
缩略词补充模块和停用词补充模块;
[0010](3)文本匹配度计算, 系统将 段落文本进行智能分词, 加载词库 扩展模块对分词进
行过滤, 根据T extRank算法得出关键词若干个, 找出与每条外规匹配度较高的多个内规, 包
括以下子步骤:
[0011]a、 首先需要将段落文本通过jieba分词工具进行智能分词, 将分词结果通过我们
自定义的词语过滤模块进 行过滤, 词语过滤模块包括了词性过滤, 同义词过滤, 停用词过滤
和缩略词过 滤四部分;
[0012]b、 将分词结果通过TextRank算法分别计算出每段文本最有影响力的若干词语, 假
设外部规章制度关键词与内部规章制度关键词集合交集的数量为N, 外部规章制度文本段
落的关键词数量为M, 即N/M作为两段文本之间的匹配度, 将匹配度进 行排序, 即可得到与外
部规章制度匹配度较高的多个内部规 章制度。说 明 书 1/3 页
3
CN 114528829 A
3
专利 一种外部规章制度在企业内部执行落实的方法
文档预览
中文文档
7 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 20:07:24上传分享