(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111662605.3
(22)申请日 2021.12.3 0
(71)申请人 福建亿能达信息技 术股份有限公司
地址 350000 福建省福州市 鼓楼区软件大
道89号福州软件园A区28号楼二层
(72)发明人 黄家昌 应佳良 杨辉 邱道椿
(74)专利代理 机构 福州市鼓楼区京华专利事务
所(普通合伙) 35212
专利代理师 王美花
(51)Int.Cl.
G06V 30/40(2022.01)
G06V 30/418(2022.01)
G06V 30/14(2022.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
G06Q 10/10(2012.01)
G06Q 50/18(2012.01)
(54)发明名称
一种合同规范性的审核方法、 装置、 设备和
介质
(57)摘要
本发明提供一种合同规范性的审核 方法、 装
置、 设备和介质, 方法包括: 接收到合同审核指
令, 获取合同文件的格式信息; 根据所述格式信
息判断是否可按照相应的编码格式直接获取文
字信息, 若是, 则直接读取文档内容, 若否, 则调
用光学字符识别模型获取文档内容, 形成全文内
容文本; 将所述全文内容文本与合同类型模板进
行正交比对, 确认合同所属的种类, 并根据种类
确认适用的审核模板; 调用适用的审核模板, 对
所述全文内容文本进行模板比对审核。 本发明可
以通过不同的合同文件格式来综合匹配不同的
方式以获取合同文件的内容文本并进行审核, 而
且既能小体量的光学字 符识别模 型, 从而提升模
型的识别速度, 又能保证模型的识别效果。
权利要求书3页 说明书8页 附图2页
CN 114511854 A
2022.05.17
CN 114511854 A
1.一种合同规范性的审核方法, 其特 征在于: 包括下述 步骤:
S1、 接收到合同审核指令, 获取合同文件的格式信息;
S2、 根据所述格 式信息判断是否可按照相应的编码格 式直接获取文字信息, 若是, 则直
接读取文档内容, 若否, 则调用光学字符识别模型获取文档内容, 形成全文内容文本;
S3、 将所述全文内容文本与合同类型模板进行正交比对, 确认合同所属的种类, 并根据
种类确认适用的审核模板, 所述审核模板包括一个或多个关键词、 各关键词使用的空间条
件以及各关键词的叙述 规范;
S4、 调用适用的审核模板, 对所述全文内容文本进行模板比对审核, 具体是: 将所述全
文内容文本与各 所述关键词进行一 一比对, 判断是否存在所述关键词;
若否, 则提 示需添加相关项;
若是, 进一步判断关键词是否满足所述空间条件, 若不满足, 则提示对于该审核项需要
清晰说明; 若满足, 则给出该合同涉及相关项且不违规的提示, 并根据所述叙述规范进一步
判断关键词叙述是否规范; 若不规范, 则直接提示不规范并显示规范要求; 若规范, 则提示
合同符合 规范。
2.根据权利要求1所述的一种合同规范性的审核方法, 其特征在于: 所述光学字符识别
模型为经过扫描合同数据集 强化训练好的智能模型, 所述光学字符识别模 型获取文档内容
的具体过程如下:
(1)、 通过 预处理模型对合同文件进行 预处理后并得到合同文件的预处 理图片;
(2)、 将预处理图片输入到空间模型中, 通过卷积、 池化、 激活函数提取空间潜层信息;
所述空间模 型在融合浅层信息和融合深层信息特征时, 均是采用一层1*1卷积层和一层3*3
或5*5的卷积层;
(3)、 将得到的空间潜层信息输入到时序模型中, 通过多层双向SRN层提取时序潜层信
息;
(4)、 根据时序潜层信息对输入的图片进行字符分类, 得到全文内容文本 。
3.根据权利要求2所述的一种合同规范性的审核方法, 其特征在于: 所述空间模型的构
成如下:
第一层是卷积层, 卷积核为5 ×5, 步长为2 ×2, 填充为2 ×2, 通道数为24, 激活函数为
ReLU;
第二层是卷积层, 卷积核为3 ×3, 步长为1 ×1, 填充为1 ×1, 通道数为24, 激活函数为
ReLU;
第三层是 卷积层, 卷积核为1 ×1, 步长为1 ×1, 通道数为128;
第四层是池化层, 核为2, 步长为2;
第五层是卷积层, 卷积核为3 ×3, 步长为1 ×1, 填充为1 ×1, 通道数为128, 归一化方法
为BN, 激活函数为ReLU;
第六层是 卷积层, 卷积核为1 ×1, 步长为1 ×1, 通道数为25 6, 归一化方法为BN;
第七层是卷积层, 卷积核为3 ×3或5×5, 步长为1 ×1, 填充为1 ×1, 通道数为256, 归一
化方法为BN, 激活函数为ReLU;
第八层是 卷积层, 卷积核为1 ×1, 步长为1 ×1, 通道数为25 6;
第九层是池化层, 核为2 ×2, 步长为2 ×1, 填充为0 ×1;权 利 要 求 书 1/3 页
2
CN 114511854 A
2第十层是卷积层, 卷积核为3 ×3, 步长为1 ×1, 填充为1 ×1, 通道数为256, 归一化方法
为BN, 激活函数为ReLU;
第十一层是 卷积层, 卷积核为1 ×1, 步长为1 ×1, 通道数为512, 归一 化方法为BN;
第十二层是卷积层, 卷积核为3 ×3或5×5, 步长为1 ×1, 填充为1 ×1, 通道数为512, 激
活函数为ReLU;
第十三层是 卷积层, 卷积核为1 ×1, 步长为1 ×1, 通道数为512;
第十四层是池化层, 核为2 ×2, 步长为2 ×1, 填充为0 ×1;
第十五层是卷积层, 卷积核为2 ×2, 步长为1 ×1, 填充为1 ×1, 通道数为512, 归一化方
法为BN, 激活函数为ReLU;
第十六层是 卷积层, 卷积核为1 ×1, 步长为1 ×1, 通道数为512, 归一 化方法为BN。
4.根据权利要求1所述的一种合同规范性的审核方法, 其特征在于: 所述 时序模型的构
成是:
第一层为双向SRN层, 节点数为25 6;
第二层为全连接层, 节点数为25 6:
第三层为双向SRN层, 节点数为25 6:
第四层为全连接层, 节点数为25 6。
5.一种合同规范性的审核装置, 其特 征在于: 包括:
格式判断模块, 用于在接收到合同审核指令后, 获取合同文件的格式信息;
文档内容获取模块, 用于根据 所述格式信 息判断是否可按照相应的编码格式直接获取
文字信息, 若 是, 则直接读取文档内容, 若否, 则调用光学字符识别模 型获取文档内容, 形成
全文内容文本;
审核规则确认模块, 用于将所述全文内容文本与合同类型模板进行正交比对, 确认合
同所属的种类, 并根据种类确认适用的审核模板, 所述审核模板包括一个或多个关键词、 各
关键词使用的空间条件以及各关键词的叙述 规范;
审核模块, 用于调用适用的审核模板, 对所述全文内容文本进行模板比对审核, 具体
是: 将所述全文内容文本与各 所述关键词进行一 一比对, 判断是否存在所述关键词;
若否, 则提 示需添加相关项;
若是, 进一步判断关键词是否满足所述空间条件, 若不满足, 则提示对于该审核项需要
清晰说明; 若满足, 则给出该合同涉及相关项且不违规的提示, 并根据所述叙述规范进一步
判断关键词叙述是否规范; 若不规范, 则直接提示不规范并显示规范要求; 若规范, 则提示
合同符合 规范。
6.根据权利要求5所述的一种合同规范性的审核装置, 其特征在于: 所述光学字符识别
模型为经 过扫描合同数据集强化训练好的智能模型, 具体包括:
预处理模型, 用于对合同文件进行 预处理后并得到合同文件的预处 理图片;
空间模型, 用于将预处理图片通过卷积、 池化、 激活函数提取空间潜层信息; 所述空间
模型在融合浅层信息和融合深层信息特征时, 均是采用一层1*1卷积层和一层3*3或5*5的
卷积层;
时序模型, 用于将得到的空间潜层信息通过多层 双向SRN层提取时序潜层信息;
嵌入层, 用于根据时序潜层信息对输入的图片进行字符分类, 得到全文内容文本 。权 利 要 求 书 2/3 页
3
CN 114511854 A
3
专利 一种合同规范性的审核方法、装置、设备和介质
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 20:06:31上传分享