(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211185596.8
(22)申请日 2022.09.28
(71)申请人 北京长河数智科技有限责任公司
地址 100071 北京市丰台区汽车博物馆西
路8号院3号楼7层70 5
申请人 山西长河科技股份有限公司
(72)发明人 张煇 杨勇 冯向阳 马小娴
(74)专利代理 机构 北京法筑知识产权代理有限
公司 1610 0
专利代理师 沈建华
(51)Int.Cl.
G06Q 10/10(2012.01)
G06F 40/166(2020.01)
G06F 40/295(2020.01)
(54)发明名称
政务数据智能审核方法及装置
(57)摘要
本发明涉及数据处理技术领域, 一种政务数
据智能审核方法及装置, 包括: 接收编辑员编辑
的待发布政务文本, 将所述待发布政务文本按照
语句结构执行拆分, 得到结构化政务词组, 将所
述结构化政务词组输入至命名实体识别模型得
到命名实体识别集, 对所述命名实体识别集执行
智能审核, 得到是否允许发布的审核结果。 本发
明可以解决过于依赖人工审核政务数据造成人
力资源浪费的问题。
权利要求书4页 说明书13页 附图2页
CN 115271686 A
2022.11.01
CN 115271686 A
1.一种政务数据智能审核方法, 其特 征在于, 所述方法包括:
接收编辑员编辑的待发布政务文本, 将所述待发布政务文本按照语句结构执行拆分,
得到结构化政务词组;
将所述结构化政务词组输入至命名实体识别模型, 其中所述命名实体识别模型包括词
向量层、 第一特 征提取层、 第二特 征提取层 及命名识别预测层;
利用所述词向量层将结构化政务词组转为结构化政务向量集, 其中词向量层由
Word2Vec组成;
利用所述第 一特征提取层对结构化政务向量集执行第 一特征提取, 得到第 一政务矩阵
集;
利用所述第二特征提取层对第一政务矩阵集执行第二特征提取, 得到第二政务矩阵
集, 其中第二特 征提取方法为:
利用第二特征提取层中预先内置的三组权重矩阵, 依次与第 一政务矩阵集中每个第 一
政务矩阵执 行相乘, 得到对应的三组权 重政务矩阵;
将每个第一政务矩阵对应的三组权重政务矩阵执行自注意运算, 得到第二政务矩阵
集;
利用所述命名识别预测层预测第 二政务矩阵集中每个政务特征的命名实体, 得到命名
实体识别集;
对所述命名实体识别集执行智能审核, 得到是否允许发布的审核结果, 其中智能审核
包括:
接收预收集的禁止发布文本集, 其中禁止发布文本集中每个禁止发布文本均包括敏感
实体;
依次计算所述命名实体识别集中每 个命名实体在禁止发布文本集中的权 重;
当存在权重大于或等于阈值权重时的命名实体时, 表示审核未通过, 在所述待发布政
务文本中标记出权 重大于阈值权 重的命名实体, 以提醒编辑员重新 修改待发布政务文本;
直至不存在权重大于或等于阈值权重的命名实体时, 表示审核通过, 允许待发布政务
文本或完成修改的待发布政务文本执 行发布操作。
2.如权利要求1所述的政务数据智能审核方法, 其特征在于, 所述将所述待发布政务文
本按照语句结构执 行拆分, 得到结构化政务词组, 包括:
识别所述待发布政务文本的标点符号, 并基于所述识别的标点符号切分待发布政务文
本, 得到待发布政务语句;
基于分词模型对所述待发布政务语句执 行分词操作, 得到待发布政务词语;
去除待发布政务词语中的停用词, 得到所述结构化政务词组。
3.如权利要求1所述的政务数据智能审核方法, 其特征在于, 所述命名实体识别模型识
别出的命名实体包括 五大类, 分别为: 政府部门名称实体、 公司名称实体、 农植物名称实体、
道路交通名称实体及产品名称实体。
4.如权利要求1所述的政务数据智能审核方法, 其特征在于, 所述利用所述第 一特征提
取层对结构化政务向量 集执行第一特 征提取, 得到第一政务矩阵集, 包括:
按照结构化政务向量集中每个向量在待发布政务文本 中的文本顺序, 依次提取每个结
构化政务向量, 并执 行下述操作:权 利 要 求 书 1/4 页
2
CN 115271686 A
2其中,
表示
时刻输入至第一特征提取层的结构化政务向量,
为sigmod 激活函数,
tanh为双曲正切激活函数,
分别表示
时刻的输入门、 忘记门、 输出门、 记忆细胞
的状态值,
表示不同控制门对应的权重矩阵,
表示不同控制门对应的偏置向量,
表示执行第一特征提取所产生的中间
状态值,
表示点乘运算,
表示与
对应的第一政务矩阵;
汇集所生成的所有第一政务矩阵, 得到所述第一政务矩阵集。
5.如权利要求1所述的政务数据智能审核方法, 其特征在于, 所述利用第 二特征提取层
中预先内置的三组权重矩阵, 依 次与第一政务矩阵集中每个第一政务矩阵执行相乘, 得到
对应的三组权 重政务矩阵, 包括:
采用如下公式计算得到三组
其中,
表示第一政务矩阵集中第
个第一政务矩阵,
表示根据第
个第一政务矩阵
生成的问题矩阵,
表示根据第
个第一政务矩阵生成的搭配矩阵,
表示根据第
个第一
政务矩阵生成的信息矩阵, 问题矩阵、 搭配矩阵及信息矩阵统称三组权重政务矩阵,
分别为问题 矩阵、 搭配矩阵及信息矩阵的权 重矩阵。
6.如权利要求5所述的政务数据智能审核方法, 其特征在于, 所述将每个第 一政务矩阵
对应的三组权 重政务矩阵执 行自注意 运算, 得到第二政务矩阵集, 包括:
依次计算每 个问题矩阵与其 他所有的搭配矩阵的乘积, 得到多组回答矩阵;
将多组回答矩阵与其 他所有的信息矩阵执 行相加, 得到所述第二政务矩阵集。
7.如权利要求6所述的政务数据智能审核方法, 其特征在于, 所述依次计算每个问题矩
阵与其他所有的搭配矩阵的乘积, 得到多组回答矩阵, 包括:
采用如下 方法计算得到每组回答矩阵:
其中,
表示第
个第一政务矩阵的问题矩阵与第
个第一政务矩阵的搭配矩阵的回
答矩阵,
表示第
个第一政务矩阵的搭配矩阵,
为第
个第一政务矩阵的问题矩阵的矩
阵维度。权 利 要 求 书 2/4 页
3
CN 115271686 A
3
专利 政务数据智能审核方法及装置
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:29:12上传分享