说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211185596.8 (22)申请日 2022.09.28 (71)申请人 北京长河数智科技有限责任公司 地址 100071 北京市丰台区汽车博物馆西 路8号院3号楼7层70 5 申请人 山西长河科技股份有限公司 (72)发明人 张煇 杨勇 冯向阳 马小娴  (74)专利代理 机构 北京法筑知识产权代理有限 公司 1610 0 专利代理师 沈建华 (51)Int.Cl. G06Q 10/10(2012.01) G06F 40/166(2020.01) G06F 40/295(2020.01) (54)发明名称 政务数据智能审核方法及装置 (57)摘要 本发明涉及数据处理技术领域, 一种政务数 据智能审核方法及装置, 包括: 接收编辑员编辑 的待发布政务文本, 将所述待发布政务文本按照 语句结构执行拆分, 得到结构化政务词组, 将所 述结构化政务词组输入至命名实体识别模型得 到命名实体识别集, 对所述命名实体识别集执行 智能审核, 得到是否允许发布的审核结果。 本发 明可以解决过于依赖人工审核政务数据造成人 力资源浪费的问题。 权利要求书4页 说明书13页 附图2页 CN 115271686 A 2022.11.01 CN 115271686 A 1.一种政务数据智能审核方法, 其特 征在于, 所述方法包括: 接收编辑员编辑的待发布政务文本, 将所述待发布政务文本按照语句结构执行拆分, 得到结构化政务词组; 将所述结构化政务词组输入至命名实体识别模型, 其中所述命名实体识别模型包括词 向量层、 第一特 征提取层、 第二特 征提取层 及命名识别预测层; 利用所述词向量层将结构化政务词组转为结构化政务向量集, 其中词向量层由 Word2Vec组成; 利用所述第 一特征提取层对结构化政务向量集执行第 一特征提取, 得到第 一政务矩阵 集; 利用所述第二特征提取层对第一政务矩阵集执行第二特征提取, 得到第二政务矩阵 集, 其中第二特 征提取方法为: 利用第二特征提取层中预先内置的三组权重矩阵, 依次与第 一政务矩阵集中每个第 一 政务矩阵执 行相乘, 得到对应的三组权 重政务矩阵; 将每个第一政务矩阵对应的三组权重政务矩阵执行自注意运算, 得到第二政务矩阵 集; 利用所述命名识别预测层预测第 二政务矩阵集中每个政务特征的命名实体, 得到命名 实体识别集; 对所述命名实体识别集执行智能审核, 得到是否允许发布的审核结果, 其中智能审核 包括: 接收预收集的禁止发布文本集, 其中禁止发布文本集中每个禁止发布文本均包括敏感 实体; 依次计算所述命名实体识别集中每 个命名实体在禁止发布文本集中的权 重; 当存在权重大于或等于阈值权重时的命名实体时, 表示审核未通过, 在所述待发布政 务文本中标记出权 重大于阈值权 重的命名实体, 以提醒编辑员重新 修改待发布政务文本; 直至不存在权重大于或等于阈值权重的命名实体时, 表示审核通过, 允许待发布政务 文本或完成修改的待发布政务文本执 行发布操作。 2.如权利要求1所述的政务数据智能审核方法, 其特征在于, 所述将所述待发布政务文 本按照语句结构执 行拆分, 得到结构化政务词组, 包括: 识别所述待发布政务文本的标点符号, 并基于所述识别的标点符号切分待发布政务文 本, 得到待发布政务语句; 基于分词模型对所述待发布政务语句执 行分词操作, 得到待发布政务词语; 去除待发布政务词语中的停用词, 得到所述结构化政务词组。 3.如权利要求1所述的政务数据智能审核方法, 其特征在于, 所述命名实体识别模型识 别出的命名实体包括 五大类, 分别为: 政府部门名称实体、 公司名称实体、 农植物名称实体、 道路交通名称实体及产品名称实体。 4.如权利要求1所述的政务数据智能审核方法, 其特征在于, 所述利用所述第 一特征提 取层对结构化政务向量 集执行第一特 征提取, 得到第一政务矩阵集, 包括: 按照结构化政务向量集中每个向量在待发布政务文本 中的文本顺序, 依次提取每个结 构化政务向量, 并执 行下述操作:权 利 要 求 书 1/4 页 2 CN 115271686 A 2其中, 表示 时刻输入至第一特征提取层的结构化政务向量, 为sigmod 激活函数, tanh为双曲正切激活函数, 分别表示 时刻的输入门、 忘记门、 输出门、 记忆细胞 的状态值, 表示不同控制门对应的权重矩阵, 表示不同控制门对应的偏置向量, 表示执行第一特征提取所产生的中间 状态值, 表示点乘运算, 表示与 对应的第一政务矩阵; 汇集所生成的所有第一政务矩阵, 得到所述第一政务矩阵集。 5.如权利要求1所述的政务数据智能审核方法, 其特征在于, 所述利用第 二特征提取层 中预先内置的三组权重矩阵, 依 次与第一政务矩阵集中每个第一政务矩阵执行相乘, 得到 对应的三组权 重政务矩阵, 包括: 采用如下公式计算得到三组 其中, 表示第一政务矩阵集中第 个第一政务矩阵, 表示根据第 个第一政务矩阵 生成的问题矩阵, 表示根据第 个第一政务矩阵生成的搭配矩阵, 表示根据第 个第一 政务矩阵生成的信息矩阵, 问题矩阵、 搭配矩阵及信息矩阵统称三组权重政务矩阵, 分别为问题 矩阵、 搭配矩阵及信息矩阵的权 重矩阵。 6.如权利要求5所述的政务数据智能审核方法, 其特征在于, 所述将每个第 一政务矩阵 对应的三组权 重政务矩阵执 行自注意 运算, 得到第二政务矩阵集, 包括: 依次计算每 个问题矩阵与其 他所有的搭配矩阵的乘积, 得到多组回答矩阵; 将多组回答矩阵与其 他所有的信息矩阵执 行相加, 得到所述第二政务矩阵集。 7.如权利要求6所述的政务数据智能审核方法, 其特征在于, 所述依次计算每个问题矩 阵与其他所有的搭配矩阵的乘积, 得到多组回答矩阵, 包括: 采用如下 方法计算得到每组回答矩阵: 其中, 表示第 个第一政务矩阵的问题矩阵与第 个第一政务矩阵的搭配矩阵的回 答矩阵, 表示第 个第一政务矩阵的搭配矩阵, 为第 个第一政务矩阵的问题矩阵的矩 阵维度。权 利 要 求 书 2/4 页 3 CN 115271686 A 3

PDF文档 专利 政务数据智能审核方法及装置

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 政务数据智能审核方法及装置 第 1 页 专利 政务数据智能审核方法及装置 第 2 页 专利 政务数据智能审核方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:29:12上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。