(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211310123.6
(22)申请日 2022.10.25
(71)申请人 税友信息技 术有限公司
地址 310053 浙江省杭州市滨江区浦沿街
道南环路3738号
(72)发明人 毕艳辉 王雄飞 丁乐 刘子星
王伟 徐煌
(74)专利代理 机构 北京集佳知识产权代理有限
公司 11227
专利代理师 姚文杰
(51)Int.Cl.
G06F 16/215(2019.01)
G06F 16/2458(2019.01)
G06N 20/00(2019.01)
(54)发明名称
一种会计科目数据标准化方法、 装置、 设备、
存储介质
(57)摘要
本申请公开了一种会计科目数据标准化方
法、 装置、 设备、 存储介质, 涉及会计科目技术领
域, 包括: 获取经过数据清洗操作后的原始会计
科目数据; 从原始会计科目数据中筛选出科目条
件不与标准科目条件一致的原始会计科目数据
作为待预测会计科目数据; 将待预测会计科目数
据输入至目标数据预测模型进行预测, 并确定每
一待预测会计科目数据的会计科目结果的结果
概率; 将结果概率大于预设阈值的会计科目结果
输出, 完成会计科目数据的标准化。 由于会计科
目数据的科目条件属于文本或可转换成文本, 因
此, 可采用训练数据预测模型作为目标数据预测
模型对经过筛选的原始会计科目数据进行结果
预测, 解决会计科目对应的问题, 完成会计科目
数据的标准 化。
权利要求书2页 说明书12页 附图5页
CN 115481118 A
2022.12.16
CN 115481118 A
1.一种会计科目数据标准 化方法, 其特 征在于, 包括:
获取经过数据清洗操作后的原 始会计科目数据;
从所述原始会计科目数据中筛选出科目条件不与标准科目条件一致的所述原始会计
科目数据作为待预测会计科目数据;
将所述待预测会计科目数据输入至目标数据 预测模型进行预测, 并确定每一所述待预
测会计科目数据的会计科目结果的结果 概率;
将所述结果 概率大于预设阈值的会计科目结果输出, 完成会计科目数据的标准 化。
2.根据权利要求1所述的会计科目数据标准化方法, 其特征在于, 所述获取经过数据清
洗操作后的原 始会计科目数据之后, 还 包括:
将所述原始会计科目数据输入至训练后的DSSM模型进行校正, 以便获取所述原始会计
科目数据校正后的科目类型与科目方向。
3.根据权利要求1所述的会计科目数据标准化方法, 其特征在于, 所述从所述原始会计
科目数据中筛选出科目条件不与标准科目条件一致的所述原始会计科目数据作为待预测
会计科目数据, 包括:
从所述原始会计科目数据中筛选出科目名称与 标准科目名称不一致、 科目代码与 标准
科目代码均不 一致的所述原 始会计科目数据作为待预测会计科目数据。
4.根据权利要求1所述的会计科目数据标准化方法, 其特征在于, 所述将所述待预测会
计科目数据输入至目标 数据预测模型进行 预测之前, 还 包括:
利用携带样本标签的历史会计科目数据对原始BERT模型进行训练, 以得到目标数据预
测模型。
5.根据权利要求4所述的会计科目数据标准化方法, 其特征在于, 所述利用携带样本标
签的历史会计科目数据对原 始BERT模型进行训练之前, 还 包括:
基于预设加权算法模型确定历史会计科目数据的各个标签可信度的权 重;
基于所述权重、 各历史会计科目数据的企业性质以及各历史会计科目出现次数, 对数
据清洗后的历史会计科目数据进 行标签可信度的计算, 得到所述历史会计科目数据的各个
标签可信度值;
从所有标签可信度值中筛选出最大可信度值的标签作为所述历史会计科目数据的样
本标签。
6.根据权利要求1所述的会计科目数据标准化方法, 其特征在于, 所述确定每一所述待
预测会计科目数据的会计科目结果的结果 概率之后, 还 包括:
计算待预测会计科目数据的科目条件与对应的标准科目条件之间的相似度, 并对所述
结果概率与所述相似度进行加权计算, 以得到目标 结果概率。
7.根据权利要求6所述的会计科目数据标准化方法, 其特征在于, 所述对所述结果概率
与所述相似度进行加权计算, 以得到目标 结果概率之后, 还 包括:
比较所述目标 结果概率与预设阈值的大小关系;
若所述目标结果概率大于和/或等于预设阈值, 则将所述目标结果概率对应的会计科
目结果输出, 完成会计科目数据的标准 化;
若所述目标结果概率小于预设阈值, 则将所述待预测会计科目数据的会计科目结果设
置为其他科目结果并输出, 完成会计科目数据的标准 化。权 利 要 求 书 1/2 页
2
CN 115481118 A
28.一种会计科目数据标准 化装置, 其特 征在于, 包括:
数据获取模块, 用于获取 经过数据清洗操作后的原 始会计科目数据;
数据筛选模块, 用于从所述原始会计科目数据中筛选出科目条件不与标准科目条件一
致的所述原 始会计科目数据作为待预测会计科目数据;
结果预测模块, 用于将所述待预测会计科目数据输入至目标数据预测模型进行预测,
并确定每一所述待预测会计科目数据的会计科目结果的结果 概率;
结果输出模块, 用于将所述结果概率大于预设阈值的会计科目结果输出, 完成会计科
目数据的标准 化。
9.一种电子设备, 其特 征在于, 包括:
存储器, 用于保存计算机程序;
处理器, 用于执行所述计算机程序, 以实现如权利要求1至7任一项所述的会计科目数
据标准化方法的步骤。
10.一种计算机可读存储介质, 其特征在于, 用于存储计算机程序; 其中, 所述计算机程
序被处理器执行时实现如权利要求1至7任一项所述的会计科目数据标准 化方法的步骤。权 利 要 求 书 2/2 页
3
CN 115481118 A
3
专利 一种会计科目数据标准化方法、装置、设备、存储介质
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:30:05上传分享