(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211302562.2
(22)申请日 2022.10.24
(71)申请人 中国银行股份有限公司
地址 100818 北京市西城区复兴门内大街1
号
(72)发明人 张航宇 赵文武
(74)专利代理 机构 北京三友知识产权代理有限
公司 11127
专利代理师 童磊 徐焕
(51)Int.Cl.
G06F 16/903(2019.01)
G06F 16/2455(2019.01)
(54)发明名称
一种金额字符串的识别方法及装置
(57)摘要
本发明公开了一种金额字符串的识别方法
及装置, 可用于金融领域或其他领域, 该方法包
括: 获取待识别的目标金额字符串; 确定出目标
金额字符串中的各个字 符; 根据目标金额字符串
中的各个字符, 进行识别规则匹配, 得到对应的
目标匹配结果; 根据目标匹配结果, 对目标金额
字符串进行相应的金额数值识别。 本发明可以构
建识别规则并对识别规则进行匹配, 最后使用得
到的目标匹配结果对目标业务场景下的多种类
型的金额字符串的准确识别。
权利要求书2页 说明书8页 附图3页
CN 115525805 A
2022.12.27
CN 115525805 A
1.一种金额字符串的识别方法, 其特 征在于, 包括:
获取待识别的目标 金额字符串;
确定出目标 金额字符串中的各个字符;
根据目标 金额字符串中的各个字符, 进行识别规则匹配, 得到对应的目标匹配结果;
根据目标匹配结果, 对目标 金额字符串 进行相应的金额数值识别。
2.根据权利要求1所述的方法, 其特 征在于, 确定出目标 金额字符中的各个字符, 包括:
利用预设的字符表对目标金额字符串中的各个字符图形进行比对, 根据比对结果, 确
定出目标 金额字符串中的各个字符。
3.根据权利要求1所述的方法, 其特征在于, 根据目标金额字符串中的各个字符, 进行
识别规则匹配, 得到对应的目标匹配结果, 包括:
获取各个字符的附加状态;
根据目标金额字符串中的各个字符, 以及各个字符的附加状态, 从预设的规则库中确
定出相匹配的目标识别规则, 以得到对应的目标匹配结果; 其中, 所述预设的规则库包括针
对目标业 务场景的多个识别规则。
4.根据权利要求3所述的方法, 其特 征在于, 所述预设的规则库按照以下 方式构建:
获取目标业 务场景下的历史金额字符串;
根据历史金额字符串, 确定目标业 务场景下的金额字符串的格式类型;
根据目标业务场景下的金额字符串的格式类型, 构建针对目标业务场景的多个识别规
则, 以建立预设的规则库。
5.根据权利要求4所述的方法, 其特征在于, 所述格 式类型包括以下至少之一: 百分位/
千分位间隔型、 数字与量词组合型、 科 学计数型。
6.根据权利要求3所述的方法, 其特征在于, 根据目标匹配结果, 对目标金额字符串进
行相应的金额数值识别, 包括:
在目标匹配结果包括一个目标识别规则的情况下, 利用目标识别规则对目标金额字符
进行金额数值识别, 得到金额数值识别结果, 作为目标 金额字符串所表征的目标 金额数值。
7.根据权利要求6所述的方法, 其特征在于, 根据目标匹配结果, 对目标金额字符串进
行相应的金额数值识别, 还 包括:
在目标匹配结果包括多个目标识别规则的情况下, 利用多个目标识别规则分别对目标
金额字符串 进行金额数值识别, 得到多个金额数值识别结果;
根据多个金额数值识别结果, 确定出目标 金额字符串的目标 金额数值。
8.根据权利要求6所述的方法, 其特征在于, 根据目标匹配结果, 对目标金额字符串进
行相应的金额数值识别, 还 包括:
在目标匹配结果 为空的情况 下, 生成报错 提示。
9.一种金额字符串的识别装置, 其特 征在于, 包括:
获取模块, 用于获取待识别的目标 金额字符串;
比对模块, 用于确定出目标 金额字符串中的各个字符;
匹配模块, 用于根据目标金额字符串中的各个字符, 进行识别规则匹配, 得到对应的目
标匹配结果;
识别模块, 用于根据目标匹配结果, 对目标 金额字符串 进行相应的金额数值识别。权 利 要 求 书 1/2 页
2
CN 115525805 A
210.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计
算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至8任一所述方
法。
11.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机程
序, 所述计算机程序被处 理器执行时实现权利要求1至8任一所述方法。
12.一种计算机程序产品, 其特征在于, 所述计算机程序产品包括计算机程序, 所述计
算机程序被处 理器执行时实现权利要求1至8任一所述方法。权 利 要 求 书 2/2 页
3
CN 115525805 A
3
专利 一种金额字符串的识别方法及装置
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 00:49:44上传分享