(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211362565.5
(22)申请日 2022.11.02
(71)申请人 科大讯飞股份有限公司
地址 230088 安徽省合肥市高新 开发区望
江西路666号
(72)发明人 吴嘉嘉 张银田 殷兵 胡金水
刘聪
(74)专利代理 机构 北京布瑞知识产权代理有限
公司 11505
专利代理师 尚文文
(51)Int.Cl.
G06V 30/413(2022.01)
G06V 30/18(2022.01)
G06V 10/82(2022.01)
G06N 3/08(2006.01)G06N 3/04(2006.01)
(54)发明名称
一种表格识别方法、 装置、 设备及存 储介质
(57)摘要
本申请提供了一种表格识别方法、 装置、 设
备及存储介质, 具体实现方案为: 从待测图像中
检测确定表格区域; 基于所述表格区域确定对应
的文本特征和位置特征; 对所述文本特征和所述
位置特征进行融合得到表格特征; 利用所述表格
特征确定 所述待测图像中的表格识别结果。 根据
本申请的技 术方案, 能够准确地识别表格 。
权利要求书2页 说明书9页 附图5页
CN 115546815 A
2022.12.30
CN 115546815 A
1.一种表格识别方法, 其特 征在于, 包括:
从待测图像中检测 确定表格区域;
基于所述表格区域确定对应的文本特 征和位置特 征;
对所述文本特 征和所述 位置特征进行融合得到表格特 征;
利用所述表格特 征确定所述待测图像中的表格识别结果。
2.根据权利要求1所述的方法, 其特征在于, 所述基于所述表格区域确定对应的文本特
征和位置特 征, 包括:
确定所述表格区域中的每一表格元素对应的文本特征和位置特征; 所述表格元素包括
单元格和/或文本行。
3.根据权利要求2所述的方法, 其特征在于, 在所述表格元素包括单元格和文本行的情
况下, 所述确定所述表格区域中的每一表格元 素对应的文本特 征和位置特 征, 包括:
在所述表格区域中分别确定单 元格检测结果和文本行检测结果;
基于所述单 元格检测结果确定对应的文本特 征和位置特 征;
基于所述文本行检测结果确定对应的文本特 征和位置特 征。
4.根据权利要求2所述的方法, 其特征在于, 在所述表格元素包括单元格的情况下, 所
述对所述文本特 征和所述 位置特征进行融合得到表格特 征, 包括:
针对每一单元格, 将所述单元格对应的文本特征和位置特征进行拼接处理, 得到所述
单元格对应的表格特 征。
5.根据权利要求2所述的方法, 其特征在于, 所述表格元素包括文本行的情况下, 所述
对所述文本特 征和所述 位置特征进行融合得到表格特 征, 包括:
针对每一文本行, 将所述文本行对应的文本特征和位置特征进行拼接处理, 得到所述
文本行对应的表格特 征。
6.根据权利要求1所述的方法, 其特征在于, 其中, 所述文本特征包括: 文本格 式特征和
语义特征;
相应地, 所述对所述文本特 征和所述 位置特征进行融合得到表格特 征, 包括:
对所述文本格式特 征、 所述语义特 征和所述 位置特征进行融合得到表格特 征。
7.根据权利要求1所述的方法, 其特征在于, 所述利用所述表格特征确定所述待测图像
中的表格识别结果, 包括:
将所述表格特 征确定表格的预测序列;
根据所述预测序列确定所述待测图像中的表格拓扑 结构。
8.一种表格识别装置, 其特 征在于, 包括:
确定模块, 用于从待测图像中检测 确定表格区域;
处理模块, 用于基于所述表格区域确定对应的文本特 征和位置特 征;
融合模块, 用于对所述文本特 征和所述 位置特征进行融合得到表格特 征;
识别模块, 用于利用所述表格特 征确定所述待测图像中的表格识别结果。
9.一种电子设备, 其特 征在于, 包括:
存储器和处 理器;
所述存储器与所述处 理器连接, 用于存 储程序;
所述处理器, 通过运行所述存储器中的程序, 实现如权利要求1至7中任意一项表格识权 利 要 求 书 1/2 页
2
CN 115546815 A
2别方法。
10.一种存储介质, 其特征在于, 所述存储介质上存储有计算机程序, 所述计算机程度
被处理器运行时, 实现如权利要求1至7中任意 一项表格识别方法。权 利 要 求 书 2/2 页
3
CN 115546815 A
3
专利 一种表格识别方法、装置、设备及存储介质
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:23:59上传分享