全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210692483.0 (22)申请日 2022.06.17 (71)申请人 大拓(山东)物联网科技有限公司 地址 266000 山东省青岛市黄岛区太行山 路11号名嘉国际1号楼140 3室 申请人 惠州永惠智能科技有限公司 (72)发明人 田越 周建东 吴得泱 杜锟  曾峰  (74)专利代理 机构 深圳市世联合知识产权代理 有限公司 4 4385 专利代理师 杨晖琼 (51)Int.Cl. G06V 20/62(2022.01) G06V 30/414(2022.01) G06V 30/18(2022.01)G06V 30/19(2022.01) G06V 30/166(2022.01) G06V 30/162(2022.01) G06V 30/164(2022.01) G06V 10/80(2022.01) G06V 10/40(2022.01) G06V 10/30(2022.01) G06V 10/82(2022.01) G06V 10/32(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 文字检测方法、 装置、 计算机设备及存储介 质 (57)摘要 本申请实施例属于数据处理技术领域, 涉及 一种文字检测方法、 装置、 计算机设备及存储介 质, 文字检测方法包括: 获取目标图片对应的融 合特征图; 将融合特征图输入卷积网络, 获取目 标图片的字符偏移图、 字符分布图、 单词分布图、 单词中心线 图; 根据字符偏移图、 单词分布图以 及字符分布图确定多边形包围框; 将与单词中心 线图有交集的多边形包围框对应的区域, 识别为 文字区域; 解码文字区域, 得到目标图片对应的 文字检测结果。 本申请能够提高文字检测结果的 准确性。 权利要求书2页 说明书10页 附图5页 CN 115273054 A 2022.11.01 CN 115273054 A 1.一种文字检测方法, 其特 征在于, 包括下述 步骤: 获取目标图片对应的融合特 征图; 将所述融合特征图输入卷积网络, 获取所述目标图片的字符偏移图、 字符分布图、 单词 分布图、 单词中心线图; 根据所述字符偏移图、 所述单词分布图以及所述字符分布图确定多边形包围框; 将与所述单词中心线图有交集的所述多边形包围框对应的区域, 识别为文字区域; 解码所述文字区域, 得到所述目标图片对应的文字检测结果。 2.根据权利要求1所述的文字检测方法, 其特征在于, 所述获取目标图片对应的融合特 征图, 包括: 获取目标图片; 采用ResNet5 0特征提取器对所述目标图片进行 特征提取, 得到 至少一个初始特 征图; 使用上采样方式对所述初始特 征图进行 特征融合处 理, 得到融合特 征图。 3.根据权利 要求2所述的文字检测方法, 其特征在于, 在采用ResNet50特征提取器对所 述目标图片进行 特征提取, 得到 至少一个初始特 征图之前, 所述文字检测方法还 包括: 对所述目标图像进行缩放处 理和归一 化处理。 4.根据权利要求1所述的文字检测方法, 其特征在于, 所述根据所述字符偏移图、 所述 单词分布图以及所述字符分布图确定多边形包围框, 包括: 对所述单词分布图进行二 值化处理, 得到第一单词分布图; 根据所述第 一单词分布图对所述字符偏移图和所述字符分布图进行 噪声过滤, 得到第 一字符偏移图和第一字符分布图; 对所述第一字符偏移图进行二 值化处理, 得到第二字符偏移图; 对所述第二字符偏移图和所述第一单词分布图进行取差值处理, 得到综合单词分布 图; 从第一字符分布图中提取多个字符特 征点坐标; 根据所述字符特 征点坐标和所述综合单词分布图, 确定多边形包围框 。 5.根据权利要求1所述的文字检测方法, 其特征在于, 所述将与 所述单词中心线图有交 集的所述多边形包围框对应的区域, 识别为文字区域, 包括: 根据第一单词分布图对所述单词中心线图进行噪声过滤, 得到第一单词中心线图; 所 述第一单词分布图为对所述单词分布图进行二 值化处理得到的; 对所述第一单词中心线图进行二 值化处理, 得到第二单词中心线图; 将与所述第二单词中心线图有交集的多边形包围框对应的区域, 识别为文字区域。 6.根据权利要求1所述的文字检测方法, 其特征在于, 在将所述融合特征图输入卷积网 络, 获取所述目标图片的字符偏移图、 字符分布图、 单词分布图、 单词中心线图之前, 所述文 字检测方法还 包括: 以历史图片的历史融合特征图作为输入, 历史字符偏移图、 历史字符分布图、 历史单词 分布图、 历史单词中心线图作为输出, 采用弱监督策略和预设卷积网络模型训练得到所述 卷积网络 。 7.一种文字检测装置, 其特 征在于, 包括: 第一获取模块, 用于获取目标图片对应的融合特 征图;权 利 要 求 书 1/2 页 2 CN 115273054 A 2第二获取模块, 用于将所述融合特征图输入卷积网络, 获取所述目标图片的字符偏移 图、 字符分布图、 单词分布图、 单词中心线图; 确定模块, 用于根据所述字符偏移图、 所述单词分布图以及所述字符分布图确定多边 形包围框; 文字识别模块, 用于将与所述单词中心线图有交集的所述多边形包围框对应的区域, 识别为文字区域; 文字解码模块, 用于解码所述文字区域, 得到所述目标图片对应的文字检测结果。 8.根据权利要求7所述的文字检测装置, 其特征在于, 所述第 一获取模块包括获取子模 块、 提取子模块以及第一处 理子模块; 所述获取子模块, 用于获取目标图片; 所述提取子模块, 用于采用ResNet50特征提取器对所述目标图片进行特征提取, 得到 至少一个初始特 征图; 所述第一处理子模块, 用于使用上采样方式对所述初始特征图进行特征融合处理, 得 到融合特 征图。 9.一种计算机设备, 包括存储器和处理器, 所述存储器中存储有计算机程序, 所述处理 器执行所述计算机程序时实现如权利要求1至 6中任一项所述的文字检测方法的步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有计算机 程序, 所述计算机程序被处理器执行时实现如权利要求 1至6中任一项 所述的文字检测方法 的步骤。权 利 要 求 书 2/2 页 3 CN 115273054 A 3

.PDF文档 专利 文字检测方法、装置、计算机设备及存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文字检测方法、装置、计算机设备及存储介质 第 1 页 专利 文字检测方法、装置、计算机设备及存储介质 第 2 页 专利 文字检测方法、装置、计算机设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:31:08上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。