(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211314465.5
(22)申请日 2022.10.22
(71)申请人 武汉烽火普天信息技 术有限公司
地址 430000 湖北省武汉市东湖开发区关
山二路附4号
(72)发明人 时磊 胡华 周逸聪 孙涛
郭鹏程
(74)专利代理 机构 武汉蓝宝石专利代理事务所
(特殊普通 合伙) 42242
专利代理师 尤路
(51)Int.Cl.
G06F 16/29(2019.01)
G06F 16/2452(2019.01)
G06F 16/2455(2019.01)
G06Q 50/06(2012.01)
(54)发明名称
一种细粒度地址匹配方法及系统
(57)摘要
本发明提供一种细粒度地址匹配方法及系
统, 该方法包括: 将地址库中存储的地址信息标
准化处理为地址串; 将待匹配地址信息拆分为关
键小区部分和楼栋号/门牌号两部分, 对两部分
进行细粒度的拆 分, 将拆分后的两部分地址合并
得到标准化地址; 将所述标准化地址与地址库中
的地址串逐级匹配, 得到相似的标准地址信息;
对所述标准地址信息和待匹配标准化地址进行
逐级加权, 将加权后的标准地址信息和待匹配标
准化地址进行相似度计算, 得到最相似的标准地
址, 并输出最相似的标准地址位置信息。 通过该
方案可以大大提升地址匹配速度和匹配准确度,
减少地址匹配 搜索处理的数据量。
权利要求书1页 说明书5页 附图2页
CN 115544197 A
2022.12.30
CN 115544197 A
1.一种细粒度地址匹配方法, 其特 征在于, 包括:
将地址库中存 储的地址信息标准 化处理为地址串;
将待匹配地址信息拆分为关键小区部分和楼栋号/门牌号两部分, 对两部分进行细粒
度的拆分, 将拆分后的两 部分地址合并得到标准 化地址;
将所述标准 化地址与地址库中的地址串逐级匹配, 得到相似的标准 地址信息;
对所述标准地址信 息和待匹配标准化地址进行逐级加权, 将加权后的标准地址信 息和
待匹配标准化地址进行相似度计算, 得到最相似的标准地址, 并输出最相似的标准地址位
置信息。
2.根据权利要求1所述的方法, 其特征在于, 所述将所述标准化地址与地址库中的地址
串逐级匹配, 得到相似的标准 地址信息包括:
将所述标准 化地址按地址串层级 进行逐层匹配, 输出 所有相匹配的标准 地址信息 。
3.根据权利要求1所述的方法, 其特征在于, 所述对所述标准地址信 息和待匹配标准化
地址进行 逐级加权, 将加权后的标准 地址信息和待匹配标准 化地址进行相似度计算包括:
预先设定不同层级地址权重值, 对相似的标准地址信 息进和待 匹配标准化地址分别进
行加权;
通过余弦相似度计算得到最相似的标准 地址。
4.一种细粒度地址匹配系统, 其特 征在于, 包括:
地址预处 理模块, 用于将地址库中存 储的地址信息标准 化处理为地址串
地址标准化模块, 用于将待匹配地址信息拆分为关键小区部分和楼栋号/门牌号两部
分, 对两部分进行细粒度的拆分, 将拆分后的两 部分地址合并得到标准 化地址;
地址筛选模块, 用于将所述标准化地址与地址库中的地址串逐级匹配, 得到相似的标
准地址信息;
地址推荐模块, 用于对所述标准地址信息和待匹配标准化地址进行逐级加权, 将加权
后的标准地址信息和待匹配标准化地址进行相似度计算, 得到最相似的标准地址, 并输出
最相似的标准 地址位置信息 。
5.根据权利要求4所述的系统, 其特征在于, 所述将所述标准化地址与地址库中的地址
串逐级匹配, 得到相似的标准 地址信息包括:
将所述标准 化地址按地址串层级 进行逐层匹配, 输出 所有相匹配的标准 地址信息 。
6.根据权利要求4所述的系统, 其特征在于, 所述将加权后的标准地址信 息和待匹配标
准化地址进行相似度计算包括:
预先设定不同层级地址权重值, 对相似的标准地址信 息进和待 匹配标准化地址分别进
行加权;
通过余弦相似度计算得到最相似的标准 地址。
7.一种电子设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器上
运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求1至3
任一项所述的一种细粒度地址匹配方法的步骤。
8.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在
于, 所述计算机程序被执行时实现如权利要求 1至3任一项 所述的一种细粒度地址匹配方法
的步骤。权 利 要 求 书 1/1 页
2
CN 115544197 A
2一种细粒度地址匹配方 法及系统
技术领域
[0001]本发明属于信息技 术领域, 尤其涉及一种细粒度地址匹配方法及系统。
背景技术
[0002]在电网系统中的海量故障日志挖掘中, 经常需要在电网故障日志信息中找到故障
点所在的详细地址信息及故障点之 间的距离, 以提高电网故障排查、 处理的效率。 这就需要
将日志中的故障点地址和已知标准地址库中的地址进 行比对, 得到故障的标准地址和在地
图中对应的经纬度, 从而通过标准地图计算处故障点位之间的距离。 但在实际的电网项目
中, 标准地址库中的地址信息往往都是千万甚至亿级的数量, 如果直接将没有处理的故障
地址和数据库中的已有标准 地址进行匹配, 数据处 理量会十分庞大且匹配速度慢。
发明内容
[0003]有鉴于此, 本发明实施例提供了一种细粒度地址匹配方法及系统, 用于解决现有
的地址匹配方法数据处 理量大且匹配速度慢的问题。
[0004]在本发明实施例的第一方面, 提供了一种细粒度地址匹配方法, 包括:
[0005]将地址库中存 储的地址信息标准 化处理为地址串;
[0006]将待匹配地址信息拆分为关键小区部分和楼栋号/门牌号两部分, 对两部分进行
细粒度的拆分, 将拆分后的两 部分地址合并得到标准 化地址;
[0007]将所述标准 化地址与地址库中的地址串逐级匹配, 得到相似的标准 地址信息;
[0008]对所述标准地址信息和待匹配标准化地址进行逐级加权, 将加权后的标准地址信
息和待匹配标准化地址进行相似度计算, 得到最相似的标准地址, 并输出最相似的标准地
址位置信息 。
[0009]在本发明实施例的第二方面, 提供了一种细粒度地址匹配系统, 包括:
[0010]地址预处 理模块, 用于将地址库中存 储的地址信息标准 化处理为地址串
[0011]地址标准化模块, 用于将待匹配地址信息拆分为关键小区部分和楼栋号/门牌号
两部分, 对两 部分进行细粒度的拆分, 将拆分后的两 部分地址合并得到标准 化地址;
[0012]地址筛选模块, 用于将所述标准化地址与地址库 中的地址串逐级匹配, 得到相似
的标准地址信息;
[0013]地址推荐模块, 用于对所述标准地址信息和待匹配标准化地址进行逐级加权, 将
加权后的标准地址信息和待匹配标准化地址进行相似度计算, 得到最相似的标准地址, 并
输出最相似的标准 地址位置信息 。
[0014]在本发明实施例的第三方面, 提供了一种电子设备, 包括存储器、 处理器以及存储
在所述存储器中并可在所述处理器运行的计算机程序, 所述处理器执行所述计算机程序时
实现如本发明实施例第一方面所述方法的步骤。
[0015]在本发明实施例的第四方面, 提供了一种计算机可读存储介质, 所述计算机可读
存储介质存储有计算机程序, 所述计算机程序被处理器执行时实现本发明实施例第一方面说 明 书 1/5 页
3
CN 115544197 A
3
专利 一种细粒度地址匹配方法及系统
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:28:33上传分享