(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211350480.5
(22)申请日 2022.10.31
(71)申请人 上海浦东发展银行股份有限公司
地址 200000 上海市黄浦区中山 东一路12
号
(72)发明人 徐义通 郭林海 张琛 万化
(74)专利代理 机构 北京品源专利代理有限公司
11332
专利代理师 黄立伟
(51)Int.Cl.
G06F 40/30(2020.01)
G06F 40/289(2020.01)
G06F 40/211(2020.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种文本语义识别方法、 装置、 电子终端及
存储介质
(57)摘要
本发明实施例公开了一种文本语义识别方
法、 装置、 电子终端及存储介质, 该方法包括: 通
过第一阶段模型判断原始文本中的各句子片段
是否与至少一个意图标签相关; 将所述原始文本
中与所述至少一个意图标签相关的句子片段依
序组成中间文本; 获取与所述中间文本相关的至
少一个意图标签对应的至少一个原因标签; 通过
第二阶段模型预测所述中间文本针对所述至少
一个原因标签的情感标签; 根据预测出的所述情
感标签, 从所述至少一个原因标签中确定目标原
因标签。 能够实现对长文本进行多意图、 多粒度
语义的精准识别。
权利要求书2页 说明书12页 附图5页
CN 115481641 A
2022.12.16
CN 115481641 A
1.一种文本语义识别方法, 其特 征在于, 包括:
通过第一阶段模型判断原 始文本中的各句子片段 是否与至少一个意图标签相关;
将所述原 始文本中与所述至少一个意图标签相关的句子片段依序组成中间文本;
获取与所述中间文本相关的至少一个意图标签对应的至少一个原因标签;
通过第二阶段模型 预测所述中间文本针对所述至少一个原因标签的情感标签;
根据预测出的所述情感标签, 从所述至少一个原因标签中确定目标原因标签。
2.根据权利要求1所述的方法, 其特征在于, 所述通过第 一阶段模型判断原始文本 中的
各句子片段 是否与至少一个意图标签相关, 包括:
依次获取原 始文本中的各句子片段;
将当前获取的句子片段和意图标签组输入第 一阶段模型; 所述意图标签组中包含至少
一个意图标签;
通过所述第 一阶段模型对所述当前获取的句子片段和所述意图标签组进行处理, 输出
所述当前获取的句子片段与所述至少一个意图标签是否相关。
3.根据权利要求2所述的方法, 其特征在于, 所述通过所述第 一阶段模型对所述当前获
取的句子片段和所述 意图标签组进行处 理, 包括:
通过所述第一阶段模型, 将所述当前获取的句子片段中各词语转化为各第一词向量,
以及将所述 意图标签组中各意图标签转 化为各第二词向量;
根据所述各第 一词向量确定所述句子片段的句嵌入向量, 以及根据所述各第 二词向量
确定所述 意图标签组的标签组嵌入向量;
根据所述句嵌入向量和所述标签组嵌入向量, 确定所述句子片段与 所述意图标签组之
间的第一注意力权 重;
利用所述第一注意力权 重对所述句嵌入向量进行处 理, 确定目标 特征向量;
根据所述目标特征向量判断所述当前获取的句子片段与所述至少一个意图标签是否
相关。
4.根据权利要求1所述的方法, 其特征在于, 所述通过第 二阶段模型预测所述中间文本
针对所述至少一个原因标签的情感标签, 包括:
将所述中间文本和所述至少一个原因标签输入第二阶段模型;
通过所述第 二阶段模型对所述中间文本和所述至少一个原因标签进行处理, 输出所述
中间文本针对所述至少一个原因标签的情感标签。
5.根据权利要求4所述的方法, 其特征在于, 所述通过所述第 二阶段模型对所述中间文
本和所述至少一个原因标签进行处 理, 包括:
通过所述第二阶段模型, 将所述中间文本和所述至少一个原因标签分别进行组合编
码, 得到第一特 征图像;
确定所述第一特 征图像中各 元素的第二注意力权 重;
利用所述第二注意力权 重对所述第一特 征图像进行处 理, 得到第二特 征图像;
根据所述第二特 征图像预测所述中间文本针对所述获取的原因标签的情感标签。
6.根据权利要求1 ‑5中任一所述的方法, 其特 征在于, 所述原 始文本包括对话文本;
在所述从所述至少一个原因标签中确定目标原因标签之后, 还 包括:
根据与所述中间文本相关的至少一个意图标签、 预测出的所述情感标签以及所述目标权 利 要 求 书 1/2 页
2
CN 115481641 A
2原因标签, 从预设模板库中匹配出目标模板;
基于所述目标模板对所述对话文本进行回复。
7.根据权利要求6所述的方法, 其特征在于, 所述基于所述目标模板对所述对话文本进
行回复, 包括:
响应于修改指令对所述目标模板进行修改, 得到回复文本; 其中所述回复文本用于对
所述预设模板库进行 更新;
将所述回复文本发送至所述对话文本的发送端。
8.一种文本语义识别装置, 其特 征在于, 包括:
相关意图判断模块, 用于通过第 一阶段模型判断原始文本 中的各句子片段是否与至少
一个意图标签相关;
文本筛选模块, 用于将所述原始文本 中与所述至少一个意图标签相关的句子片段依序
组成中间文本;
原因标签获取模块, 用于获取与 所述中间文本相关的至少一个意图标签对应的至少一
个原因标签;
情感标签预测模块, 用于通过第 二阶段模型预测所述中间文本针对所述至少一个原 因
标签的情感标签;
目标原因确定模块, 用于根据预测出的所述情感标签, 从所述至少一个原因标签中确
定目标原因标签。
9.一种电子终端, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算
机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求 1‑7中任一所述的文本语
义识别方法。
10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器
执行时实现如权利要求1 ‑7中任一所述的文本语义识别方法。权 利 要 求 书 2/2 页
3
CN 115481641 A
3
专利 一种文本语义识别方法、装置、电子终端及存储介质
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:02上传分享