专利 一种模型训练和业务执行的方法、装置、介质及设备

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211376381.4 (22)申请日 2022.11.04 (71)申请人之江实验室地址 311121 浙江省杭州市余杭区之江实验室南湖总部 (72)发明人李太豪　岳鹏程　屈乐园　郑书凯　 (74)专利代理机构北京博思佳知识产权代理有限公司 1 1415 专利代理师陈蕾 (51)Int.Cl. G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G10L 25/27(2013.01) G10L 25/63(2013.01) (54)发明名称一种模型训练和业务执行的方法、装置、介质及设备 (57)摘要本说明书公开了一种模型训练和业务执行的方法、装置、介质及设备。该模型训练的方法包括：获取用户在历史上的语音对话数据并输入待训练的识别模型，通过识别模型的特征提取层，确定语音对话数据对应的数据特征，以及确定所述语音对话数据对应的情感强度，作为预测情感强度，和语音对话数据对应的情感类别，作为预测情感类别，根据预测情感强度和语音对话数据对应的实际情感强度之间的偏差，以及预测情感类别和语音对话数据对应的实际情感类别之间的偏差，确定识别模型的综合损失值，以最小化该综合损失值为优化目标，对识别模型进行训练。权利要求书2页说明书12页附图5页 CN 115456114 A 2022.12.09 CN 115456114 A 1.一种模型训练的方法，其特征在于，包括：获取用户在历史上执行客服业务的语音对话数据；将所述语音对话数据输入待训练的识别模型，通过所述识别模型的特征提取层，确定所述语音对话数据对应的数据特征；将所述数据特征输入到所述识别模型的第一分类层，以确定所述语音对话数据对应的情感强度，作为预测情感强度，以及，将所述数据特征输入到所述识别模型的第二分类层，以确定所述语音对话数据对应的情感类别，作为预测情感类别；根据所述预测情感强度和所述语音对话数据对应的实际情感强度之间的偏差，以及所述预测情感类别和所述语音对话数据对应的实际情感类别之间的偏差，确定所述识别模型的综合损失值；以最小化所述综合损失值为优化目标，对所述识别模型进行训练。 2.如权利要求1所述的方法，其特征在于，将所述语音对话数据输入待训练的识别模型，具体包括：针对所述语音对话数据中的每一帧数据，确定该帧数据是否为静音数据；将所述语音对话数据首尾两端的静音数据进行删除处理，得到处理后语音对话数据；将所述处理后语音对话数据输入所述识别模型。 3.权利要求2所述的方法，其特征在于，将所述处理后语音对话数据输入所述识别模型，具体包括：判断所述处理后语音对话数据对应的时间长度是否大于预设时间长度；若是，则对所述处理后语音对话数据进行裁剪，得到裁剪后语音对话数据；将所述裁剪后语音对话数据输入所述识别模型。 4.如权利要求1所述的方法，其特征在于，根据所述数据特征，将所述数据特征输入到所述识别模型的第一分类层，以确定所述语音对话数据对应的情感强度，作为预测情感强度，以及，将所述数据特征输入到所述识别模型的第二分类层，以确定所述语音对话数据对应的情感类别，作为预测情感类别，具体包括：根据所述数据特征以及所述语音对话数据对应的时间长度，确定所述语音对话数据对应的平均数据特征；将所述平均数据特征输入到所述识别模型的第一分类层，以确定所述语音对话数据对应的所述预测情感强度，以及，将所述平均数据特征输入到所述识别模型的第二分类层，以确定所述语音对话数据对应的所述预测情感类别。 5.如权利要求1所述的方法，其特征在于，根据所述预测情感强度和所述语音对话数据对应的实际情感强度之间的偏差，以及所述预测情感类别和所述语音对话数据对应的实际情感类别之间的偏差，确定所述识别模型的综合损失值，具体包括：根据所述预测情感强度和所述语音对话数据对应的实际情感强度之间的偏差，确定所述识别模型的第一损失值，以及所述预测情感类别和所述语音对话数据对应的实际情感类别之间的偏差，确定所述识别模型的第二损失值；根据所述第一损失值、第一损失值对应的预设权重以及所述第二损失值，确定所述综合损失值。 6.如权利要求1所述的方法，其特征在于，以最小化所述综合损失值为优化目标，对所权　利　要　求　书 1/2 页 2 CN 115456114 A 2述识别模型进行训练，具体包括：根据预设的初始学习率、学习率衰减指数、衰减周期以及训练次数，确定每次对所述识别模型进行训练时，所述识别模型对应的学习率，其中，所述训练次数越多，所述学习率越小；根据每次对所述识别模型进行训练时，所述识别模型对应的学习率，以最小化所述综合损失值为优化目标，对所述识别模型进行训练。 7.一种业务执行的方法，其特征在于，包括：获取用户的语音数据；将所述语音数据输入预先训练的识别模型，通过所述识别模型的特征提取层，确定所述语音数据对应的语音特征，以及，将所述语音特征输入到所述识别模型的第一分类层，以确定所述语音数据对应的情感强度，以及，将所述语音特征输入到所述识别模型的第二分类层，以确定所述语音数据对应的情感类别，其中，所述识别模型是通过上述权利要求1~6 任一项所述的方法训练得到的；根据所述语音数据对应的情感类别以及所述情感强度，确定业务的执行策略，并根据所述执行策略执行所述业务。 8.一种模型训练的装置，其特征在于，包括：获取模块，获取用户在历史上执行客服业务的语音对话数据；输入模块，将所述语音对话数据输入待训练的识别模型，通过所述识别模型的特征提取层，确定所述语音对话数据对应的数据特征；第一确定模块，将所述数据特征输入到所述识别模型的第一分类层，以确定所述语音对话数据对应的情感强度，作为预测情感强度，以及，将所述数据特征输入到所述识别模型的第二分类层，以确定所述语音对话数据对应的情感类别，作为预测情感类别；第二确定模块，根据所述预测情感强度和所述语音对话数据对应的实际情感强度之间的偏差，以及所述预测情感类别和所述语音对话数据对应的实际情感类别之间的偏差，确定所述识别模型的综合损失值；训练模块，以最小化所述综合损失值为优化目标，对所述识别模型进行训练。 9.一种计算机可读存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述权利要求1~7任一项所述的方法。 10.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现上述权利要求1~7任一项所述的方法。权　利　要　求　书 2/2 页 3 CN 115456114 A 3

专利 一种模型训练和业务执行的方法、装置、介质及设备

专利一种模型训练和业务执行的方法、装置、介质及设备