专利助训练框架下的质量变量预测方法、装置终端及介质

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111502375.4 (22)申请日 2021.12.09 (71)申请人江南大学地址 214000 江苏省无锡市滨湖区蠡湖大道1800号 (72)发明人熊伟丽　何罗苏阳　 (74)专利代理机构无锡承果知识产权代理有限公司 32373 代理人刘清丽 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 10/06(2012.01) G06N 20/00(2019.01) (54)发明名称助训练框架下的质量变量预测方法、装置终端及介质 (57)摘要本申请关于一种助训练框架下的质量变量预测方法、装置、终端及存储介质，涉及复杂工业过程建模和故障诊断领域。该方法包括：获取待测数据集、有标签样本数据集以及无标签样本数据集；建立初始主学习模型以及与初始主学习模型对应的初始辅学习模型；对初始主学习模型以及初始辅学习模型进行训练；建立质量变量预测模型；将待测数据组输入质量变量预测模型。在预测的过程中，通过预先进行的无标签样本数据集以及有标签样本数据集的组合训练，在选取高全局信息含量的无标签样本数据集的基础上，提高了质量变量预测模型的质量，使无标签样本数量较多的场景下，质量变量的预测有了稳定且具体的途径，提高了对于质量变量进行预测的准确率和效率。权利要求书3页说明书12页附图4页 CN 114186732 A 2022.03.15 CN 114186732 A 1.一种助训练框架下的质量变量预测方法，其特征在于，所述方法应用于计算机设备中，所述方法包括：获取待测数据集、有标签样本数据集以及无标签样本数据集，所述有标签样本数据集中包括至少两组有标签样本数据组，以及与所述有标签样本数据组对应的样本质量变量数值，所述无标签样本数据集中包括至少两组无标签样本数据组，所述待测数据集中包括至少两组待测数据组；建立初始主学习模型以及与所述初始主学习模型对应的初始辅学习模型，所述初始辅学习模型用于进行所述无标签样本数据的初步标注，所述初始主学习模型用于基于初步标注的结果进行所述有标签样本数据集的扩充；通过所述无标签样本数据集以及所述有标签样本数据集对所述初始主学习模型以及所述初始辅学习模型进行训练，得到主学习模型以及辅学习模型；基于所述主学习模型以及所述辅学习模型建立质量变量预测模型；将所述待测数据组输入所述质量变量预测模型，输出得到与所述待测数据组对应的质量变量预测结果。 2.根据权利要求1所述的方法，其特征在于，所述通过所述无标签样本数据集以及所述有标签样本数据集对所述初始主学习模型以及所述初始辅学习模型进行训练，得到主学习模型以及辅学习模型，包括：在所述无标签样本数据集中随机选取至少两个无标签样本数据组，得到无标签训练数据集；通过所述有标签样本数据集以及所述无标签训练数据集对所述初始辅学习模型进行训练，得到所述辅学习模型；响应于所述辅学习模型训练完成，通过所述辅学习训练模型从所述无标签训练数据集中确定主学习模型训练样本集；通过所述主学习模型训练样本集对所述初始主学习模型进行训练，得到所述主学习模型。 3.根据权利要求2所述的方法，其特征在于，所述通过所述有标签样本数据集以及所述无标签训练数据集对所述初始辅学习模型进行训练，得到所述辅学习模型，包括：从所述有标签样本数据集中选取与所述无标签训练数据集对应的有标签训练数据集，所述有标签训练数据集中，对应每个所述无标签训练数据集中的所述无标签样本数据组，有有标签样本数据子集，所述有标签样本数据子集中包括训练样本质量变量数值；基于所述样本质量变量数值以及所述无标签样本数据组对所述初始辅学习模型进行训练，得到所述辅学习模型。 4.根据权利要求3所述的方法，其特征在于，所述从所述有标签样本数据集中选取与所述无标签训练数据集对应的有标签训练数据集，包括：基于所述无标签训练集中的所述无标签样本数据组，在所述有标签样本数据集中选取所述无标签样本数据组的至少两个近邻样本数据组；基于所述至少两个近邻样本数据组，生成所述有标签训练数据集。 5.根据权利要求2所述的方法，其特征在于，所述响应于所述辅学习模型训练完成，通过所述辅学习模型从所述无标签训练数据集中确定主学习模型训练样本集，包括：权　利　要　求　书 1/3 页 2 CN 114186732 A 2响应于所述辅学习模型训练完成，将所述无标签样本数据输入所述辅学习模型，输出与所述无标签样本数据组对应的置信度数值；基于所述置信度数值从所述无标签样本训练集中筛选得到至少两个高置信度无标签样本数据组；基于所述高置信度无标签样本数据组生成所述主学习模型训练样本集。 6.根据权利要求2所述的方法，其特征在于，所述通过所述主学习模型训练样本集对所述初始主学习模型进行训练，得到所述主学习模型，包括：将所述主学习模型训练样本集输入所述初始主学习模型，输出得到伪标签训练样本集；通过所述伪标签训练样本集对所述有标签数据集进行扩充；将扩充后的所述有标签数据集中的所述有标签数据组输入所述初始主学习模型，输出得到与所述有标签数据组对应的均方误差；基于所述均方误差对所述初始主学习模型进行训练，得到所述主学习模型。 7.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：确定所述与所述主学习模型的训练次数对应的第一迭代次数，以及与所述辅学习模型的训练次数对应的第二迭代次数；响应于所述第一迭代次数达到第一次数阈值，确定所述主学习模型的训练完成；响应于所述第二迭代次数达到第二次数阈值，确定所述辅学习模型的训练完成。 8.一种质量变量的预测装置，其特征在于，所述装置包括：获取模块，用于获取待测数据集、有标签样本数据集以及无标签样本数据集，所述有标签样本数据集中包括至少两组有标签样本数据组，以及与所述有标签样本数据组对应的样本质量变量数值，所述无标签样本数据集中包括至少两组无标签样本数据组，所述待测数据集中包括至少两组待测数据组；建立模块，用于建立初始主学习模型以及与所述初始主学习模型对应的初始辅学习模型，所述初始辅学习模型用于进行所述无标签样本数据的初步标注，所述初始主学习模型用于基于初步标注的结果进行所述有标签样本数据集的扩充；训练模块，用于通过所述无标签样本数据集以及所述有标签样本数据集对所述初始主学习模型以及所述初始辅学习模型进行训练，得到主学习模型以及辅学习模型；所述建立模块，还用于基于所述主学习模型以及所述辅学习模型建立质量变量预测模型；输入模块，用于将所述待测数据组输入所述质量变量预测模型，输出得到与所述待测数据组对应的质量变量预测结果。 9.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、至少一段程序、代码集或指令集由所述处理器加载并执行以实现如权利要求1至7任一所述的助训练框架下的质量变量预测方法。 10.一种计算机可读存储介质，其特征在于，所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、至少一段程序、代码集或指令集由所述处理器加载并执行以实现如权利要求1至7任一所述的助训练框架下的质量变量预测权　利　要　求　书 2/3 页 3 CN 114186732 A 3

专利 助训练框架下的质量变量预测方法、装置终端及介质

专利助训练框架下的质量变量预测方法、装置终端及介质