全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111502375.4 (22)申请日 2021.12.09 (71)申请人 江南大学 地址 214000 江苏省无锡市滨湖区蠡湖大 道1800号 (72)发明人 熊伟丽 何罗苏阳  (74)专利代理 机构 无锡承果知识产权代理有限 公司 32373 代理人 刘清丽 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 10/06(2012.01) G06N 20/00(2019.01) (54)发明名称 助训练框架下的质量变量预测方法、 装置终 端及介质 (57)摘要 本申请关于一种助训练框架下的质量变量 预测方法、 装置、 终端及存储介质, 涉及复杂工业 过程建模和故障诊断领域。 该方法包括: 获取待 测数据集、 有标签样本数据集以及无标签样本数 据集; 建立初始主学习模型以及与初始主学习模 型对应的初始辅学习模型; 对初始主学习模型以 及初始辅 学习模型进行训练; 建立质量变量预测 模型; 将待测数据组输入质量变量预测模型。 在 预测的过程中, 通过预先进行的无标签样本数据 集以及有标签样本数据集的组合训练, 在选取高 全局信息含量的无标签样本数据集的基础上, 提 高了质量变量预测模型的质量, 使无标签样本数 量较多的场景下, 质量变量的预测有了稳定且具 体的途径, 提高了对于质量变量进行预测的准确 率和效率。 权利要求书3页 说明书12页 附图4页 CN 114186732 A 2022.03.15 CN 114186732 A 1.一种助训练框架下的质量变量预测方法, 其特征在于, 所述方法应用于计算机设备 中, 所述方法包括: 获取待测数据集、 有标签样本数据集以及无标签样本数据集, 所述有标签样本数据集 中包括至少两组有标签样本数据组, 以及与所述有标签样本数据组对应的样本质量变量数 值, 所述无标签样本数据集中包括至少 两组无标签样本数据组, 所述待测数据集中包括至 少两组待测数据组; 建立初始主学习 模型以及与 所述初始主学习 模型对应的初始辅学习模型, 所述初始辅 学习模型用于进 行所述无标签样本数据的初步标注, 所述初始主 学习模型用于基于初步标 注的结果进行 所述有标签样本数据集的扩充; 通过所述无标签样本数据集以及所述有标签样本数据集对所述初始主学习模型以及 所述初始辅学习模型进行训练, 得到主学习模型以及辅学习模型; 基于所述主学习模型以及所述辅学习模型建立质量变量预测模型; 将所述待测数据组输入所述质量变量预测模型, 输出得到与 所述待测数据组对应的质 量变量预测结果。 2.根据权利要求1所述的方法, 其特征在于, 所述通过所述无标签样本数据集以及所述 有标签样本数据集对所述初始主 学习模型以及所述初始辅学习模型进 行训练, 得到主 学习 模型以及辅学习模型, 包括: 在所述无标签样本数据集中随机选取至少两个无标签样本数据组, 得到无标签训练数 据集; 通过所述有标签样本数据集以及所述无标签训练数据集对所述初始辅学习模型进行 训练, 得到所述辅学习模型; 响应于所述辅学习模型训练完成, 通过所述辅学习训练模型从所述无标签训练数据集 中确定主学习模型训练样本集; 通过所述主学习 模型训练样本集对所述初始主学习 模型进行训练, 得到所述主学习 模 型。 3.根据权利要求2所述的方法, 其特征在于, 所述通过所述有标签样本数据集以及所述 无标签训练数据集对所述初始辅学习模型进行训练, 得到所述辅学习模型, 包括: 从所述有标签样本数据集中选取与 所述无标签训练数据集对应的有标签训练数据集, 所述有标签训练数据集中, 对应每个所述无标签训练数据集中的所述无标签样本数据组, 有有标签样本数据子集, 所述有标签样本数据子集中包括训练样本质量变量数值; 基于所述样本质量变量数值以及所述无标签样本数据组对所述初始辅学习模型进行 训练, 得到所述辅学习模型。 4.根据权利要求3所述的方法, 其特征在于, 所述从所述有标签样本数据集中选取与 所 述无标签训练数据集对应的有标签训练数据集, 包括: 基于所述无标签训练集中的所述无标签样本数据组, 在所述有标签样本数据集中选取 所述无标签样本数据组的至少两个近邻样本数据组; 基于所述至少两个近邻样本数据组, 生成所述有标签训练数据集。 5.根据权利要求2所述的方法, 其特征在于, 所述响应于所述辅学习模型训练完成, 通 过所述辅学习模型从所述无 标签训练数据集中确定主学习模型训练样本集, 包括:权 利 要 求 书 1/3 页 2 CN 114186732 A 2响应于所述辅学习模型训练完成, 将所述无标签样本数据输入所述辅学习模型, 输出 与所述无 标签样本数据组对应的置信度数值; 基于所述置信度数值从所述无标签样本训练集中筛选得到至少两个高置信度无标签 样本数据组; 基于所述高置信度无 标签样本数据组生成所述主学习模型训练样本集。 6.根据权利要求2所述的方法, 其特征在于, 所述通过所述主学习 模型训练样本集对所 述初始主学习模型进行训练, 得到所述主学习模型, 包括: 将所述主学习模型训练样本集输入所述初始主学习模型, 输出得到伪标签训练样本 集; 通过所述伪标签训练样本集对所述有标签数据集进行扩充; 将扩充后的所述有标签数据集中的所述有标签数据组输入所述初始主学习模型, 输出 得到与所述有标签数据组对应的均方误差; 基于所述均方误差对所述初始主学习模型进行训练, 得到所述主学习模型。 7.根据权利要求1或2所述的方法, 其特 征在于, 所述方法还 包括: 确定所述与 所述主学习 模型的训练次数对应的第 一迭代次数, 以及与 所述辅学习模型 的训练次数对应的第二迭代次数; 响应于所述第一迭代次数达 到第一次数阈值, 确定所述主学习模型的训练完成; 响应于所述第二迭代次数达 到第二次数阈值, 确定所述辅学习模型的训练完成。 8.一种质量变量的预测装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取待测数据集、 有标签样本数据集以及无标签样本数据集, 所述有标 签样本数据集中包括至少两组有标签样本数据组, 以及与所述有标签样本数据组对应的样 本质量变量数值, 所述无标签样本数据集中包括至少 两组无标签样本数据 组, 所述待测数 据集中包括至少两组待测数据组; 建立模块, 用于建立初始主学习模型以及与所述初始主学习模型对应的初始辅学习 模 型, 所述初始辅学习模型用于进行所述无标签样本数据的初步标注, 所述初始主学习模型 用于基于初步标注的结果进行 所述有标签样本数据集的扩充; 训练模块, 用于通过所述无标签样本数据集以及所述有标签样本数据集对所述初始主 学习模型以及所述初始辅学习模型进行训练, 得到主学习模型以及辅学习模型; 所述建立模块, 还用于基于所述主学习模型以及所述辅学习模型建立质量变量预测模 型; 输入模块, 用于将所述待测数据组输入所述质量变量预测模型, 输出得到与所述待测 数据组对应的质量变量预测结果。 9.一种计算机设备, 其特征在于, 所述计算机设备包括处理器和存储器, 所述存储器中 存储有至少一条指 令、 至少一段程序、 代码集或指 令集, 所述至少一条指 令、 至少一段程序、 代码集或指令集由所述处理器加载并执行以实现如权利要求1至7任一所述的助训练框架 下的质量变量预测方法。 10.一种计算机可读存储介质, 其特征在于, 所述可读存储介质中存储有至少一条指 令、 至少一段程序、 代码集 或指令集, 所述至少一条指 令、 至少一段程序、 代码集或指 令集由 所述处理器加载并执行以实现如权利要求1至7任一所述的助训练框架下 的质量变量预测权 利 要 求 书 2/3 页 3 CN 114186732 A 3

.PDF文档 专利 助训练框架下的质量变量预测方法、装置终端及介质

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 助训练框架下的质量变量预测方法、装置终端及介质 第 1 页 专利 助训练框架下的质量变量预测方法、装置终端及介质 第 2 页 专利 助训练框架下的质量变量预测方法、装置终端及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:43:26上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。