(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211366862.7
(22)申请日 2022.11.03
(71)申请人 中国医学 科学院阜外医院
地址 100037 北京市西城区北礼士 路167号
中国医学 科学院阜外医院
(72)发明人 冯新星 陈燕燕
(74)专利代理 机构 北京中和立达知识产权代理
有限公司 1 1756
专利代理师 孟姣
(51)Int.Cl.
G06V 10/764(2022.01)
G06V 10/774(2022.01)
G06T 7/00(2017.01)
G06V 10/82(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
眼底图像分类模型构建方法、 设备及 介质
(57)摘要
本发明实施例公开了一种眼底图像分类模
型构建方法、 设备及介质。 其中, 方法包括: 获取
待训练的眼底图像分类模型, 其中, 所述模型包
括卷积层、 第一全连接层和第二全连接层, 所述
卷积层和第一全 连接层用于特征提取, 所述第二
全连接层用于分类; 利用I mage Net数据集, 对所
述卷积层和第一全连接层进行预训练; 由标注好
类型的眼底图像生成样本集, 采用监督对比学习
方式对预训练后的卷积层和第一全连接层进行
二次训练; 冻结二次训练后的卷积层, 利用所样
本集对所述第二全连接层和预训练后的第一全
连接层进行微调, 得到训练好的眼底图像分类模
型。 本实施例提高模型的准确度和鲁棒 性。
权利要求书2页 说明书7页 附图4页
CN 115496954 A
2022.12.20
CN 115496954 A
1.一种眼底图像分类模型构建方法, 其特 征在于, 包括:
获取待训练的眼底图像分类模型, 其中, 所述模型包括卷积层、 第一全连接层和第二全
连接层, 所述卷积层和第一全连接层用于特 征提取, 所述第二全连接层用于分类;
利用Image Net数据集, 对所述卷积层和第一全连接层进行 预训练;
由标注好类型的眼底图像生成样本集, 采用监督对比学习方式对预训练后的卷积层和
第一全连接层进行二次训练;
冻结二次训练后的卷积层, 利用所样本集对所述第 二全连接层和预训练后的第 一全连
接层进行微调, 得到训练好的眼底图像分类模型。
2.根据权利要求1所述的方法, 其特征在于, 眼底图像的类型包括眼底正常图像和眼底
异常图像;
所述由标注好类型的眼底图像构成样本集, 包括:
获取标注好类型的原 始眼底图像;
对所述原 始眼底图像进行 数据增强;
将数据增强后的眼底图像调整为设定大小, 由调整后的图像构成样本集。
3.根据权利要求1所述的方法, 所述采用监督对比学习方式对预训练后的卷积层和第
一全连接层进行二次训练, 包括:
通过以下损失函数的最小化, 对预训练后的卷积层和第一全连接层进行二次训练:
其中,
表示模型训练的整体损失函数, I表示样本集, i表示样本集中的任一样
本,
表示样本 i的特征损失, zi表示样本 i经过所述特征提取层后提取到的特征, τ表
示超参数, P(i)表示与样本 i属于同一类型的样本集合, A(i)表示与样本 i属于不同类型的
样本集合, p表示P(i)中的样本, a表示A(i)中的样本, zp表示样本 p经过所述特征提取层后
提取到的特征, za表示样本 a经过所述特征提取层后提取到的特征,
表示P(i)中的
样本数量。
4.根据权利要求1所述的方法, 其特征在于, 所述由标注好类型的眼底图像构成样本
集, 包括:
对多种数据增强方法进行排列组合, 其中, 所述多种数据增强方法包括: 随机水平翻
转、 随机垂直翻转、 颜色抖动, 以及不同旋转 率的随机 旋转;
采取不同组合的数据增强方法, 对标注好类型的原始眼底图像进行数据增强, 形成不
同的图像集;
将各图像集中的图像调整为设定大小, 由调整后的各图像集构成各样本集;
所述采用监督对比学习方式对预训练后的卷积层和第一全连接层进行二次训练, 包
括:
将各样本集划分为训练集和 测试集;权 利 要 求 书 1/2 页
2
CN 115496954 A
2采用监督对比学习方式, 分别利用不同的训练集对预训练后的卷积层和第 一全连接层
进行二次训练;
在所述冻结二 次训练后的卷积层, 利用所样本集对所述第 二全连接层和预训练后的第
一全连接层进行微调, 得到训练好的眼底图像分类模型之后, 还 包括:
得到各样本集对应的、 训练好的眼底图像分类模型后, 利用各测试集分别对各模型进
行测试, 得到各模型的分类准确率, 其中, 同一模 型的训练和测试利用同一样本集的训练集
和测试集完成;
根据模型间的分类准确率差异, 检验 模型的鲁棒 性。
5.根据权利要求1所述的方法, 其特征在于, 所述采用监督对比学习方式对预训练后的
卷积层和第一全连接层进行二次训练, 包括:
采用监督对比学习方式, 利用所述样本的训练集、 以不同的学习率对预训练后的卷积
层和第一全连接层进行二次训练;
在所述冻结二 次训练后的卷积层, 利用所样本集对所述第 二全连接层和预训练后的第
一全连接层进行微调, 得到训练好的眼底图像分类模型之后, 还 包括:
得到各学习率对应的、 训练好的眼底图像分类模型后, 利用所述样本集的测试集对各
模型进行测试, 得到各模型的分类准确率;
根据模型间的分类准确率差异, 检验 模型的鲁棒 性。
6.根据权利要求4或5所述的方法, 其特征在于, 在得到各模型的分类准确率后, 还包
括:
如果各模型的平均分类准确率小于第一预设值, 和/或各模型的分类准确率标准差大
于第二预设值, 调整超参数, 重新进行模型训练。
7.根据权利要求1所述的方法, 其特征在于, 眼底图像的类型包括眼底正常图像和眼底
异常图像;
所述眼底正常图像包括: 无糖尿病性视网膜病变的眼底图像;
所述眼底异常图像包括: 轻度糖尿病性视网膜病的眼底图像、 中度糖尿病视网膜病变
的眼底图像、 重度糖尿病性视网膜疾病的眼底图像、 增殖性糖尿病视网膜病变的眼底图像。
8.根据权利要求1所述的方法, 其特征在于, 所述卷积层和所述第 一连接层共同构 成残
差网络结构, 残差块的每个基本块中应用批量归一化, 基本块中两个卷积层之间的激活函
数为ReLU。
9.一种电子设备, 其特 征在于, 包括:
一个或多个处 理器;
存储器, 用于存 储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行, 使得所述一个或多个处理器实
现如权利要求1 ‑8中任一所述的眼底图像分类模型构建方法。
10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器
执行时实现如权利要求1 ‑8中任一所述的眼底图像分类模型构建方法。权 利 要 求 书 2/2 页
3
CN 115496954 A
3
专利 眼底图像分类模型构建方法、设备及介质
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:23:58上传分享