(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211379147.7
(22)申请日 2022.11.04
(71)申请人 广东工业大 学
地址 510090 广东省广州市越秀区东 风东
路729号
(72)发明人 李志忠 黄秋灵
(74)专利代理 机构 广州粤高专利商标代理有限
公司 44102
专利代理师 刘俊
(51)Int.Cl.
G06V 10/774(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06V 10/82(2022.01)
(54)发明名称
一种带有标签的多类型缺陷数据集生成方
法和系统
(57)摘要
本发明提供一种带有标签的多类型缺陷数
据集生成方法和系统, 涉及深度学习缺陷检测技
术领域, 该方法包括: 获取无缺陷的初始图像; 随
机生成缺陷轮廓, 获取不同类型的缺陷轮廓图
像; 将不同类型的缺陷轮廓图像与无缺陷的初始
图像叠加, 获取带有不同类型缺陷轮廓的初始图
像; 对带有不同类型缺陷轮廓的初始图像中的缺
陷轮廓内部区域进行像素填充, 获得不同类型的
缺陷图像; 生成与不同类型的缺陷图像相对应的
标签, 将不同类型的缺陷图像及其对应的标签 保
存为带有标签的多类型缺陷数据集; 该方法能够
生成多种多样的缺陷样本, 并直接生成缺陷图像
的标签, 显著降低了缺陷数据集的获取难度, 提
高了工作效率。
权利要求书3页 说明书8页 附图5页
CN 115546587 A
2022.12.30
CN 115546587 A
1.一种带有标签的多类型缺陷数据集 生成方法, 其特 征在于, 包括以下步骤:
S1: 获取无缺陷的初始图像;
S2: 随机生成缺陷轮廓, 获取不同类型的缺陷轮廓图像;
S3: 将不同类型的缺陷轮廓图像与无缺陷的初始图像叠加, 获取带有不同类型缺陷轮
廓的初始图像;
S4: 对带有不同类型缺陷轮廓的初始图像中的缺陷轮廓区域内部进行像素填充, 获得
不同类型的缺陷图像;
S5: 生成与不同类型的缺陷图像相对应的标签, 将不同类型的缺陷图像及其对应的标
签保存为带有标签的多类型缺陷数据集。
2.根据权利要求1所述的一种带有标签的多类型缺陷数据集生成方法, 其特征在于, 所
述步骤S2中, 随机生成缺陷轮廓, 获取不同类型的缺陷轮廓图像的具体方法为:
所述缺陷轮廓包括闭合曲线形缺陷轮廓, 所述闭合曲线形缺陷轮廓的生成方法具体
为:
S2.1.1: 在极坐标系下随机生成若干缺陷轮廓基点, 获取每个缺陷轮廓基点对应的极
角;
S2.1.2: 对每 个缺陷轮廓基点随机生成相应的极 半径;
S2.1.3: 将极坐标系下的每个轮廓基点的极角和相应的极半径转换到直角坐标系中,
获得每个轮廓基点 直角坐标;
S2.1.4: 根据每个轮廓 基点直角坐标, 利用预设函数进行曲线拟合, 获取若干闭合曲线
形缺陷轮廓图像。
3.根据权利要求2所述的一种带有标签的多类型缺陷数据集生成方法, 其特征在于, 所
述步骤S2.1.3中, 将极坐标系下的每个轮廓基点的极角和相应的极半径 转换到直角坐标系
中, 获得每 个轮廓基点 直角坐标, 具体方法为:
将极坐标系下的第i个轮廓基点的极角 αi和极半径Ri转换到直角坐标系, 转换公式具体
为:
xi=Ri*cos( αi)
yi=Ri*sin( αi)
其中, xi和yi分别为第i个 轮廓基点 直角坐标的横坐标和纵坐标。
4.根据权利要求2所述的一种带有标签的多类型缺陷数据集生成方法, 其特征在于, 所
述步骤S2.1.4中, 预设函数 具体为interp1d()插值 函数。
5.根据权利要求1所述的一种带有标签的多类型缺陷数据集生成方法, 其特征在于, 所
述步骤S2中, 随机生成缺陷轮廓, 获取不同类型的缺陷轮廓图像的具体方法为:
所述缺陷轮廓还 包括长形缺陷轮廓, 所述长形缺陷轮廓的生成方法具体为:
S2.2.1: 在极坐标下, 在(0, π )范围内随机选取两个极角, 两个极角的角 度值之差小于
预设角度阈值;
S2.2.2: 将两个极角中任意一个极角与随机极角相加, 另一个极角保持不变, 获得第一
极角和第二极角;
S2.2.3: 分别对第一极角和第二极角随机生成对应的长形缺陷轮廓极 半径;
S2.2.4: 根据第一极角和第二极角及其对应的长形缺陷轮廓极半径获取长形缺陷轮权 利 要 求 书 1/3 页
2
CN 115546587 A
2廓;
S2.2.5: 重复步骤S2.2.1 ‑2.2.4, 获取若干 长形缺陷轮廓。
6.根据权利要求1所述的一种带有标签的多类型缺陷数据集生成方法, 其特征在于, 所
述步骤S3中, 将不同类型 的缺陷轮廓图像与无缺陷的初始图像叠加, 获取带有不同类型缺
陷轮廓的初始图像, 具体方法为:
S3.1: 将无缺陷的初始图像转换为灰度图并获取初始图像长 宽数据;
S3.2: 利用第一检测函数检测所述灰度图的轮廓, 获得 灰度图轮廓点数据;
S3.3: 利用第二检测函数检测所述灰度图轮廓点数据中的最小矩形框, 获得矩形框左
上角坐标和矩形框 长宽数据;
S3.4: 将矩形框左上角坐标添加随机值, 获得叠加坐标, 记为(x+xadd,y+yadd), 其中xadd
和yadd分别为矩形框左 上角横坐标和纵坐标的随机值, 所述随机值的大小小于初始图像长
宽数据的大小; 将不同类型 的缺陷轮廓图像的某一点与叠加 坐标重合, 获取带有不同类型
缺陷轮廓的初始图像。
7.根据权利要求6所述的一种带有标签的多类型缺陷数据集生成方法, 其特征在于, 所
述步骤S3中, 所述第一检测函数为cv2.findContours()函数, 所述第二检测函数为
cv2.boundi ngRect()函数。
8.根据权利要求7所述的一种带有标签的多类型缺陷数据集生成方法, 其特征在于, 所
述步骤S4中, 对带有不同类型缺陷轮廓的初始图像中的缺陷轮廓区域内部进行像素填充,
获得不同类型的缺陷图像, 具体方法为:
根据叠加坐标和矩形框长宽数据对带有不同类型缺陷轮廓的初始图像进行部分扫描,
判断包含叠加坐标的最小矩形框中灰度图轮廓点的数量; 当灰度图轮廓点的数量大于1时,
获取包含叠加坐标的最小矩形框中灰度图轮廓点的纵坐标最大值ymax和最小值ymin, 对缺陷
轮廓区域内部(x+xadd,y+yadd)和(ymin,ymax)范围内的像素进行随机填充, 获得不同类型的缺
陷图像。
9.根据权利要求8所述的一种带有标签的多类型缺陷数据集生成方法, 其特征在于, 所
述步骤S5中, 所述标签为yo lo格式的标签;
生成与不同类型的缺陷图像相对应的标签的具体方法为:
S5.1: 获取缺陷图像的类型 数据;
S5.2: 利用所述初始图像长宽数据, 将所述叠加坐标和矩形框长宽数据进行归一化处
理, 获取归一 化中心点 坐标和归一 化长宽数据;
S5.2: 将所述缺陷类型数据、 归一化中心点坐标和归一化长宽数据保存为长度为5的数
组, 生成与每种类型的缺陷图像相对应的标签。
10.一种带有标签的多类型缺陷数据集生成系统, 应用权利要求1 ‑9中任意一项所述的
带有标签的多类型缺陷数据集 生成方法, 其特 征在于, 包括:
初始图像获取 单元, 用来获取 无缺陷的初始图像;
缺陷轮廓生成单 元, 用来随机生成缺陷轮廓, 获取不同类型的缺陷轮廓图像;
轮廓叠加单元, 用来将不同类型的缺陷轮廓图像与无缺陷的初始图像叠加, 获取带有
不同类型缺陷轮廓的初始图像;
轮廓填充单元, 用来对带有不同类型缺陷轮廓的初始图像中的缺陷轮廓区域内部进行权 利 要 求 书 2/3 页
3
CN 115546587 A
3
专利 一种带有标签的多类型缺陷数据集生成方法和系统
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:23:56上传分享