(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211381968.4
(22)申请日 2022.11.07
(71)申请人 中邮消费金融有限公司
地址 510000 广东省广州市南沙区海 滨路
171号南沙金融大厦1 1楼1101之一J3 0
(72)发明人 韩柳 李远鑫 郑宇晟 黄文辉
钟佳 邹健娣
(74)专利代理 机构 广州微斗专利代理有限公司
44390
专利代理师 朱武
(51)Int.Cl.
G06Q 30/02(2012.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06Q 40/02(2012.01)G06Q 40/04(2012.01)
(54)发明名称
一种老带新活动反欺诈 识别方法及系统
(57)摘要
本发明涉及一种老带新活动反欺诈识别方
法及系统, 包括: S1: 进行黑白灰样本的定义并对
样本数量进行判定, 当黑白样 本比为第一预设值
时, 则按照白样本进行执行; 白样本为: (1) 确定
贷款且无逾期、 白名单; (2) 复贷率为第二预设
值; (3) 审核通过; S2: 将裂变拉新活动的行为数
据进行清洗, 为每用户建立四维张量, 并进行重
编码操作; S3: 基于动态时间规整模型将用户产
生的张量进行时间序列的相似度计算; S4: 建立
图数据, 将用户ID作为节点, 并建立用户之间和
节点之间的边; S5: 修改GraphSage模型的采样策
略, 并进行模型的训练, 当召回率为第三预设值
时则进行上线迭代, 并推送至案调岗, 同时为贷
前案调岗提供话 术设计。
权利要求书2页 说明书6页 附图3页
CN 115423542 A
2022.12.02
CN 115423542 A
1.一种老带新活动反欺诈 识别方法, 其特 征在于, 包括如下步骤:
S1: 进行黑白灰样本的定义并对样本数量进行判定, 当黑白样本比为第 一预设值时, 则
按照白样本规则进行 执行;
白样本规则为:
(1) 、 确定贷款且无逾期、 白名单;
(2) 、 复贷率 为第二预设值;
(3) 、 审核通过;
S2: 将裂变拉新活动的行为数据进行清洗, 为每一个用户建立一个四维张量, 并进行重
编码操作;
S3: 基于动态时间规整模型将用户产生的不等长行为张量进行时间序列的相似度计
算;
S4: 建立图数据, 将用户ID作为节点, 并分别建立用户之间和节点之间的边;
S5: 修改GraphSage模型的采样策略, 并进行模型的训练, 当召回率为第三预设值时则
进行上线迭代, 并推送至 案调岗, 同时为贷前案调岗提供话 术设计。
2.如权利要求1所述的老带新活动反欺诈识别方法, 其特征在于, 所述步骤S1中进行黑
白灰样本的定义并进行判定的具体步骤 包括:
当黑样本和总样本的比例为第四预设值 时, 则通过滑动时间窗口的转换率来对黑样本
的数量进行补充, 当灰样本数量需要进行增加或减少时, 则通过线上模型灰度迭代返回的
硬标签比例来控制灰样本的比例。
3.如权利要求1所述的老带新活动反欺诈识别方法, 其特征在于, 所述步骤S2中为每一
个用户建立 一个四维张量, 并进行重编码 操作的具体步骤 包括:
为每一个用户建立一个四维张量, 其中每个维度分别代表停留时间、 event_title向
量、 次数向量和时间戳, 并执 行重编码 操作。
4.如权利要求1所述的老带新活动反欺诈识别方法, 其特征在于, 所述步骤S3的具体步
骤包括:
基于动态时间规整模型将用户产生的不等长行为张量进行时间序列的相似度计算, 根
据每个用户和其他用户之 间的行为相似性计算出相似度数值, 其计算方法为: 从 (0,0) 开始
匹配序列Q和C, 每到一个点, 就将之前所有的点计算的距离进行累加, 到达终点 (n, m) 后, 其
累加距离即为总距离, 即序列Q和C的相似度。
5.如权利要求1所述的老带新活动反欺诈识别方法, 其特征在于, 所述步骤S4中分别建
立用户之间和节点之间的边的具体步骤为:
通过用户之间的受邀与否的关系建立边, 通过相似度作为节点之间联系的边, 且两个
边均带权 重, 再进行归一 化处理。
6.如权利要求5所述的老带新活动反欺诈识别方法, 其特征在于, 所述步骤S5中修改
GraphSage模型的采样策略的具体步骤 包括:
按照边的加权平均最大的TOPK作为采样计算的规则, 对GraphSage模型的每一层的采
样方法进行修改。
7.如权利要求1所述的老带新活动反欺诈识别方法, 其特征在于, 所述步骤S5 中提供的
话术设计具体包括:权 利 要 求 书 1/2 页
2
CN 115423542 A
2所述话术设计包括询问贷款需求和对活动的评价。
8.一种老带新活动反欺诈 识别系统, 其特 征在于, 包括:
配置和判定模块: 用于进行黑 白灰样本的定义并对样本数量进行判定, 当黑 白样本比
为第一预设值时, 则按照白样本规则进行 执行;
白样本规则为:
(1) 、 确定贷款且无逾期、 白名单;
(2) 、 复贷率 为第二预设值;
(3) 、 审核通过;
数据模块: 用于对裂变拉新活动的行为数据进行清洗, 为每一个用户建立一个四维张
量, 并进行重编码 操作;
计算模块: 基于动态时间规整模型将用户产生的不等长行为张量进行时间序列的相似
度计算;
编辑和控制模块: 用于建立图数据, 将用户ID作为节点, 并分别建立用户之间和节点之
间的边; 修改GraphSage模型的采样策略, 并进行模型的训练, 当召回率为第三预设值时则
进行上线迭代, 并推送至 案调岗, 同时为贷前案调岗提供话 术设计。
9.如权利要求8所述的老带新活动反欺诈识别系统, 其特征在于, 所述配置和判定模块
具体包括:
当黑样本和总样本的比例为第四预设值 时, 则通过滑动时间窗口的转换率来对黑样本
的数量进行补充, 当灰样本数量需要进行增加或减少时, 则通过线上模型灰度迭代返回的
硬标签比例来控制灰样本的比例。
10.如权利要求8所述的老带新活动反欺诈识别系统, 其特征在于, 所述计算模块具体
包括:
基于动态时间规整模型将用户产生的不等长行为张量进行时间序列的相似度计算, 根
据每个用户和其他用户之 间的行为相似性计算出相似度数值, 其计算方法为: 从 (0,0) 开始
匹配序列Q和C, 每到一个点, 就将之前所有的点计算的距离进行累加, 到达终点 (n, m) 后, 其
累加距离即为总距离, 即序列Q和C的相似度。权 利 要 求 书 2/2 页
3
CN 115423542 A
3
专利 一种老带新活动反欺诈识别方法及系统
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:23:54上传分享