(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211374231.X
(22)申请日 2022.11.04
(71)申请人 百维金科 (上海) 信息科技有限公司
地址 200433 上海市杨 浦区翔殷路16 5号B
区206-10室
(72)发明人 江远强 韩逸 项衡
(74)专利代理 机构 上海中外企专利代理事务所
(特殊普通 合伙) 31387
专利代理师 牛怡
(51)Int.Cl.
G06Q 10/04(2012.01)
G06Q 10/06(2012.01)
G06Q 50/06(2012.01)
G06N 3/00(2006.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
一种企业电费回收的风险预测方法与系统
(57)摘要
本发明公开了一种企业电费回收的风险预
测方法与系统, 方法包含: 获取企业用电数据抽
取正样本与负样本, 衍生形成建模样本特征宽表
数据; 对建模样本特征宽表数据进行预处理后得
到衍生变量数据, 并进行标准化处理后通过相关
性分析过滤掉弱影 响指标, 连接用户的标识和正
负标签, 得到建模样本; 通过K折对建模样本进行
处理生成训练集, 建立基于注意力机制的LS TM企
业电费回收风险模型, 并利用训练集进行训练;
将当前企业用电信息数据输入至LSTM企业电费
回收风险模型中, 得到预测结果和真实正负样
本, 并做成混淆矩阵, 验证电费回收风险预警模
型效果; 对存量企业进度电费回收风险进行预
测, 制定电费风险差异处 理和电费回收策略。
权利要求书2页 说明书10页 附图1页
CN 115545342 A
2022.12.30
CN 115545342 A
1.一种企业电费回收的风险预测方法, 其特 征在于, 包 含以下步骤:
步骤1: 获取企业用电数据并根据分析目标按比例抽取正样本与负样本, 选取与用电企
业电费回收风险相关的指标并依据该指标衍 生形成建模样本特 征宽表数据;
步骤2: 对所述建模样本特征宽表数据进行预处理后得到衍生变量数据, 对所述衍生变
量数据进行标准化处理后通过相关性分析过滤掉弱影响指标, 连接用户的标识和正负标
签, 得到建模样本;
步骤3: 通过K折对所述建模样本进行处理生成训练集, 采用LSTM神经网络算法和引 入
深度学习中的注意力机制, 建立基于注意力机制的LSTM企业电费回收风险模型, 利用所述
训练集对所述 LSTM企业电费回收风险模型进行训练;
步骤4: 将当前企业用电信息数据输入至所述LSTM企业电费回收风险模型中, 得到预测
结果和真实正负样本, 将所述预测结果和真实正负样本做成混淆矩阵, 采用命中率、 覆盖率
和提升度三个指标, 验证电费回收风险预警模型效果;
步骤5: 根据所述LSTM企业电费回收风险模型对存量企业进度电费回收风险进行预测,
基于电力大企业风险评分分布情况, 确定风险等级划分阈值, 将企业评分划分为高、 中、 低
风险, 制定电费风险差异处 理和电费回收策略。
2.如权利要求1所述的一种企业电费回收的风险预测方法, 其特征在于, 步骤1中从国
网内部的营销业务应用系统、 用电信息采集系统、 95598企业服务系统、 企业信用评估平台
中获取所述 企业用电数据并按1: X的比例抽取所述正样本与所述负样本, X的取值范围为正
整数;
所述分析目标为企业是否具有电费回收风险;
所述正样本为未 出现电费逾期的企业, 所述负 样本为出现逾期且 超过30天的企业;
所述用电企业电费回收风险相关的指标包含收集 回款时长、 是否连续逾期、 逾期时长、
催费短信是否订阅、 催费短信发送次数、 月末缴费次数、 逾期 缴费率、 是否存在连续逾期、 逾
期次数、 逾期时长、 产生违约金次数、 平均回款时长 。
3.如权利要求2所述的一种企业电费回收的风险预测方法, 其特征在于, 所述企业用电
数据包含企业档案数据、 缴费行为数据、 用电行为数据、 违约用电数据、 关联信息数据。
4.如权利要求3所述的一种企业电费回收的风险预测方法, 其特征在于, 步骤2中对所
述建模样本特征宽表数据依 次进行企业户号的唯一性检验处理、 范围和取值检验处理、 异
常值检验处理、 离群值检验处理、 缺 失值检验处理、 构建衍生变量、 数据标准化、 特征筛选后
得到所述 衍生变量数据。
5.如权利要求4所述的一种企业电费回收的风险预测方法, 其特征在于, 步骤3中利用
所述训练集对所述 LSTM企业电费回收风险模型进行训练的具体方法如下:
将所述训练集输入所述LSTM企业电费回收风险模型中, 将客户是否存在电费回收风险
对所述训练集中的样本进行 标记;
得到给定主要特征抽取后的数据集合
为一组特征向
量;
计算得到
的主成分矩阵Y, 并将该主成分矩阵Y输入所述LSTM企业电费回收
风险模型中得到预测值
为是否存在电费回溯风险。权 利 要 求 书 1/2 页
2
CN 115545342 A
26.如权利要求5所述的一种企业电费回收的风险预测方法, 其特征在于, 步骤4中所述
命中率、 所述覆盖率、 所述 提升度的表达式如下:
命中率: 命中率=总数(预测正确)/预测风险客户数, 描述模型结果中正确结果的比
例, 该指标用于衡量模型的准确性;
覆盖率: 覆盖率=总数(预测正确)/总数(实际欠费), 描述模型所挖掘出的欠费用户数
量占真实欠费户数的比例;
提升度: 模型预测的命中率与随机筛选的命中率的比值, 是衡量模型有效性的参考标
准。
7.一种企业电费回收的风险预测系统, 其特征在于, 包含数据处理模块、 模型构建模
块、 验证模块、 预测模块;
所述数据处理模块用于获取企业用电数据并根据分析目标按比例抽取正样本与负样
本, 选取与用电企业电费回收风险相关的指标并依据该指标衍生形成建模样本特征宽表数
据; 还用于对所述建模样本特征宽表数据进行预处理后得到衍生变量数据, 对所述衍生变
量数据进行标准化处理后通过相关性分析过滤掉弱影响指标, 连接用户的标识和正负标
签, 得到建模样本;
所述模型构建模块用于通过K折对所述建模样本进行处理生成训练集, 采用LSTM神经
网络算法和引入深度学习中的注 意力机制, 建立基于注 意力机制的LSTM企业电费回收风险
模型, 利用所述训练集对所述 LSTM企业电费回收风险模型进行训练;
所述验证模块用于将当前企业用电信息数据输入至所述LSTM企业电费回收风险模型
中, 得到预测结果和真实正负样本, 将所述预测结果和真实正负样本做成混淆矩阵, 采用命
中率、 覆盖率和提升度三个指标, 验证电费回收风险预警模型效果;
所述预测模块用于根据所述LSTM企业电费回收风险模型对存量企业进度电费回收风
险进行预测, 基于电力大企业风险评分分布情况, 确定风险等级划分阈值, 将企业评 分划分
为高、 中、 低风险, 制定电费风险差异处 理和电费回收策略。
8.一种芯片, 其特征在于, 包含: 处理器, 用于从存储器 中调用并运行计算机程序, 使得
安装有所述芯片的设备 执行: 如权利要求1 ‑6中任一项所述的方法。权 利 要 求 书 2/2 页
3
CN 115545342 A
3
专利 一种企业电费回收的风险预测方法与系统
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:23:56上传分享