(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211063052.4
(22)申请日 2022.09.01
(71)申请人 广西电网有限责任公司
地址 530012 广西壮 族自治区南宁市 兴宁
区民主路6号
(72)发明人 杨有慧 董申颂 凌武能 陈明媛
覃芳璐 谢代钰 陈涛 韦鑫
(74)专利代理 机构 广州市专 注鱼专利代理有限
公司 44456
专利代理师 张志鹏
(51)Int.Cl.
G06F 16/35(2019.01)
G06Q 10/10(2012.01)
G06Q 50/06(2012.01)
(54)发明名称
一种电网调度安全隐患共性问题分类方法
(57)摘要
本发明公开了一种电网调度安全隐患共性
问题分类方法, 其中方法包括获取电网调度安全
隐患问题文本, 将所述问题文本转换为数字集;
使用聚类方法对 所述数据集进行分类处理, 得到
达到一定阈值的数据集评价指标; 利用分类处理
后的数据集将所述问题文本进行分类。 本发明的
电网调度安全 隐患共性问题分类方法通过提供
的电网调度安全隐患共性问题 提炼方法, 解决了
海量安全生产隐患情况下, 人工无法有效对共性
问题分类的问题, 提供了一种共性问题分类更为
合理的新方法, 解决的现有技术中按专业或者专
家个人经验提炼的缺陷, 提高了电网调度安全的
管理效能。
权利要求书1页 说明书6页 附图2页
CN 115544249 A
2022.12.30
CN 115544249 A
1.一种电网调度安全隐患共性问题分类方法, 其特 征在于, 包括以下步骤:
获取电网调度安全隐患问题文本, 将所述问题文本转换为数字集;
使用聚类方法对所述数据集进行分类处 理, 得到达到一定阈值的数据集评价指标;
利用分类处 理后的数据集将所述问题文本进行分类。
2.根据权利要求1所述的电网调度安全隐患共性问题分类方法, 其特征在于, 所述将所
述问题文本转换为数字集包括:
利用停词库去除所述问题文本中非关键词语;
创建电力行业词库;
使用JIEBA技术结合电力行业词库, 将单个问题文本分割成多个词语, 通过特征构 建方
法赋予分割后各词语一定数值和 确定在数字集的位置 。
3.根据权利要求1所述的电网调度安全隐患共性问题分类方法, 其特征在于, 所述使用
聚类方法对所述数据集进行分类处 理, 得到达到一定阈值的数据集评价指标包括:
使用聚类方法将所述数据集分类成多个不同部分, 且分类后的多个不同部分数据 具有
相似性;
对聚类方法进行超参数优化, 分类后得到 达到一定阈值的数据集评价指标。
4.根据权利要求2所述的电网调度安全隐患共性问题分类方法, 其特征在于, 所述创建
电力行业词库包括:
收集电力行业 生产运行报告 文本;
使用TextRan k算法提取报告 文本的关键词;
利用提取的关键词构建电力行业词库。
5.根据权利要求3所述的电网调度安全隐患共性问题分类方法, 其特征在于, 所述对聚
类方法进行超参数优化, 分类后得到 达到一定阈值的数据集评价指标包括:
随机初始化聚类方法不同参数组, 分别使用不同参数组计算数据集的评价指标, 结合
不同参数组和与之对应评价指标结果, 使用TP E技术优化得到一组最优的参数, 以使 所述数
据集评价指标最优。权 利 要 求 书 1/1 页
2
CN 115544249 A
2一种电网调度安全隐患共性问题分类方 法
技术领域
[0001]本发明涉及共性分类技术领域, 具体涉及 一种电网调度安全隐患共性问题分类方
法。
背景技术
[0002]电网公司推进安全生产大检查, 发现大量电网安全隐患, 并对其进行分类、 提炼和
整改, 现阶段主要通过人工提炼安全生产隐患共性问题, 然后通常按专业或者专家个人经
验提炼。
[0003]在安全生产隐患问题较多的情况下, 上述的方法存在较大局限性: 第一, 无法全覆
盖提炼共性问题, 在 海量数据情况下分专 业、 分人开展共性问题提炼, 个人无法全部覆所有
共性问题, 跨专业的共性问题将存在遗漏; 第二, 无法全维度有效挖掘共性问题, 各项安全
生产问题相互交织复杂, 同一个问题往往涉及多个维度, 分属于不同的共性问题, 共性问题
联络拓扑极为复杂, 专 家更多聚焦已有经验提炼共性, 存在较大的局限性。
发明内容
[0004]本发明的目的在于提供一种电网调度安全隐患共性问题分类方法, 可以解决现有
技术中现有对电网生产运行中隐患共性问题进行分类的方法存在共性问题遗漏或局限性
的问题。
[0005]本发明的目的是通过以下技 术方案实现的:
[0006]本发明提供一种电网调度安全隐患共性问题分类方法, 包括以下步骤:
[0007]获取电网调度安全隐患问题文本, 将所述问题文本转换为数字集;
[0008]使用聚类方法对所述数据集进行分类处理, 得到达到一定阈值的数据集评价指
标;
[0009]利用分类处 理后的数据集将所述问题文本进行分类。
[0010]进一步的, 所述将所述问题文本转换为数字集包括:
[0011]利用停词库去除所述问题文本中非关键词语;
[0012]创建电力行业词库;
[0013]使用JIEBA技术结合电力行业词库, 将单个问题文本分割成多个词语, 通过特征构
建方法赋予分割后各词语一定数值和 确定在数字集的位置 。
[0014]进一步的, , 所述使用聚类方法对所述数据集进行分类处理, 得到达到一定阈值的
数据集评价指标包括:
[0015]使用聚类方法将 所述数据集分类成多个不同部分, 且分类后的多个不同部分数据
具有相似性;
[0016]对聚类方法进行超参数优化, 分类后得到 达到一定阈值的数据集评价指标。
[0017]进一步的, , 所述创建电力行业词库包括:
[0018]收集电力行业 生产运行报告 文本;说 明 书 1/6 页
3
CN 115544249 A
3
专利 一种电网调度安全隐患共性问题分类方法
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:28:39上传分享