(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211067784.0
(22)申请日 2022.09.01
(71)申请人 中国科学院空天信息创新研究院
地址 100190 北京市海淀区北四环西路19
号
(72)发明人 李睿 施建成 潘金梅 雷永荟
(74)专利代理 机构 北京金信知识产权代理有限
公司 11225
专利代理师 贾然
(51)Int.Cl.
G06F 16/29(2019.01)
G06F 16/2458(2019.01)
G06N 20/00(2019.01)
G06Q 50/26(2012.01)
(54)发明名称
一种基于站点集水区小样本观测的径流重
建方法和系统
(57)摘要
本发明提出一种基于站点集水区小样本观
测的径流重建方法和系统。 包括: 选取预设n年的
气象水文时间序列数据和月径流量的观测数据
作为模拟样 本, 根据年径流量排序后选取最大最
小年份数据为一组, 将模拟样 本分为训练集和预
估集, 遍历 模拟样本, 得到T组训练集和其余样本
构成的预估集, 应用训练集构建机器学习模拟模
型, 得到预估集的月径流量的均方根误差; 以T组
训练集的组数为自变量, 以均方根误差为因变
量, 在T组训练集中, 利用突变点检验方法确定重
构训练样 本; 应用重构训练样 本构建机器学习预
估模型; 以气象水文时间序列数据为自变量重建
月径流量的序列。 本发明实现了长时间序列的径
流预报, 减少了丰水年和枯水年样 本训练造成的
径流预报 偏差。
权利要求书2页 说明书8页 附图3页
CN 115408485 A
2022.11.29
CN 115408485 A
1.一种基于站点 集水区小样本观测的径流重建方法, 其特 征在于, 所述方法包括:
步骤S1、 获取 水文站点的月径流 量的资料, 确定集水区范围;
步骤S2、 根据所述集水区范围得到站点的集水区地理范围, 在所述集水区地理范围内,
获得逐个格网月尺度的气象水文时间序列数据;
步骤S3、 选取预设n年的气象水文时间序列数据和月径流量的观测数据作为模拟样本,
在所述模拟样本中, 根据年径流量排序后选取最大最小年份数据为一组, 将所述模拟样本
分为训练集和预估集, 遍历所述模拟样本, 得到T组训练集和对应的预估集, 应用所述训练
集构建机器学习模拟模型, 得到所述预估集的月径流量, 再应用所述预估集的月径流量, 得
到所述预估集的月径流 量的均方根 误差;
步骤S4、 以所述T组训练集的组数为自变量, 以所述组数对应的预估集的月径流量的均
方根误差为因变量, 在所述T组训练集中利用突变点检验方法确定 重构训练样本;
步骤S5、 应用所述重构训练样本构建机器学习预估 模型;
步骤S6、 以气象水文时间序列数据为自变量重建月径流 量的序列。
2.根据权利要求1所述的一种基于站点集水区小样本观测的径流重建方法, 其特征在
于, 在所述步骤S1 中, 所述月径 流量的资料包括不连续年份的月径 流量的数据, 同时所述月
径流量的资料不能有缺 值。
3.根据权利要求1所述的一种基于站点集水区小样本观测的径流重建方法, 其特征在
于, 在所述 步骤S2中, 所述 根据所述 集水区范围得到站点的集水区地理范围的方法包括:
在所述集水区范围, 使用DEM地形图确定水系流向, 根据所述水系流向将汇集在站点的
河流流经区域 合并得到集水区地理范围。
4.根据权利要求1所述的一种基于站点集水区小样本观测的径流重建方法, 其特征在
于, 在所述 步骤S2中, 所述气象水文时间序列数据包括:
格网月降水、 格网月降水与蒸散发之差和格网月产流 量。
5.根据权利要求1所述的一种基于站点集水区小样本观测的径流重建方法, 其特征在
于, 在所述步骤S 3中, 根据年径 流量排序后选取最大最小年份数据为一组, 将所述模拟样本
分为训练集和预估集, 遍历所述模拟 样本, 得到T组训练集和对应的预估集的方法包括:
步骤S31、 将n 年的月径流 量的观测数据按照年径流 量大小排序;
步骤S32、 再将排序为i的年份与 排序为n‑i+1的年份为一组, 所述模拟月径流量样本被
分为训练集和预估集;
步骤S33、 应用 步骤S32的方法, 遍历所述模拟样本, 得到T组训 练集, 其余样本为预估
集。
6.根据权利要求1所述的一种基于站点集水区小样本观测的径流重建方法, 其特征在
于, 在所述 步骤S3中, 所述 n≥3。
7.根据权利要求1所述的一种基于站点集水区小样本观测的径流重建方法, 其特征在
于, 在所述步骤S4中, 所述以所述T组训练集的组数为自变量, 以所述组数对应的预估集的
月径流量的均方根误差为因变量, 在所述T组训练集中利用突变点检验方法确定重构训练
样本的方法包括:
步骤S41、 将其余样本构成的预估集的月径流量的均方根误差时间序列以t为节点分为
1‑t以及t‑T两组子时间序列, 并计算第一统计量Ut,T;权 利 要 求 书 1/2 页
2
CN 115408485 A
2其中,
sgn(·)为符号函数, RMSE为预估集的
月径流量的均方根 误差;
步骤S42、 应用所述第一统计量Ut,T计算显著性水平ρ;
其中,
KT为第二统计量, KT=max|Ut,T|;
步骤S43、 通过显著性水平ρ, 得到当KT为预设值, 且ρ 小于0.01时的t, 以组数为t的训练
集作为重构训练样本 。
8.一种用于基于站点 集水区小样本观测的径流重建系统, 其特 征在于, 所述系统包括:
第一处理模块, 被 配置为, 获取 水文站点的月径流 量的资料, 确定集水区范围;
第二处理模块, 被配置为, 根据所述集水区范围得到站点的集水区地理范围, 在所述集
水区地理范围内, 获得 逐个格网月尺度的气象水文时间序列数据;
第三处理模块, 被配置为, 选取预设n年的气象水文时间序列数据和月径流量的观测数
据作为模拟样本, 在所述模拟样本中, 根据年径 流量排序后选取最大最小年份数据为一组,
将所述模拟样本分为训练集和预估集, 遍历所述模拟样本, 得到T组训练集和对应的预估
集, 应用所述训练集构建机器学习模拟模型, 得到预估集的月径流量, 再应用所述预估集的
月径流量, 得到预估集的月径流 量的均方根 误差;
第四处理模块, 被配置为, 以所述T组训练集的组数为自变量, 以所述组数对应的预估
集的月径流量的均方根误差为因变量, 在所述T组训练集中, 利用突变点检验方法确定重构
训练样本;
第五处理模块, 被 配置为, 应用所述重构训练样本构建机器学习预估 模型;
第六处理模块, 被 配置为, 以气象水文时间序列数据为自变量重建月径流 量的序列。
9.一种电子设备, 其特征在于, 所述电子设备包括存储器和处理器, 所述存储器存储有
计算机程序, 所述处理器执行所述计算机程序时, 实现权利要求1至7中任一项所述的一种
基于站点 集水区小样本观测的径流重建方法中的步骤。
10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有计算机
程序, 所述计算机程序被处理器执行时, 实现权利要求1至7中任一项所述的一种基于站点
集水区小样本观测的径流重建方法中的步骤。权 利 要 求 书 2/2 页
3
CN 115408485 A
3
专利 一种基于站点集水区小样本观测的径流重建方法和系统
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:30:07上传分享