击败全球o系统覆盖国家，谷歌洪水预测模型再登ature极术社区|洪水预报模型_干旱

从古至今，人类在面对洪水这样的自然灾害时，往往处于弱势地位。谷歌研究科学家 Grey Nearing 曾在其论文中表明，一个有效的洪水预报系统能够将相关死亡人数减少 43%，经济损失降低 35%-50%。可见，建立洪水预报系统是人类应对洪水灾害的一种重要手段。

当前的全球洪水预报系统大多依赖沿河设立的观测站，受限于部署成本，低收入和中等收入国家的流量计安装量往往较低，导致该类国家在洪灾来临时难以提前做好应对措施。据 World Bank 估计，若将发展中国家的洪水预报系统提升至发达国家水平，每年将有望拯救约 2.3 万人的生命。针对无测站流域建立洪水预报系统已迫在眉睫。幸运的是，随着科技的发展，人工智能 (AI) 在洪水领域的应用为无测站流域的洪水防御带来了希望。来自 Google Research 的 Grey Nearing 及其团队开发了一个基于机器学习的河流预报模型 (river forecast model)，该模型能够提前 5 天实现对洪水的可靠预测，在对 5 年一遇的洪水事件进行预测时，性能优于或相当于目前预测 1 年一遇的洪水事件，系统可覆盖 80 多个国家。

研究亮点：

代表地理和地球物理变量的静态流域数据来自 HydroATLAS project，包括长期气候指标（降水、温度、雪覆盖率）、土地覆盖以及人为属性等。

历史气象时间序列数据：来自 NASA IMERG, NOAA CPC Global Unified Gauge-Based Analysis of Daily Precipitation 和 ECMWF ERA5-land reanalysis。变量包括每日总降水量、气温、热辐射、降雪量和地表压力等。

基于 LSTM 的河流预报模型架构该研究依次利用两个应用的长短期记忆网络 (LSTM) 构建河流预报模型，其核心是编码器-解码器机制 (encoder–decoder model)。其中 Hindcast LSTM 接收历史天气数据，Forecast LSTM 接收预报天气数据，模型的输出是每个预测时间步的概率分布参数，它代表了对特定河流在特定时间容积流量的概率预测。

此外，研究人员在 50,000 个小批量 (minibatches) 上对该模型进行训练，所有输入数据预先进行了标准化处理。为增强模型的学习能力，研究人员为编码器 (encoder) 和解码器 (decoder) LSTM 设置了单元状态 (cell state) 为 256 的隐藏层节点数 (hidden size)，以及 linear-cell-state transfer network 和 nonlinear hidden-state transfer network。

研究人员采用交叉验证在 5,680 个流量计上训练并在样本外测试河流预报模型，确保模型的泛化能力得到有效评估，提高预测可靠性。

首先，在时间维度上，设计交叉验证折叠，任何监测站在一年内的测试数据都不得与其所使用的训练数据重叠。在空间维度上，采用 k 折交叉验证 (k = 10)，将数据在空间维度上均匀分割。重复执行这两个交叉验证过程，避免训练和测试之间的数据泄露。

其次，为进一步考察模型在不同地理区域和环境条件下的表现，研究人员还进行了更多类型的交叉验证实验，包括但不限于：按照各大洲 (k = 6)、不同气候带 (k = 13) 、水文分离的流域群体 (k = 8) 等进行非随机空间分割。

河流预报模型与GloFAS模型在即时预测下

预测2年重现期事件的F1 scores得分差异

即时预测下

不同重现期事件的精确度和召回率分布情况

第二，研究人员分析了即时预测下，不同重现期事件的精确度和召回率分布情况。

结果表明，河流预报模型在预测所有的重现期事件中表现出更高的可靠性。对于预测极端事件的精确度，河流预报模型在 5 年重现期上与 GloFAS 在 1 年重现期上无显著差异，而召回率高于 GloFAS。这说明，河流预报模型预测 5 年重现期事件的准确性优于或相当于 GloFAS 预测 1 年重现期事件的准确性，即其预测更长重现期洪水事件的可靠性优于目前最先进模型预测 1 年重现期洪水事件。重现期：某个洪峰流量是多少年一遇，其中的多少年就是重现期。重现期越长，洪水的量级越大，重现期越短，洪水就越小。

提前0-7天预测时，不同重现期事件的F1 scores分布蓝色虚线为参照基准线

第三，研究人员分析了提前 0-7 天预测时，不同重现期事件的 F1 scores 分布。

结果表明，对于预测 1 年 (a)、2 年 (b)、5 年 (c) 和 10 年 (d) 重现期事件，河流预报模型在最多提前 5 天的情况下，其 F1 scores 要么高于 GloFAS 的即时预测，要么无显著差异。这说明，河流预报模型在提前 5 天的时间内，洪水预报能力优于或相当 GloFAS。

不同地理位置和重现期的 F1 scores

第四，研究人员分析了 F1 scores 在预测不同地理位置和重现期事件时的分布情况。

结果表明，这两种模型在不同地理位置的可靠性存在显著差异。此外，在预测 1 年 (a)、2 年 (b)、5 年 (c) 和 10 年 (d) 重现期事件中，河流预报模型在不同地理位置上的 F1 scores 与 GloFAS 相比均较高或无显著差异。

图源：中国地图面对洪水危害，我国自主研发的新安江模型，基于长期实践积累和对水文规律的深入学习，将全流域划分为多个单元子流域，并考虑地形、土壤、植被等因素对水文过程的影响，提供准确的水文预测结果，被广泛应用于防洪减灾等。事实上，人类从未停止探索更加有效的洪水防御措施，尽管无法从根本上消除洪灾，但通过先进的洪水预报系统，提前预知灾害并采取措施，可以很大限度减少洪灾对人类社会的负面影响。如今，基于 AI 技术构建的洪水预报系统已不再局限于某个特定区域，或许也将在未来覆盖全球，保护更多市民免于洪水危害。

THE END

击败全球o系统覆盖国家，谷歌洪水预测模型再登ature极术社区

ature重磅：击败最先进全球洪水预警系统，提前天预测河流洪水，每年挽救数千人生命流量水文地质灾害

净水技术

防汛抗洪中的高科技：“最强大脑”“数字孪生”“算法模型”大显身手灾害汛情水文防洪工程农作物受灾面积

击败全球o系统覆盖国家，谷歌洪水预测模型再登ature极术社区

基于水文水动力耦合模型的铜山城区洪水预报

我院梁忠民教授科研团队在洪水预报不确定性全过程降低控制理论研究中取得系列进展

案例数据同化在一维水动力洪峰预报模型中的应用数值模拟

省遭受重大洪灾，机器学习未来能预报么腾讯云开发者社区

大模型智慧水利解决方案pptx