Huracan:完全端到端的、纯数据驱动的集合预报系统,标志着气象预测的重大突破。
• 端到端设计:集成集合数据同化与集合天气预报,完全依赖观测数据输入,无需传统数值天气预报(NWP)产生的初始条件,打破了以往模型受限于NWP初值的瓶颈。
• 观测数据融合:涵盖微波和高光谱红外探测器卫星(Metop、NOAA、JPSS)、地球静止轨道卫星辐射率、地面气象站与探空气球等多源观测,经过质量控制、光谱压缩与空间时间插值处理,确保数据质量与时空一致性。
• 创新架构:基于球面傅里叶神经算子(SFNO)网络,融合Swin Transformer替代传统多层感知机以增强建模能力,滤波器权重大幅压缩(参数减少12倍),并引入噪声嵌入适应随机性,实现更稳定的自回归推断。
• 训练策略:多阶段训练流程,先用ERA5数据训练确定性模型,再引入噪声及CRPS损失微调为随机基模型,随后分别针对同化与预报模型进行长时序自回归微调,最终联合训练生成完整的Huracan系统。
• 预测表现:在2024年100个发报时刻、10天预报范围内,Huracan在75.4%的变量和预报时间点上,CRPS指标达到或优于欧洲中期天气预报中心(ECMWF)ENS系统,尤其在温度和湿度上表现更佳;相比以ECMWF ENS初始条件与ML预报混合的Huracan-Hybrid,Huracan仍在60.8%的情况下表现更优。
• 速度优势:整个系统可在观测数据到达后数分钟内完成初始条件生成与预报输出,相较传统NWP系统计算成本低几个数量级,极大提升预报效率。
• 未来展望:尽管在气压和位势高度变量上表现略逊于部分指标,Huracan通过端到端学习优化观测数据同化,展现出突破传统物理模型限制的潜力,为气象领域开启了机器学习驱动的高效、准确且实时的预报新时代。
了解更多👉 arxiv.org/abs/2508.18486
气象预测 机器学习 数据同化 集合预报 端到端系统