“最近降水在西边105公里”
分钟级降水、未来3小时和48小时内的可视化雷达图,这些越来越精细、准确率越来越高的天气预报,现在只需要一个手机App就可以随时随地查看了。
曾经,渔民们唯有求助妈祖,祈祷出海的渔获和平安;商朝后期,人们开始用占卜预测风、雨、水;郭守敬在元世祖时代完成了二十四节气的精准测定,用于农耕;清康熙十六年“钦天监”连续记录了180年的气象观测记录《晴雨录》;1915 年,中国人制作了第一张天气图,这张图的到来与西方相比,虽然晚了整整一百年。但如今,我们也拥有了国际水准的现代化气象卫星系统,建立了精细化天气预报系统。
中国人制作的第一张天气图
风云莫测,由此可见预测天气是世界上最复杂的问题之一,但我们却孜孜以求地用最尖端的计算科学来抵达它。为什么我国气象事业经过短短几十年的发展释放出了惊人的后发之力?现代气象场景背后又有哪些支柱力量?
2022
风云不再莫测
1950年,美国气象学家朱尔·格雷戈里·查尼制作出世界首张数值预报天气图。数值预报,真正引领气象预报技术走向现代化。
纵观“现代化”的进程,无不伴随着“流程化”与“标准化”,气象现代化也不例外。
我们在互联网、移动终端上看到每一个气象数值都是经过了科学严谨的推演过程。气象部门首先通过观测站、雷达、热气球,以及卫星遥感等方式对地形、地表、气温、湿度、风向和风速等气象信息进行观测,以获取数据;在数据获取阶段,除了从省市分局数据中心获取已加工或者未加工的区域数据,还会进行国际数据交换,获取其他国家气象数据。
获取来的数据要先进行数据同化处理,以便为模式运行提供更为准确的气象初始信息,之后利用高性能HPC并行计算,对数值方程式求解,多模式集成计算的结果进行可视化处理后,以图形化呈现给气象专家进行会商。根据计算结果,结合预报员经验分析并按照气象会商流程,形成预测结果。最终就是我们在天气预报、互联网、移动终端设备等终端上看到的图形、动画、网页类的可视化结果。
现代公众气象服务和防灾减灾体系就像是人们社会生活中的视觉、触觉、听觉与嗅觉,帮助我们预知“世界”。而气象专项服务则覆盖了农业气象、环境气象、交通气象、能源气象等领域,使风云不再莫测。利用气候资源、规避不利气象因素影响,正成为促进产业经济效益的重要手段。
2022
气象预报为何越来越准确
从前,人们时常调侃,天气预报中的局部地区是一个神秘的地区,没人知道它在哪里。而根据中国气象局报告,现在气象预报已经可以精细到乡镇(街道),甚至社区。在北京2022年冬奥会气象保障服务中,气象部门构建了冬奥气象“百米级”预报技术体系,实现了冬奥山地赛场的0至10天“百米级”网格气象预报,以及冬奥关键点位0至10天定时、定点、定量气象预报。
气象服务本质是数据服务,气象的核心业务在于数值预报,是利用当前气象状况作为输入数据而作出气象预报的手段。数值预报首先需要气象科学家将气象预报问题抽象为地球表面、云、太阳灯实体之间的物理过程和相互关系,描述为流体力学和热力学方程组,利用各种观测数据取得初始条件,再使用计算机用数值模拟的方法求解方程组,获得预报值。
气象数值预报的复杂度与时间尺度成正比,与空间尺度成反比。简单来说,气象学按尺度分为行星尺度、大尺度、中尺度和小尺度。行星尺度的时间尺度是恒久,空间尺度逾万公里,比如对西风带和东风信风带的研究;大尺度气象学的时间为数月,空间数千公里,比如副热带高气压和季候风的研究;而中尺度气象学是研究中尺度天气系统及与其相联系的严重灾害性天气的学科,其时间尺度为若干小时,空间为数十至百多公里,主要研究两类中尺度天气现象,一类是雷暴、暴雨、冰雹、大风、下击暴流等对流性天气,另一类是局地低云、浓雾等稳定性天气。而小尺度气象学主要研究若干分钟内小于数公里的气象现象如龙卷风。
气象行业数据海量,类型和来源多样,而且计算量大,对时延敏感,处理流程复杂,要求任务在规定的时间内完成,是典型的计算密集、IO密集(数据量大带宽高)、紧耦合(时延低)的HPC应用场景。此外,由于气象预测本身具有“蝴蝶效应”特性,且单数值模式预测的准确性能低,因此在该阶段一般采用多模式集成预测。
过去,由于天气预报涉及海量数据的计算,算力在很大程度上是提升天气预报精确性的瓶颈。如今,精准天气预报需求的爆发和数据量持续增长,对数据分析的实时性和精确度要求持续提升,更快的更新速度需要AI支撑,而且气象数据作为战略性保密数据,安全防护能力要求高。然而,传统的HPC存储在混合负载性能、成本、跨协议访问等多方面存在壁垒。随着HPC、大数据、人工智能的日趋融合,算力瓶颈已经被打破,高性能计算的重心开始从以计算为核心,向以数据为核心的计算演进,高性能数据分析(HPDA)逐渐成为气象预测新的发力点。
2022
创建大气“数字孪生兄弟”
在气象学界有一个共识:当模式的预报时效越长,时效间隔越密,网格点间距越小,网格点数值和未来实况差异越小,就证明该模式系统性能越好,该国气象水平越发达。
国家超级计算济南中心基于自身软硬件环境,研发了高分辨率的数值预报关键技术,助力打造山东省精细化集合数值天气预报系统,为山东省天气预报及灾害性、关键性、转折性重大天气的精确预报提供技术支撑。
此前,国家超级计算济南中心为应对异构算力和多样化应用面临三大挑战:数据孤岛,海量数据进不来、出不去;混合负载,高带宽与高性能业务并存;智能管理,数据全生命周期安全管理的需求。
为此,国家超级计算济南中心探索以华为OceanStor Pacific构建分布式存储统一数据底座,率先打造超算互联数据一张图,驱动数据密集型科学研究发展。今年1月,济南超算完成华为自研文件系统5000节点超大规模功能测试,实现超算存储系统国产化和自主安全可控。如今,山东省气象网格直径已经缩减到1km,并可以对未来40天气象进行预测,实现水平分辨率实现4KM山东省覆盖,并提供每天两个时次的预报产品。
大科学往往与大数据相伴。作为核心实时系统,数值预报数据处理量大,处理性能要求高。其业务系统主机、存储设备和数据通讯网络一般都要求为高性能稳定的设备。济南超算存储系统稳定性和性能均能满足E级超算系统应用,应用测试结果追平同等配置的DDN Lustre文件系统,是面向大科学领域如Alpha Fold DDN Lustre文件系统的2倍。今年2月,济南超算使用华为自研NetQoS自动调优算法成功解决2000节点规模多元化供应下RoCE对接和网络拥塞难题,支持不同组网TOP和规模。测试性能与稳定性均优于或持平于行业垄断地位的InfiniBand网络,实现了从大规模无损网络软硬件国产化和自主安全可控。
为什么选择华为OceanStor Pacific作为高性能数据分析(HPDA)的承载底座?国家超级计算济南中心总工程师王继彬指出,首先是在对超算Top应用测试分析中,华为OceanStor Pacific应用性能领先,同规模算例耗时从240分钟降为85分钟,而性能提升184%。同时,华为OceanStor Pacific超高密设计,达到业内1.3倍性能密度,容量、性能随节点数增加而线性增长,其EC算法、跨节点保护能力等保障数据安全,还可以满足未来数据爆炸式增长。
近些年 ,各国争相打造“气象超脑”,英国为了打造世界上最快的天气预报超级计算机,斥资12亿英镑;为提高预报精度,美国国家海洋和大气管理局将超级计算能力提高3倍;日本气象厅气象研究所建设的新超级计算机系统也已经投入运行。这背后,实质上是各国在超级计算、数据科学、机器学习和人工智能等领域的比拼。
在我国,“东数西算”的提出,同样是在超级计算、数据科学等领域的一次“技能大考”。“东数西算”本质上是打造数据全局数据视图,推动一体化的数据平台与生态创新,提升数据利用率,深挖数据价值。
山东省超算互联网的构建正是在“东数西算”大背景下的一次数据密集型超算互联创新示范。济南超算构筑了以济南、青岛、淄博节点为核心,基于算力互联网络,搭建全局数据共享流动总线,构建统一元数据平台,实现城市直连省核心,数据全局访问、按需流动、最佳分布与精准定位。
济南超算率先打造超算互联数据一张图
伴随着人工智能和大数据等新兴产业的爆炸式增长,超算需要处理更多数据,数据量的激增给超算中心带来传输与存储成本的挑战,而在线传输这些数据可能需耗费数周,离线拷贝TB-PB级数据时更是要耗费数月,这些都是超算中心在转型过程中无法规避的难题。
济南超算也面临着同样的问题。针对数据重复程度高、数据调度难、数据占用空间大问题,济南超算联合华为自研无损压缩算法,优化数据图像压缩流程,实现高分卫星压缩率较行业通用gunzip工具提升超100%,达全球第一,压缩效率提升超60%,解压效率提升超50%。提升了存储空间的利用率,大大降低了量数据的存储成本,为可持续发展降本增效。
HPDA和AI-based的HPC等数据密集型HPC,逐渐成为HPC产业发展的新趋势。借助华为OceanStor Pacific分布式存储系统和全栈气象HPC全栈解决方案,不仅推动了HPC产业升级,在数据端构建大气的“数字孪生兄弟”,成功解码“地球风云”让气象预测效率更高、性能更佳、成本更优,让“计算天气”成为可能。唯有更多地认识地球、了解大气的运转规律,才能人们在经济、人文布局上拥有更多主动权。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.