虽然我们每天都看天气预报,但是你知道我们所看到的天气预报是怎么预测出来的吗?气象预报按天气预报的时效长短,可粗略分为:短时天气预报、短期天气预报、中期天气预报和长期天气预报。数值模式预报是天气预报的主要预测手段。
气象数值预报
数值模式预报是根据大气运动的数学模型,利用当前天气状况作为输入数据而做出天气预报的手段,通常使用超级计算机或分布式计算集群依据一系列动力学框架来完成计算。
天气数值模式的输出是矩阵形式,可以用图像的方式可视化。同一片区域矩阵数值越密集,代表这个区域预测的细致程度越高。如下图展示了全球模式和区域精细预报之间的关系图。
对于局部区域来说,精细化预报结果可以提供更为丰富的信息。从应用角度,精细化预报将预报精度从城市级别提升到所在地点附近级别;从研究角度,精细化预报不仅提供了某个地点从地面到高空十几公里的气温、降水、风向、风速基本气象要素,还为进一步研究影响这一地点的云的移动轨迹、增减变化趋势提供了可能。近年来各个行业对数值预报精细化需求越来越高。
制约高精度的数值天气预报模式发展的一个重要因素就是硬件设备的计算能力以及计算时间。
虽然我们国家的派-曙光超级计算机就从2018年开始正式承担起气象业务运行及科研的重任,运算能力跃居气象领域世界第三位,但可惜的是很多气象相关科研机构和研究人员往往不具备使用超算条件,这就变相地限制了一些部门和研究人员对于局部气象预报的研究。
中国"派-曙光"超级计算机
数值模式对于硬件的强烈依赖,让各行业对精细化局部气象预报信息望而却步,巨大的需求被压抑在其中。
数值模式降尺度的本质——超分辨率
上海眼控科技股份有限公司人工智能研究院独创性地发现数值模式降尺度在本质上和超分辨率的互通之处。
从根本上来说,对气象预报进行降尺度拟合,实际上是依据低分辨率的数据预测同一区域在同一时间下的高分辨率的数据。下图是超分辨率
超分辨率技术,是将一张低分辨率的图像变为高分辨率。通过估算网格密集化后,补充缺失的像素值。以下是数值模式降尺度的示例,可以发现,和超分辨率相似的是,降尺度的过程令图像变得清晰。
但是降尺度仅仅是超分辨率吗?
降尺度的挑战——模拟物理过程
降尺度的过程不仅仅是图像的精细化像素填充,而是涉及到多个天气元素之间相互作用的重新计算。下图是一个数值模式降尺度的案例,可以看出,精细化的版本中,出现了粗糙版本中所不包含的一些天气细节。
这种计算过程即使用CV领域中的超分辨率技术,也无法重现。其难点的本质在于,从单一通道来看,降尺度的计算过程“生成”了额外的信息,而机器视觉领域的超分辨率技术,只可以产生细节填充,而没有能力生成输入图片中没有出现的信息。这些额外的信息,来自于多个天气元素的物理过程,这是使用超分辨率的思想来解决数值模式降尺度的巨大挑战。
基于对这个问题的长期研究,上海眼控人工智能研究院提出Deep Hybrid Super Resolution (DHSR) 模型来模拟物理过程,来产生额外的信息。
基于DHSR的AI数值模式降尺度
前文提到,气象数值模式预报中的数据是网格化的气象元素如气压值等,而精细化的数值模式预报,不仅是将网格矩阵变得细腻那么简单,还需要考虑其他已知条件(比如湿度、温度、风场),并用神经网络去模拟它们之间的作用关系。
上海眼控人工智能研究院以超分辨率网络为主干网络,针对不同的数据类型调整网络中的长跳跃连接和短跳跃连接。用转化为图片后的某一维度的25km全球模式的气象预报和3km的对应地区和时间的降尺度数据来训练超分辨率网络,以捕捉这一区域该维度的25km全球模式与3km降尺度后的数据间的映射关系。其中针对通道的特征先进行一个空间的全局平均池化得到一个 1×1×C的通道描述;接着,再经过一个下采样层和一个上采样层得到每一个通道的权重系数,将权重系数和原来的特征相乘即可得到缩放后的新特征,整个过程实际上就是对不同通道的特征重新进行了加权分配,通过这种channel attention的机制进行特征融合,最终生成的气象图片很好的生成了特征的轮廓和细节部分。
以下是模型的部分结构
修改后的超分辨率网络在气象预报降尺度任务上的表现十分出色:
计算更快:传统的数值模式的降尺度计算需要计算中心不间断地计算几十分钟到几个小时。如果通过我们的AI超分辨率网络进行降尺度计算, 生成所需要的数据的降尺度计算通常在1s 之内。
流程高效:
数值模式所有的数据是捆绑在一起的,意味着即使你只需要某一区域某一维度的气象要素的降尺度数据,你也需要整体的计算出来这一区域所有维度的气象要素,之后再从整体的数据中提取你想要的数据。步骤异常繁琐。这样不仅导致了计算速度慢,工作和处理数据的效率也大大降低。上海眼控的DHSR模型可以直接针对性地计算出所需要的气象元素精细化结果,抛弃了冗杂繁琐的过程。
结果精准:对于依靠超分辨率网络生成的3km分辨率的降尺度预报,我们抽取批量生成的图片,与数值模式计算出来的降尺度数据转化成的图片进行SSIM分数的对比之后,得出超分辨率网络生成的图片分数可以达到0.992.可以说完全能够满足一般科研工作这对于数据的要求。
我们HDSR方法生成的图片在总体结构上十分接近传统数值模式降尺度的结果:
让我们放大9km格点间距那张图中,蓝色和紫红色的框,我们的结果和数值模式一样,模拟了物理过程,生成了输入图中不存在的信息。DHSR模型生成的信息和耗费大量计算资源的数值模式非常接近。
再看看挑战更大的,更精细的3km格点间距的相同位置。让人惊讶的是,在这么精细的尺度下,我们模型依然表现卓越,拟合出了局部地区的精细预报结果,依然和超算中心耗费大量资源使用传统数值模式的方法的结果保持高度一致。
事实证明,DHSR模型通过特殊的通道间的相互作用,拟合了物理过程,生成了在输入图中未曾呈现的局部预报结果。从单个气象元素(单个通道)的角度来看,简直是不可思议。
重要的是生成时间DHSR相对数值模式少了几个数量级。忍不住为我们眼控科技的研究院团队疯狂打call!
让我们再看看其他地区的湿度预报结果吧
再来看看我们预报局部精细化气压的结果。
经济实惠:你以为优点到这就结束了? 没有没有,你太天真了。基于AI超分辨率网络的数值模式降尺度只需要一块1080显卡就可以轻松的运行,对于硬件的需求相较于传统的数值模式降尺度简直让人惊叹不已。也就是说你只需要一台拥有1080显卡的笔记本电脑,坐在办公室里,就可以与拥有一排排机柜的计算机中心有着同样的体验。
这么一个计算快速、流程高效、结果精准且经济实惠的模型,将数值模式降尺度的任务变得亲民且高效,这不仅将成为撬动气象领域变革的一个支点,也将直接解锁局部地区对于精细气象数据的更大需求。
总结与展望
在说了这么多之后,相信大家对于超分辨率以及数值预报有了比较深入的了解。尽管目前眼控科技的小伙伴们成功地解决了降尺度对于算力需求过高的问题,但是对于庞大的气象系统而言是远远不够,未来在气象领域有更多的挑战在等待着我们。眼控人也将抱着“路漫漫其修远兮,吾将上下而求所”的信念,在人工智能气象领域踏浪前行,为中国的智能气象领域贡献出自己的力量。小伙伴们如果你也觉得热血沸腾的话,快点来加入我们吧!
|