对于AI在气象预报方面应用的认识

September 2018 · 1 minute read

之前在一篇关于 机器学习在空气质量预报方面应用 的总结中涉及到过这个话题。

现在大数据和 AI 实在是太热门了,气象也希望能借助大数据和 AI 的力量取得新的进步。

其实,返回头想想,气象本身一直就是大数据,是专业领域的一种大数据,特点包括但不限于:

  1. 多维度。包括空间、时间、要素等。
  2. 多源。来源包括观测站点和探空传感器、卫星遥感、模式预报等等。
  3. 异构和标准化。数据格式包括文本、二进制、图像、netCDF、HDF 等等,但又有很强的标准化。
  4. 质量控制和”三性”。监测数据质量控制,数据的准确性、及时性、代表性。
  5. 时空数据分辨率、覆盖度或完整性。监测数据的时间和空间分辨率和覆盖范围,预报数据的积累等等。
  6. 海量。数据量实在是太大了。

AI 在气象预报中能做什么呢?之前的总结中跟图像、语音识别问题的对比主要是从准确率上说的(也提到了在短时临近预报和气候预测方面的适用性),其实 更重要的一个区别 是,图像和语音识别这类问题都是用 AI 从图像和语音属性特点中学习识别模式,而气象预报(常规的天气预报)则不同:它不能从未知的“实况”来提取属性特点进行识别,而只能从数值预报对未来的预报结果中提取特征属性从而对未来进行预报。

也就是说,AI 用于图像和语音识别这类问题,训练用的是本身(属性 X 来自于目标 Y 本身),而用于天气预报则不一样,是把数值预报的结果(多时空要素,包括目标要素本身)当作目标要素 Y 的属性特征 X,即 X 并不是从 Y 提取获得的。因此,AI 应用于气象预报,这个用法本身和以往的订正算法本质上是一样的,目的或者说用途在于减小数值预报的误差,而不是直接进行预报。

因为脱离开数值预报,AI 是不能单独进行天气预报的。天气系统的演变是数学物理方程所描述的,单靠 AI 是做不到的。

数值预报是数学物理方程对天气变化的描述,是现代气象预报的基础。那么 AI 能否替代数值预报,给天气预报带来“质的飞跃”呢?

如果可以的话,应该早就改变了,但实际上没有。机器学习方法和 AI 相比于传统的动力统计订正方法,在减小数值预报误差方面的表先可能会更好一些,但是没有本质上的改变。比如一个地方气温的预报误差,传统方法能将均方根误差 RMSE 减小到 2.1℃,而用某种机器学习或 AI 算法可以将 RMSE 减小到 1.9℃,而始终无法减小到更小了,似乎到达了极限。

AI 有没有可能发展到能够替代数值预报的水平来做天气预报?

答案是不能。数值预报所依赖的数学物理方程是试图对大气的变化进行确定性的描述,然而,大气是一个极其复杂的非线性系统,描述大气物理过程的方程组对初始误差高度敏感,初始时刻微小的改变都会导致计算结果极大的差异,美国气象学家洛伦茨(Lorenz, 1963)从理论上解释了大气中不确定性存在的必然性。机器学习和 AI 则并不是从物理方面进行描述,也不寻求物理方面的解释。目前还没有什么 AI 系统发展到能够达到数值预报的水平,如果可以的话,那么它的复杂程度和计算成本估计会太超乎想象以至于不现实、不可能存在。人创造的 AI 有可能走火入魔,说出一些出格的话、干出一些惊人的事,但是对自然界的预测始终不能超越人类知识的边界。

其实改进数值预报准确率一直都在演进,集合预报、多模式集成、超级集合,各种集合和集成算法的尝试,统计学、机器学习、人工神经网络,都包括在内。数值预报模式、数据同化的改进应该是基础性的,各种订正的作用是“锦上添花”,没有锦、光有花不行,锦不好、光靠花也不行。

气象预报是有 可预报性 问题的,也就是总有那么一部分 不可预报。而这种 可预报性不可预报性 在不同的时间和空间上是变化的,在不同的时间或空间尺度上也是变化的。解释一下:

另外,准确 这个概念其实是需要先给出定义,然后才能谈论的。光说“准确”两个字是不行的,一定要有定量化的标准,才能进行计算和比较。而且当需要比较的时候,准确的定义必须一致,也就是有一致的标准。比如气象部门说的气温预报准确,其实指的是预报误差的绝对值在 2℃ 以内,降水预报准确可能说的是预报了暴雨(24h 降水量大于 50 毫米)也确实出现了暴雨(实际下了 100 多毫米)。标准不同,准确与否也不一样。准不准确要看人的需求。


【参考文献】

[1] 周秀骥. 大气随机动力学与可预报性[J]. 气象学报, 2005, 63(5):806-811.

[2] 穆穆, 李建平, 段晚锁, 等. 气候系统可预报性理论研究[J]. 气候与环境研究, 2002, 7(2):227-235.

[3] Eugenia Kalnay. 大气模式、资料同化和可预报性[M]. 气象出版社, 2005.