现在到处都是人工智能和机器学习的新闻,气象也在凑热闹。看热闹的不怕事大,我们也来围观。
话说回来,其实,机器学习在气象预报方面的能力是不能跟在图像语音识别等方面相比的。道理很简单,图像语音识别这类问题是比较明确的,不确定性很小,人工的识别准确率很高,机器学好了可以更高更快。气象预报就不一样了,不管是人工基于天气学原理的分析还是计算机基于数学物理模型的的预报,准确率的水平都不能跟图像语音识别这类问题相比,不确定性还是太高了。如果说机器学习在气象上有好的应用方面的话,一定是那些不确定性相对比较小的地方(比如基于雷达回波的短临天气预报),或者数学物理模型还无法描述的地方(比如气候预测),也许能够取得比常规方法好一些的结果。能好多少,不知道,但是不会有本质的飞跃。
这里我们做一点简单的工作,基于机器学习的方法来试着做做空气质量预报。总体思路是这样的:从网上获取空气质量的历史数据和实时更新的监测数据,从网上获取天气实况的历史数据和实时更新的天气预报数据,用机器学习的方法发掘空气质量和气象条件之间的关联,构建基于气象因素的空气质量预报模型,最后用天气预报来预测未来同期的空气质量。所以我们的工作分为以下几个部分:
- 爬取空气质量和天气数据。
- 数据信息的转换(为构建和训练模型做准备)。
- 尝试构建和训练模型,并进行评估。
- 实际运用于日常预报工作,实现自动化运作。
Let’s GO!