DeepMindはDeep Generative Models of Rainfall(DGMR)のデータセットとトレーニング済みモデルスナップショットをオープンソース化した。短期の降水量予測用のAIシステムだ。58人の専門気象学者が、他の既存の方法との比較で実施した評価で、DGMRはテストケースの89%で精度と有用性で1位にランクインした。
モデルといくつかの実験がNatureに掲載された記事に記載されている。DeepMindは、ナウキャストを行うために英国気象庁と共同でDGMRを開発した。ナウキャストは、降水量の短期的な高解像度の予測である。DGMRは生成モデルと呼ばれる深層学習手法を使って「レーダームービー」を生成するための学習をする。短期の一連の降雨のレーダー画像が与えられると、将来のレーダー画像の予測を学習する。そうすると、将来の降水量と場所を予測する。DeepMindは次のように述べている。
これはエキサイティングな研究分野であると考えています。私たちの論文が、競争力のある検証と運用上の実用性の両方を提供できるデータと検証方法を提供することで、新しい研究の基盤として役立つことを願っています。また、英国気象庁とのコラボレーションにより、機械学習と環境科学の統合が促進され、変化していく気候における意思決定がより適切にサポートされることを願っています。
ナウキャストは多くの分野で意思決定を支援するためによく使われている。航空交通管制やエネルギー管理などである。そのため、その精度は経済的および安全性に影響を及ぼす。STEPSやPySTEPSなどの現在の方法では、気象の振る舞いを表す物理方程式を解く数理アプローチをよく使っている。これらのシステムは、予測のアンサンブルを生成することにより、予測の不確実性をモデル化している。さらに最近では、研究者はレーダー観測のデータセットでトレーニングされた深層学習モデルを開発した。ただし、DeepMindチームは、このモデルは「複数の空間的・時間的集約にわたった一貫した予測を提供することができない」ため、運用上の有用性が限られていることを述べている。
DGMRモデルは、条件付き敵対的生成ネットワーク(GAN)をベースとしている。ジェネレータネットワークは、観測された4つのレーダーフレームをコンテキストとして取り込み、次の18フレームの出力予測を生成する。ジェネレータは2つの弁別器ネットワークとともにトレーニングされる。弁別器ネットワークは、実際のレーダーデータと生成されたデータの違いを区別することを学習する。1つの弁別子はフレーム内の空間的一貫性にフォーカスしており、もう1つは一連のフレームを通した時間的一貫性にフォーカスしている。システム全体は、2016年から2019年までの、英国でのレーダー観測からの履歴データでトレーニングされている。トレーニングされたモデルは、単一のNVIDIA V100 GPUを使って「1秒強」で予測を生成できる。
DGMRのパフォーマンスを評価するために、DeepMindは3つのベースラインモデル(PySTEPS、UNet、MetNet)と比較した。精度と価値の一般的なランク付けに加えて、専門の気象学者のグループも、唯一の「気象学的な挑戦イベント」に対してモデルの予測を評価した。このケーススタディでは、グループの93%がDGMRの結果を1番とした。DeepMindチームはさらに、いくつかのメトリックでモデルを評価した。例えば、クリティカルサクセスインデックス(CSI)、放射状に平均化されたパワースペクトル密度(PSD)、連続ランク確率スコア(CRPS)などである。これらの指標について、DGMRはベースラインと比較して「競争力」があった。
天気予報用のAIモデルは活発な研究分野である。InfoQは以前、暴風雨によって引き起こされた停電を予測するためのAIモデルを記事にしている。また、気候のモデリングに使用できる偏微分方程式を解くためのモデルについても記事にしている。Googleは最近MetNet-2を発表した。これはMetNetの「パフォーマンスを大幅に向上させた」ものである。
RedditでのDGMRに関する議論で、あるコメント提供者はこのアプローチの有用性に疑問を投げかけた。また、別の指摘もある。
GANは基本的に、L1予測に加えてもっともらしい詳細の幻覚を起こさせているだけです。しかし実際には、それでも、より高い予測スキルと価値に至っている。他の主要なディープネットワークや統計ベースラインよりも複数のメトリックで高い予測パフォーマンスとなっている場合、このメソッドは本当にゴミでしょうか。さらに、GANモードドロップを回避するための研究がたくさんあります。これはベースラインアプローチに統合できるものです。さらなるパフォーマンスを向上させるためには、これが非常に有望な方法のように思います。
トレーニングされたDGMRモデルとデータセットはGitHubで入手できる。