Googleの子会社であるDeepMindの研究者が、DM21をオープンソース化した。これは、電子密度を化学相互作用エネルギーにマッピングするためのニューラルネットワークモデルである。これは量子力学的シミュレーションの重要なコンポーネントである。DM21は、いくつかのベンチマークで従来のモデルよりも優れている。PySCFシミュレーションフレームワークの拡張として利用できる。
このモデルは、Scienceに掲載された記事に記載されている。DM21は、ニューラルネットワークを使って、密度汎関数理論(DFT)のエネルギー密度汎関数成分を近似値を求める。DFTは分子の量子力学的挙動を記しているものである。DM21では以前の関数近似のシステム上の問題に対処します。以前の関数近似では「分数電子特性」を持つシステムを正しく制御できなかった。このモデルは、電子密度のグリッドを入力として受け取る多層パーセプトロン(MLP)アーキテクチャをベースとしている。3つのベンチマークデータセット(Bond-breaking Benchmark(BBB)、GMTKN55、QM9)で評価した場合、このモデルは「最高のパフォーマンス」の既存の実装のうち4つを上回った。DeepMindチームは次のように述べている。
テクノロジーがますます量子スケールに向けられており、材料、医薬品、触媒に関する疑問を調査するようになってきています。これには、これまで見たことも想像もしていなかったものも含まれます。ディープラーニングは、この量子力学的レベルで対象を正確にシミュレートすることを約束します。
量子化学は、量子物理学の基本的なルールの応用で、分子の化学的性質を予測するためのものである。DFTにより、科学者が量子化学計算をシンプルにできるようになる。しかし、それには汎関数あるいは、電子確率密度からエネルギーへのマッピングが必要となる。正確な汎関数は知られていないが、固体物理学から核分光法までの分野で、近似汎関数が長年使用されてきた。
ただし、使用されている近似のほとんどは、分数電子の特性を持つシステムでは「病理学的エラー」に遭遇する。特に、フラクショナルチャージ(FC)またはフラクショナルスピン(FS)に遭遇する。フラクショナル電子は架空のものだが、一部の実際のシステムには、FCやFSの動きを見せる領域がある。このようなケースを処理するために機能を手動で設計することは困難であることが判明したため、DeepMindチームは機械学習を使ってこの問題に取り組んだ。
研究者は、教師あり学習アプローチを使ってMLPニューラルネットワークをトレーニングした。トレーニングデータセットは1161の例で構成されている。入力には、空間グリッド上でサンプリングされたKohn-Sham(KS)軌道特徴が含まれている。一方、出力値は「高精度反応エネルギー」となる。トレーニングの目的は、回帰損失と勾配正則化項の両方である。後者は、モデルを自己無撞着場(SCF)計算で使用できるようにするためである。
チームは、GMTKN55とQM9などの3つのベンチマークでDM21を評価した。これらのベンチマークには、トレーニングデータとは「非常に異なる」化学タスクのデータが含まれている。DM21により、これらのベンチマークに新たな最先端のパフォーマンスが記録され、他の4つの以前の方法を上回った。研究者によると「DM21は最高のハイブリッド汎関数よりも優れており、はるかに高価なダブルハイブリッド汎関数のパフォーマンスに近づいている。」
物理学と化学における機械学習の使用は、活発な研究分野である。2019年、スタンフォード大学の研究者はDFT汎関数として使用するための畳み込みニューラルネットワーク(CNN)をトレーニングした。「有機分子の大規模なセット」で良好な結果を達成している。2020年に、InfoQは、Navier-Stokes方程式を解くためにCaltechが機械学習を使用したことについて報告した。2021年には、タンパク質構造を予測するためのDeepMindのAlphaFold2 AIについて報告した。
DeepMindのDM21のコードと事前トレーニング済みモデルは、GitHubから入手できる。