タンパク質構造予測センターはAlphaFold2がタンパク質構造予測の課題を解決したことを発表した。AlphaFold2はDeepMindによって開発されたAIシステムである。AlphaFold2は、グローバル距離テスト(GDT)メトリックで92.4の中央値スコアを達成した。これは、従来の方法との競合と見なされるしきい値を上回っている。
センターはプレスリリースで、タンパク質構造予測技術の重要な評価に関する第14回コミュニティ全体の実験(CASP14)の結果を説明する発表をした。生化学者のChristian Anfinsen氏の1972年のノーベル賞受賞スピーチにインスピレーションを受けた課題は、アミノ酸配列からタンパク質の3D構造を予測する計算方法を見つけることである。90を超えるGDTスコアを達成することにより、AlphaFold2は課題を解決したと考えられている。GDTスコアが90を超えることは、X線結晶学や低温電子顕微鏡法などの実験手法と同等であることを表している。カリフォルニア大学デービス校の研究者でCASP14の共同主催者であるAndriy Kryshtafovych氏は次のように述べている。
タンパク質の形状を迅速かつ正確に調査できることは、ライフサイエンスに革命をもたらす可能性を秘めています。単一のタンパク質で問題がほぼ解決されました。タンパク質複合体の形状を決定するための新しい方法の開発への道が開かれました。タンパク質複合体とは、生体の組織の多くを形成するために、そして他に応用するために、共に働くタンパク質の集合のことである。
DNAの遺伝暗号は、アミノ酸の配列からタンパク質分子を作成するための「レシピ」である。これらの配列は線形であるが、結果として得られるタンパク質は、生物学的機能の鍵となる複雑な3D構造に含まれている。科学者は、核磁気共鳴、X線結晶学、極低温電子顕微鏡などの技術を使用して、構造を実験的に決定できる。しかし、これらの方法は高価な専用機器を必要とし、単一の構造に対して完了するまでに数年かかる。
1972年、Anfinsen氏はタンパク質の構造はそのアミノ酸配列によって完全に決定されると仮定した。1994年、CASPは、配列からタンパク質構造を予測するための計算モデルの隔年評価として設立された。参加者には、構造が実験的に決定されているが公開されていないタンパク質の配列が与えられる。予測結果はGDTを使用して評価される。GDTは既知の構造と予測された構造の間の類似性を0~100のスケールで測定するものである。90以上のスコアは成功と見なされる。
AlphaFold2は、タンパク質構造を空間グラフとしてモデル化するアテンションベースのニューラルネットワークを使用する。加工していないアミノ酸配列に加えて、ネットワークへの入力にはマルチプルアラインメント(MSA)情報が含まれる。MSAは、共通の進化の祖先を持っているという仮定に基づいていくつかの異なる配列をリンクするものである。トレーニングデータには、DeepMindはProtein Data Bankが公開されている約17万シーケンスのデータセットを使用した。トレーニングは16台のTPUv3sで実行され、「数週間以上」かかった。
AlphaFold2のアーキテクチャの全容はまだ発表されていないが、DeepMindは、前回のAlphaFoldのイテレーションについて説明した論文をNatureに公開した。これは、2年前にCASP13でGDTスコアが約60で優勝したものである。DeepMindは、そのシステムのコードの一部もオープンソース化した。
Twitterで、タンパク質構造予測の最初のエンドツーエンドモデルを開発した生物学者のMohammed AlQuraishi氏は、AlphaFold2の結果を「驚くべき」と説明した。詳細なブログ投稿で、彼はシステムの正確さも賞賛したが、DeepMindの学術コミュニケーションを批判した。
CASP14で発表されたものは、方法の話と似ても似つかないものでした。それは非常に高レベルで、アイデアやほのめかしに重きを置いていましたが、ほとんど完全に詳細が欠けていました。これは残念であり、DeepMindがCASP13に参加したときとは著しく対照的です。その時には、2つの講演が行われ、多くのグループが結果をすぐに再現するのに十分な詳細が提供されました。
DeepMindは、CASP14で競争に参加することに加えて、AlphaFold2を使用して、COVID-19を引き起こすウイルスであるSARS-CoV-2からのいくつかのタンパク質の構造を予測した。 DeepMindはこれらの結果を公開し、その後の実験でいくつかの予測が確認された。 DeepMindなどによるCOVID-19タンパク質構造予測は、CASPWebサイトで入手できる。