カリフォルニア工科大学、スタンフォード大学、テキサス大学、NVIDIAの研究者は、GPT-4を利用してMinecraftのゲームプレイに参加するLLMパワーエージェント、Voyagerを共同開発しリリースした。Voyagerは、Minecraftで学習し、知識を保持し、卓越した専門性を発揮することで、驚くべき能力を発揮する。
Voyagerは自律的に動作し、人間の介入なしに仮想世界を探索し続け、多様なスキルを身につけ、画期的な発見をする。Voyagerの革新性は、探索を最適化する自動カリキュラム、複雑な動作を保存・検索するための拡張し続けるスキルライブラリ、プログラム強化のための環境フィードバック、実行エラー、自己検証を取り入れた反復プロンプティングメカニズムにある。
Voyagerは、オープンエンドな探索のための自動カリキュラム、複雑化する動作のためのスキルライブラリ、アクションスペースとしてコードを使用する反復プロンプトメカニズムの3つの主要コンポーネントで構成されている。
GPT-4との対話にブラックボックスクエリを利用することで、Voyagerはモデルパラメータのファインチューニングの必要性を回避している。Voyagerが開発したスキルは、時間的に拡張され、解釈可能であるため、エージェントの能力を急速に複合的に成長させ、致命的な忘却を軽減できる。
このプロジェクトの研究者の一人であるジム・ファン氏は、「マインクラフトのGPT-4実験は、効果的なAIエージェントを作る上で良いスタート地点になる。幅広い能力を持つ自律型エージェントは、人工知能の次のステップとなるものだ。彼らは好奇心と生存を動機として、オープンな環境で探索し、計画を立て、新しい能力を身につける。
ベースラインと比較すると、Voyagerはプロンプトの繰り返しで木のレベルを15.3倍、石のレベルを8.5倍、鉄のレベルを6.4倍早くアンロックし、技術ツリーのダイヤモンドレベルをアンロックできるのはVoyagerだけだ。
Voyagerの比類なき特徴は、学習したスキルライブラリを新しいMinecraftの世界で活用し、新規のタスクをゼロから解決する能力であり、他のアプローチが一般化する際に達成するのに苦労する偉業である。
Lifelong learningエージェントは、その運用寿命を通じて継続的に知識やスキルを習得するように設計されたAIモデルだ。Lifelong learningエージェントは、新しい情報や経験に遭遇するたびに、適応し、学習し、改善する能力を備えている。Lifelong learningエージェントは、知識の保持と伝達に優れ、多様なタスクや領域を効果的に処理できる。ゲーム、ロボット、医療、教育など、さまざまな分野でその能力を発揮している。
Voyagerによって、Minecraftはイノベーションの新時代に突入し、将来のLifelong learningエージェントの具現化のための基礎を築く。