Metaの最新のAI研究で、BuilderBotを導入している。これは創造性を高めるメタバースの新しいツールで、音声コマンドのみで没入型オブジェクトを生成できる。
メタバースの構築には、人工知能の大きな進歩が必要になる。Meta AIラボは、コンピューティングの次の時代を実現するための長期的な取り組みの一環として、すでに研究開発を進めている。
Metaによると、BuilderBotを使うと世界を記述でき、あなたのためにその世界の様相が作り出される。このテクノロジーをさらに進歩させると、繊細な世界を作り出して、あなたの声だけで他の人と経験を探索したり共有したりできるようになる。
BuilderBotは、Project CAIRaokeと呼ばれるより大きなAIプロジェクトの一部である。この仮想世界を作り出すために必要な会話型AIの開発に焦点を当てている。
会話型AIを進めるために必要なステップの1つは、問題の全範囲を理解することである。多くの人が、BARTやGPT-3などのNLUにおける最近の大きな進歩を見ており、人間が作るようになテキストを理解して生成するという課題は解決されたと考えている。理解のためのAIは、業界横断で十分に研究、開発されている。それは、自動音声認識、画像分類、NLUなどのさまざまな入力モダリティから意味を抽出するために使われる。インタラクションのためのAIは、テクノロジーを使用して他の人々とインタラクションするために、世界の理解をどのように使うかである。これは、テキスト、音声コマンド、触覚フィードバックの送信であったり、画像、ビデオ、アバターの顔の表示であったりする。あるいは、これらすべての組み合わせもありうる。
業界横断で研究者とエンジニアは、優れた会話システムにはAIモデルを活用した信頼できる理解の層が必要であることに同意している。しかし、多くの人は、相互作用はAIの問題ではなく、エンジニアリングの問題であると感じている。したがって、世界の現状を知っているエンジニアは、必要な相互作用を処理するための精巧なロジックを作成できる。エンジニアリングアプローチにより、システムがどのように機能するかを簡単に理解し、必要に応じてロジックをすばやくデバッグできる。
AIを活用したアシスタントのための標準的なアプローチでは、パイプライン(NLU、DST、DP、NLG)の各レイヤーに1つずつ、合計4セットの入力と出力が必要となる。また、各レイヤーの入力と出力に定義された標準が必要となる。たとえば、NLUの場合、従来の会話型AIシステムには定義済みのオントロジーが必要となる。
Metaがメタバースのための構築を進めるにつれて、自己教師あり学習や世界で最も強力なAIスーパーコンピューターの構築などの分野でブレークスルーが発生し、それがAI研究の将来のブレークスルーにつながるであろう。