OpenAIはDeep Research、Web全体にわたる詳細な多段階調査を行うように設計されたChatGPT内の新しいエージェントを発表した。当初はProユーザーに提供され、PlusユーザーとTeamユーザーへのアクセス拡大を計画している。Deep Researchはオンライン情報の取得、分析、統合を行うことで時間のかかる調査を自動化する。
標準的なチャットボットとのやり取りとは異なり、Deep Researchは5分から30分間、独立して動作し、ウェブを閲覧し、コンテンツを解釈し、引用付きレポートをまとめる。OpenAIの近日公開予定のo3モデルの特殊バージョンを搭載し、推論、データ分析、構造化調査に最適化されている。このツールは金融、政策、エンジニアリングなどの知識集約型分野の専門家や、複雑なトピックに関する包括的な洞察を求めるユーザーを対象としている。
初期評価ではDeep Researchは深い文脈理解を必要とするタスクにおいて以前のAIモデルを上回る性能を示している。専門家レベルの科目にわたってAIを評価するベンチマーク Humanity's Last Examでは26.6%の精度を記録し、以前のOpenAIモデルの2倍以上の性能を示した。
その能力にもかかわらず、このツールにリスクがないわけではない。AIが生成した調査結果は、特に専門的な主題を扱う場合に依然として誤った解釈をする可能性がある。デザイナー兼品質管理者 Peter Kseničは警告する:
トピックについて知識がない場合、大きな誤りを犯すリスクがあることを心に留めておいてください。トピックを理解していない場合も得られた知識を誤って解釈することで誤解を招く発言をする可能性があります。
AI教育や専門能力開発への依存に関する懸念も提起されている。Moses Maddox氏はAIリテラシーの重要性を強調した:
私たちはAIが何をできるか話すことに多くの時間を費やしており、学生たちに実際にどのように使用するかを教えていません。現在、学生や若手専門家はAIに自分たちをコントロールさせており、その逆ではありません。彼らはAIの出力をリファインする方法を学ぶのではなく、盲目的にAIを信頼しています...AIが彼らに取って代わることはありません。AIをより上手く使用する方法を知っている人が彼らに取って代わるのです。
OpenAIはこれらの懸念を認識しており、反復的なデプロイを通じてDeep Researchを改良する計画を立てている。複雑な調査を効率化するよう設計されているが、同社はAIがクリティカルシンキングを置き換えるのではなく、人間の専門知識を強化するツールとして使用されるべきであると強調している。
Deep Researchへのアクセスは段階的に拡大する予定で、より広範なユーザー基盤をサポートするためのより効率的なバージョンを開発中である。現時点では、AIが研究アシスタントとしての役割を進化させる上での新たな一歩を示している。