BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース OpenAIが推論モデルo3-miniをリリース、o1より高速かつ高精度

OpenAIが推論モデルo3-miniをリリース、o1より高速かつ高精度

原文リンク(2025-02-11)

OpenAIは最新の推論LLM OpenAI o3-miniをリリースした。o3-miniはSTEM分野向けに最適化されており、科学、数学、コーディングのベンチマークで完全版o1モデルを上回る性能を発揮し、o1-miniより低レイテンシーになっている。

OpenAIは2024年後半にこのモデルをプレビューし、現在はChatGPT Plus、Team、Proプランのユーザーが一般に利用できるようになっている。無料ユーザーもチャットインターフェースの「Reason」ボタンをクリックすることでモデルをデモ体験できる。o3-miniはo1-miniよりも高レート制限かつ低レイテンシー、最初のトークンまでの時間が2.5秒速くなっており、Web検索をサポートしているため最新情報に基づいた回答を提供できる。このモデルは3段階の推論レベル(低、中、高)をサポートしており、応答生成時の「思考」フェーズで生成するトークン数を制御する。OpenAIによれば:

私たちはOpenAI o3-mini、推論シリーズの中で最新かつ最もコスト効率の高いモデルを本日よりChatGPTとAPIの両方で利用可能にしています。2024年12月にプレビューされたこの強力で高速なモデルは、小型モデルが達成できる境界を押し広げ、卓越したSTEM能力ー特に科学、数学、コーディングに強みを持つ-を提供しつつ、OpenAI o1-miniの低コストと低レイテンシーを維持しています。

o3-miniはOpenAIのoシリーズ推論モデルの最新版である。これらのモデルは応答について「思考」するために連鎖思考技術を使用している:出力テキストには入力問題の詳細な段階的分析が含まれる。さらにOpenAIは、oシリーズにOpenAIのセーフティポリシーを遵守するよう教育するために熟慮型アライメントと呼ばれる新しいトレーニング技術を使用した。その結果、モデルはユーザーのリクエストを検討し、セーフティポリシーの実際のテキストと比較する連鎖思考の出力を生成する。これによりOpenAIは「以前よりも細かく、コンプライアンス、拒否、安全な完了の境界を指定できる」ようになった。

Web検索機能に加えて、o3-miniは関数呼び出し構造化出力ストリーミング応答などいくつかの機能をサポートしている。またジェイルブレイクから保護するのに役立つ、OpenAIの指示階層の一部である開発者メッセージもサポートしている。しかし視覚機能は備えていないので画像に関する質問はできない。

OpenAIはo3-miniのベンチマーク結果を公開し、数学、科学、コーディングタスクにおけるパフォーマンスを強調した。o3-miniは低い推論レベルでもo1-miniを上回る性能を示している。高い推論レベルでは、o3-miniはAIME 2024GPQA DiamondSWE-bench Verifiedを含むいくつかのベンチマークで完全版o1モデルを上回っている。また、AIME 2024、GPQA Diamond、SWE-bench VerifiedでのDeepSeek-R1のレポート結果も上回っている。

LLMユーティリティの保守担当者 Simon Willison氏はo3-miniをサポートするLLMのアップデートをリリースした。彼はこのモデルの100,000出力トークン制限について書き、「見えない推論トークン」がその制限の一部を消費するため、おそらく100kの全てを出力することはないだろうと指摘した。彼はこうも言った:

出力制限が本当に重要になるアプリケーションの例は、現実的に出力が入力と同程度の長さになると思われる人間の言語間の翻訳です。特にその低価格を考えると、o3-miniがそのためにどれだけうまく機能するかは興味深いでしょう。

OpenAIのCEO Sam Altman氏は、現在点モデルの推論出力が非表示だがまもなく推論出力するようになるとXで主張している:

今日公開されると思っていました、その部分はすぐ発表します!

o3-mini推論モデルに関する詳細情報はOpenAIのドキュメンテーションで確認できる。

作者について

関連するコンテンツ

BT