OpenAIが推論モデルo3-miniをリリース、o1より高速かつ高精度

原文リンク(2025-02-11)

OpenAIは最新の推論LLM OpenAI o3-miniをリリースした。o3-miniはSTEM分野向けに最適化されており、科学、数学、コーディングのベンチマークで完全版o1モデルを上回る性能を発揮し、o1-miniより低レイテンシーになっている。

OpenAIは2024年後半にこのモデルをプレビューし、現在はChatGPT Plus、Team、Proプランのユーザーが一般に利用できるようになっている。無料ユーザーもチャットインターフェースの「Reason」ボタンをクリックすることでモデルをデモ体験できる。o3-miniはo1-miniよりも高レート制限かつ低レイテンシー、最初のトークンまでの時間が2.5秒速くなっており、Web検索をサポートしているため最新情報に基づいた回答を提供できる。このモデルは3段階の推論レベル（低、中、高）をサポートしており、応答生成時の「思考」フェーズで生成するトークン数を制御する。OpenAIによれば：

私たちはOpenAI o3-mini、推論シリーズの中で最新かつ最もコスト効率の高いモデルを本日よりChatGPTとAPIの両方で利用可能にしています。2024年12月にプレビューされたこの強力で高速なモデルは、小型モデルが達成できる境界を押し広げ、卓越したSTEM能力ー特に科学、数学、コーディングに強みを持つ－を提供しつつ、OpenAI o1-miniの低コストと低レイテンシーを維持しています。

o3-miniはOpenAIのoシリーズ推論モデルの最新版である。これらのモデルは応答について「思考」するために連鎖思考技術を使用している：出力テキストには入力問題の詳細な段階的分析が含まれる。さらにOpenAIは、oシリーズにOpenAIのセーフティポリシーを遵守するよう教育するために熟慮型アライメントと呼ばれる新しいトレーニング技術を使用した。その結果、モデルはユーザーのリクエストを検討し、セーフティポリシーの実際のテキストと比較する連鎖思考の出力を生成する。これによりOpenAIは「以前よりも細かく、コンプライアンス、拒否、安全な完了の境界を指定できる」ようになった。

Web検索機能に加えて、o3-miniは関数呼び出し、構造化出力、ストリーミング応答などいくつかの機能をサポートしている。またジェイルブレイクから保護するのに役立つ、OpenAIの指示階層の一部である開発者メッセージもサポートしている。しかし視覚機能は備えていないので画像に関する質問はできない。

OpenAIはo3-miniのベンチマーク結果を公開し、数学、科学、コーディングタスクにおけるパフォーマンスを強調した。o3-miniは低い推論レベルでもo1-miniを上回る性能を示している。高い推論レベルでは、o3-miniはAIME 2024、GPQA Diamond、SWE-bench Verifiedを含むいくつかのベンチマークで完全版o1モデルを上回っている。また、AIME 2024、GPQA Diamond、SWE-bench VerifiedでのDeepSeek-R1のレポート結果も上回っている。

LLMユーティリティの保守担当者 Simon Willison氏はo3-miniをサポートするLLMのアップデートをリリースした。彼はこのモデルの100,000出力トークン制限について書き、「見えない推論トークン」がその制限の一部を消費するため、おそらく100kの全てを出力することはないだろうと指摘した。彼はこうも言った：

出力制限が本当に重要になるアプリケーションの例は、現実的に出力が入力と同程度の長さになると思われる人間の言語間の翻訳です。特にその低価格を考えると、o3-miniがそのためにどれだけうまく機能するかは興味深いでしょう。

OpenAIのCEO Sam Altman氏は、現在点モデルの推論出力が非表示だがまもなく推論出力するようになるとXで主張している：

今日公開されると思っていました、その部分はすぐ発表します！

o3-miniと推論モデルに関する詳細情報はOpenAIのドキュメンテーションで確認できる。

作者について

Anthony Alford

もっと見るより少なく

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

アカウントをお持ちでない方

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

作者について

Anthony Alford

この記事に星をつける

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

もう一つのRust書き換え：OpenAIのCodex CLIをネイティブ化、NodeとTypeScriptをRustで再構築

マイクロソフトCTO、Rust Nation UKでRustの成功と課題、Rustへのコミットメントについて語る

Meta社、Rustで構築された高性能なPython型チェッカー「PyreFly」をオープンソース化

Instagram、新ランキングフレームワークで通知疲れを軽減し、エンゲージメントを向上

Uber、CacheFrontの改善で毎秒1億5000万回の読み取りを達成

Mezzalira氏のQCon London講演：「マイクロフロントエンド～設計から企業メリットと社内実装まで～」

ソフトウェアエンジニアがスタッフプラスの役割に成長する方法

スペースシャトルとOrion MPCVのソフトウェアをNASAがどのようにテストしているか

デザイナーのサポート(置換えではない)にFigmaはどうAIを使うのか

Discord、単一GPUワークフローから共有RayクラスターへのMLプラットフォーム拡張

Transformers v5、よりモジュール化され相互運用性の高いコアを導入

OpenAI、GPT-5.1モデルを発表。より高速で会話的に

Helm、6年ぶりの大型リリースでKubernetesパッケージ管理を改善

AWS、ECS Express Modeを発表。コンテナ化アプリケーションの展開を簡素化

Groupe SNCF、Talos OSとKubernetesでインフラを近代化

QCon London

QCon AI Boston

QCon San Francisco

OpenAIが推論モデルo3-miniをリリース、o1より高速かつ高精度

作者について

Anthony Alford

この記事に星をつける

このコンテンツのトピックは AIと機械学習、データエンジニアリング です。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

InfoQ ニュースレター

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。