
本日、OpenAIは新世代のマルチモーダル推論モデルo3とo4-miniを正式にリリースしました。これにより、Web検索、Pythonデータ分析、画像ディープ推論、テキストベースのグラフィック機能など、ChatGPTのフル機能ツールチェーンのインテリジェントな呼び出しと組み合わせが初めて実現されました。 2 つのモデルは、ツールの使用シナリオを独立して決定し、構造化された出力を通じて複雑な問題を解決できます。開発者からは「AIツール組み合わせ名人」と呼ばれています。
技術的な詳細を見ると、o4-mini は複数の分野のテストで優れた成績を収めており、数学的推論能力は AIME 2024/2025 テストでそれぞれ 93.4% と 92.7% の精度に達し、プログラミング競技のスコアは 2700 ポイント (Codeforces グローバルトップ 200 レベル) で、科学的推論精度は前世代より 35% 向上しました。このモデルは革新的なトレーニング方法を使用して、テキスト生成を学習するだけでなく、計算機や画像処理ツールなどの外部プログラムを呼び出して特定のタスクを完了する機能も習得します。たとえば、複雑な数学の問題に直面したときに、計算モジュールを自動的に呼び出すことができます。画像データを処理する際に、切り抜きや回転などの前処理プログラムを起動することができます。
セキュリティ管理の面では、OpenAIは同時に「安全志向の推論監視システム」を立ち上げ、生物学や化学などの機密性の高い分野でモデルがリスク推奨を行うのを防ぐことに重点を置いた。このシステムは 1,000 時間のレッド チーム テストに合格しており、生物学的脅威に関する質問を識別してブロックできます。
今回リリースされた2つのモデルは、従来のテキストインタラクションの限界を打ち破り、マルチモーダルなディープコラボレーションを実現します。ユーザーが旅行の写真をアップロードすると、モデルは視覚分析モジュールを呼び出して地形の特徴を識別し、地理データベースと組み合わせてグラフィックレポートを生成できます。企業のフローチャートを処理する際に、チャート生成ツールと連携してレイアウトを自動的に最適化することができます。開発者は、o4-mini のアクティベーション コストは類似モデルよりも 50% 低く、API 応答速度は 20 ミリ秒であることを強調しました。
現在、o3とo4-miniはChatGPTの「詳細調査」機能に統合されており、リアルタイムのウェブ検索と調査レポートの作成をサポートしています。 OpenAIのCEOであるアルトマン氏は、この一連のモデルはGPT-5への重要な移行製品であり、今後数か月以内にさらに強力な反復バージョンがリリースされることを明らかにした。
本日より、企業ユーザーは OpenAI プラットフォームを通じて新しいモデル API へのアクセスを申請でき、個人ユーザーは ChatGPT ツールセットの一部の機能を体験できます。ツール呼び出し機能の開放により、AI アシスタントは「情報提供者」から「問題の解決者」へと変化し、インテリジェントなアプリケーションの新しい時代を迎えています。