【速報】ついに登場!待望の新モデル「OpenAI o3 mini」を実演解説します!【ChatGPT無料ユーザーにも解放!】

速報!2025年2月1日(日本時間)に新しく公開された推論モデル「OpenAI-o3-mini」を紹介・実演します!OpenAI-oシリーズは、汎用型のAIとは異なり、深く思考する推論モデルで、数学、科学、コーディング、高度な問題解決等に適したモデルです。2024年12月にOpenAI-o1の正式版が公開されて大きな話題になりましたが、今回ついにその次世代モデル(の軽量mini版)が公開されたことにより、大きな期待が集まっています。しかも、ChatGPT無料ユーザーでも使用可能!これは熱い!
本動画では、具体的な実演、性能の解説、検索との合わせ技、長文出力、GPT-4oやOpenAI-o1やO1 Proとの比較などを紹介します。
▼目次
0:00 はじめに OpenAI o3 miniが登場
1:12 OpenAI o3 miniを触ってみよう
2:56 OpenAI o3 miniの解説
8:40 OpenAI o3 miniでコードを書いてみた(スネークゲーム)
9:56 OpenAI o3 miniで検索×推論をやってみた
12:39 推論モデルの圧倒的な強みは思考の深さと長文出力
15:40 OpenAI o1 VS o1 Pro VS o3 mini VS o3 mini high
17:43 まとめ OpenAI o3 mini
▼文字起こし
こんにちは、AIキャンプの中村です。今回、速報ということで、待望の新モデル「OpenAI O3 mini」が2025年1月31日日本時間の2月1日に公開され、実際に私のアカウントではすでに使える状態になっています。ここでは「O3 mini」と「O3のmini」の高効率モードが追加され、現在ChatGPTで使える汎用型の標準モデルはGPT‑4 OZモデルで、月額220ドルの支払いでより賢い「O1 Proモード」が利用可能です。O1は非常に賢く天才的なモデルでしたが、その自世代モデルであるO3がリリースされ、O3の本格バージョンはまだ発表されていないものの、全段階として簡易バージョンのO3 miniモードが今回公開されたということです。では、とりあえずこのO3 miniで何か試してみたいと思い、フェルミ推定という数学の問題、すなわち「世界中の人々が1年間に出すゴミの送料がどれくらいか」をAIに考えさせる実験を行いました。実行すると、12秒考えた後に概ねその金額が算出され、途中は英語で書かれているものの、1つ1つステップで考えられている様子が見受けられました。普通では答えられない問題ですが、O3 miniは12秒でこれを出すことができました。続いて、東京大学の数学入試問題にも挑戦してみました。大学入試の2次試験数学の中でも非常に高いレベルの問題ですが、1分8秒で答えを出し、答えは「1-3-7」で正解、すなわち「Nが素数となるような整数nの個数は3個を超えない」という内容でした。次に、OpenAIのホームページに記載された説明を日本語で紹介します。「コスト効率の高いフェルミ推定の限界を押し広げます」というキャッチフレーズのもと、今回登場しているOシリーズはフェルミ推定シリーズであり、最新かつ最もコスト効率の高いモデルがOpenAI O3 miniであると公表されました。これは高速なモデルで、数学、コーディング、プログラミングに特に優れた能力を持ち、開発者はユースケースに応じて低・中・高の3つのモードから選択可能です。ただし、O3 miniは画像認識機能をサポートしていないため、画像認識が必要な場合はOpenAI O1やO1 Proのモデルを使用してください。一方、O3 miniは検索機能と連携しており、関連するWebソースへのリンクを含む最新の回答が得られるようになっています。チャットGPTの有料版(プラス版、チーム版、プロ版)は本日から使える上、メッセージ制限もO1よりかなり緩和されており、さらに無料ユーザーも利用可能です。無料版では新たに「理由」ボタンが表示され、チャットGPTがより長く考えることができるようになり、先ほどと同じフェルミ推定の問題でも、無料アカウントながらフェルミ推定モデルが動作しているのが確認できました。ただし、ログインしていない状態ではこれらの機能は利用できません。性能面では、競技数学においてO3 miniはO1よりも若干高い数学スコアを示し、スピードも向上しており、競技プログラミングではO3がO1を大幅に上回っています。ソフトウェアエンジニアリングではほぼ同等かやや向上している程度ですが、実際に触りながらどのモデルがどのように使えるかを確認するのが重要です。O3 miniはO1の軽量モードよりさらに高速で、従来のフェルミ推定モデルに比べじっくり考えるスピードがかなり向上しています。次に、O3 miniを使ってHTML、JavaScript、CSSでスネークゲームを実装するよう指示すると、迅速にコードを生成し、そのコードを実際にコピーして実行するとスネークゲームが正常に動作しました。また、検索機能と連携して「生成AIに関する1月の主要ニュースを5個教えて」と指示すると、関連するニュースが表示され、さらに私の会社のウェブサイトのURLを指定して詳細なSWOT分析を行うよう指示すると、株式会社ラーニングライトに関する分析結果が出力されました。分析では、強みとしてチャットGPTに関する講座・セミナーの豊富な実績、弱みとして個人ブランディングへの依存や地域限定のサービス、機会としてAI市場の拡大、脅威としてAI関連の競争激化や市場変化が挙げられていました。私の感想としては、GPT‑4を標準モデルで使用した場合と比べると大きな差は感じられず、O3 miniを使った検索機能の有用性は現時点では明確ではありません。結局、どのモデルを使用すべきかは難しいですが、基本的なタスクはGPT‑4で十分な一方、より深い思考や行動が必要な場合にはフェルミ推定モデルが適していると感じます。標準モデルとフェルミ推定モデルの決定的な違いは、どれだけ長い回答を出せるかという点にあり、実際に「3万文字程度の詳細なビジネスプランを作成してください」というプロンプトをGPT‑4とO1に入力したところ、GPT‑4は約2000文字しか出さなかったのに対し、O1は1万2000文字程度の回答を出し、思考の深さやライティングの質に大きな差があることが分かりました。つまり、壁打ちやコンサルティングを行いたい場合にはフェルミ推定モデルが非常に有用です。さらに、同じプロンプトをO1、O3 mini、O1 Proで実行したところ、O1とO3 miniは約90秒前後で回答が完了し、O1 Proは約4分6秒かかりました。回答の文字数ではO3 miniが最も多く、O1 Proが最も少なかったものの、全体として大きな差は見られませんでした。結論として、通常のタスクにはGPT‑4で十分ですが、より深い思考が必要な場合はフェルミ推定モデルを使うとよく、画像認識が必要ならO1、Web検索との連携を重視するならO3 miniを、そして特に事業計画作成などの難しい問題に取り組む際は月額220ドルのO1 Proモードが有用だと考えます。今回はOpenAI O3 miniの速報でした。ぜひ参考にして触ってみてください。ありがとうございました。