OpenAIの言語モデルo1とo3について5秒で考えたこと

  • 2024年9月、OpenAIはo1言語モデルのプレビューを発表しました。
  • OpenAIはo3とo3-miniモデルを発表しました。
    • 以前のモデルはo1と呼ばれています。
    • OpenAIのCEOサム・アルトマンは、「Telefonica(O2ブランドで運営されている通信会社)への敬意と、悪い名前を考える伝統を守るために、1つの数字を意図的に飛ばした」と述べました。
  • 開発者たちは、o3がユーザーの質問に答える前に「考える」ように訓練しました。
    • このモデルは少し遅れて応答します。
    • TechCrunchによると、最も正確だと考える答えを出す前に、推論の過程を繰り返します。
  • ユーザーは推論の時間を「調整」できます。モデルに与える時間が長いほど、リクエストをより良く処理できます。
  • トレーニングデータを超えたスキルを学ぶAIの能力を測るARC-AGIテストで、o3は87.5%のスコアを獲得しました。
    • 85%のスコアは「人間レベル」と見なされます。
    • TechCrunchは、外部テストを待つ間、これらの結果を慎重に扱うべきだと指摘しています。
o1のプレビュー版、o1、o3のパフォーマンス比較:左のグラフ: 数学コンペティション右のグラフ: 大学院レベルの科学質問のアンケート縦軸: 答えの正確さ(出典: OpenAI)
  • 現在、両モデルは一般公開されていませんが、安全性テストのために公開される予定です。セキュリティ研究者がテストできるようになります。
    • アルトマンによると、OpenAIは2025年1月末までにo3-miniをリリースし、その後o3をリリースする予定です。
  • OpenAIは2024年9月にo1言語モデルのプレビューを発表しました(推論集約型タスクに焦点を当てています)。
    • 12月初めに、同社はo1の完全版をリリースし、「限定」バージョンにアクセスできるChatGPT Proサブスクリプションを追加しました。