小学館IDをお持ちの方はこちらから
ログイン
初めてご利用の方
小学館IDにご登録いただくと限定イベントへの参加や読者プレゼントにお申し込み頂くことができます。また、定期にメールマガジンでお気に入りジャンルの最新情報をお届け致します。
新規登録
人気のタグ
おすすめのサイト
企業ニュース

OpenAIがGPT-5.5を公開、ユーザーの意図を素早く理解し多くの作業を自律的に実行可能に

2026.05.04

OpenAIは2026年4月23日(米国時間)、最も高性能かつ直感的に使える最新モデルとして「GPT-5.5」を発表。同日よりGPT-5.5は、ChatGPTおよびCodexにおいてPlus、Pro、Business、Enterpriseユーザー向けに順次提供が開始された。また、GPT-5.5 ProはChatGPTのPro、Business、Enterpriseユーザー向けに提供され、APIでの提供も近日中に開始される予定だ。

本稿では、その特徴に関して同社発表ブログをベースにお伝えする。

モデル機能

OpenAIは、エージェント型AIのためのグローバルなインフラを構築しており、世界中の人々や企業がAIを活用して業務を遂行できるようにしてきた。CodexとChatGPTに搭載されたGPT-5.5によって、この変革は科学研究や、人々がコンピュータで行うより広範な業務にも広がり始めている。

これらの分野において、GPT-5.5は単に知能が高いだけでなく、問題解決の効率性にも優れており、より少ないトークン数と少ない再試行回数で、より高品質な出力を実現。同社によれば、Artificial Analysisのコーディングインデックスでは、GPT-5.5は最先端の知能を競合する最先端のコーディングモデルの半分のコストで提供できるという。

<人工知能分析指標>

■エージェントコーディング

GPT-5.5は、計画、反復、ツール連携を必要とする複雑なコマンドラインワークフローをテストするTerminal-Bench 2.0では、最先端の精度82.7%を達成していいる。実際のGitHub課題解決を評価するSWE-Bench Proでは、58.6%の精度を達成しており、以前のモデルよりも多くのタスクを1回のパスでエンドツーエンドで解決している。

人間の作業完了時間の中央値が20時間と推定される長期コーディングタスクを対象とした社内最先端の評価テストExpert-SWEでも、GPT-5.5はGPT-5.4を上回っている。

3つの評価すべてにおいて、GPT-5.5はより少ないトークンを使用しながら、GPT-5.4のスコアを向上させている。

<ターミナルベンチ 2.0>

<エキスパートSWE(社内)>

このモデルのコーディング能力の強みは、特にCodexにおいて顕著に表れており、実装やリファクタリングからデバッグ、テスト、検証に至るまで、幅広いエンジニアリング作業を担うことができる。

初期のテストでは、GPT-5.5は、大規模システム全体にわたるコンテキストの保持、曖昧な障害に対する推論、ツールを用いた前提条件の検証、周辺コードベースへの変更の反映など、実際のエンジニアリング作業で必要とされる動作において優れていることが示唆されている。

ベンチマークテストの結果に加え、初期のテスト担当者によると、GPT-5.5はシステム全体の構造を理解する能力が向上しているとのことだ。つまり、何が問題なのか、修正が必要な箇所はどこか、コードベースの他の部分でどのような影響が出るのかといった点を理解できる能力が向上している。

知識労働

GPT-5.5がコーディングに優れているのと同じ強みが、日常的なコンピュータ作業においても強力なツールとなる理由だ。このモデルは意図を理解する能力に優れているため、情報の検索、重要な点の理解、ツールの使用、出力の確認、そして原材料を有用なものに変換するという、知識作業の全サイクルをより自然に進めることができる。

Codexでは、GPT-5.5は文書、スプレッドシート、スライドプレゼンテーションの生成においてGPT-5.4よりも優れている。アルファテスターに​​よると、オペレーションズリサーチ、スプレッドシートモデリング、複雑なビジネス入力を計画に変換するなどの作業において、過去のモデルを凌駕する性能を発揮したという。

Codexのコンピュータ操作スキルと組み合わせることで、GPT-5.5は画面上の内容を認識。クリック、タイピング、インターフェースの操作、ツール間の正確な移動など、同社では「まるでモデルがユーザーと一緒にコンピュータを操作しているかのような感覚に近づけてくれる」と説明している。

GPT-5.5 は、44の職業にわたる明確に定義された知識労働を生成するエージェントの能力をテストするGDPval⁠ ⁠では、GPT-5.5 は 84.9% のスコアを獲得。モデルが実際のコンピュータ環境を単独で操作できるかどうかを測定するOSWorld-Verifiedでは、78.7% に達している。

また、複雑な顧客サービス ワークフローをテストするTau2-bench Telecomでは、迅速な調整なしで 98.0%に到達。GPT-5.5 は、他の知識労働ベンチマークでも優れたパフォーマンスを発揮しており、FinanceAgent では 60.0% 、内部投資銀行モデリング タスクでは 88.5% 、OfficeQA Proでは 54.1%となっている。

<GDP値>

<OSWorld検証済み>

<Tau2-bench Telecom>

■すべての人々の安全のためにサイバーセキュリティを推進

「OpenAIではGPT-5.5を、「サイバーセキュリティなど、世界で最も困難な課題のいくつかを解決できるAIに向けた、段階的ではあるものの重要な一歩」と位置付けている。

12月にリリースしたGPT-5.2では、モデルによる潜在的なサイバー攻撃を制限するために必要なサイバーセキュリティ対策が積極的に導入された。そして今回、GPT-5.5では、潜在的なサイバーリスクに対するより厳格な分類器を導入している。

GPT-5.5では、リスクの高いアクティビティや機密性の高いサイバー要求に対する制御が強化され、繰り返し悪用されるリスクを軽減する保護機能が追加された。

これらの保護機能の堅牢性を開発、テスト、反復するために、外部の専門家と数か月にわたり協力体制を構築してしてきた。GPT-5.5では、開発者がコードを容易に保護できると同時に、悪意のある攻撃者によって被害を受ける可能性が最も高いサイバーワークフローに対する制御が強化されている。

在庫状況と価格

2026年4月23日(米国時間)よりGPT-5.5がChatGPTおよびCodexのPlus、Pro、Business、Enterpriseユーザー向けに展開され、GPT-5.5 ProがChatGPTのPro、Business、Enterpriseユーザー向けに展開される。GPT-5.5およびGPT-5.5 Proは、まもなくAPIにも提供される予定だ。

ChatGPTでは、GPT-5.5 ThinkingはPlus、Pro、Business、およびEnterpriseの各プランのユーザーが利用できる。さらに難易度の高い質問や高精度な処理に対応するために設計されたGPT-5.5 Proは、Pro、Business、およびEnterpriseの各プランのユーザーが利用可能だ。

Codexでは、GPT-5.5はPlus、Pro、Business、Enterprise、Edu、Goプランで利用可能で、コンテキストウィンドウは40万だ。GPT-5.5はFastモードでも利用可能で、トークン生成速度は1.5倍になるが、コストは2.5倍になる。

関連情報
https://openai.com/index/introducing-gpt-5-5/

構成/清水眞希

@DIMEはサイトローンチ時より編集業務に携わる。現在は雑貨や家電、オーディオなどの新製品に加え、各種の社会調査・統計、話題の新スポットからイベント情報などを担当。信条は正確さとわかりやすさ。最近の趣味は日付が変わる時刻のウオーキング。

@DIMEのSNSアカウントをフォローしよう!

DIME最新号

最新号
2026年4月16日(木) 発売

『コナン』はなぜ、ヒットし続けるのか?伝説の第1話から劇場版最新作まで、制作の裏側に迫る!特別付録には劇場版ロゴの折りたたみモバイルコンテナも!さらに第2特集では躍進を続ける『無印良品』の知られざる活用術を大公開!衣食住を網羅する名品の数々を徹底調査!

人気のタグ

おすすめのサイト

ページトップへ

ABJマークは、この電子書店・電子書籍配信サービスが、著作権者からコンテンツ使用許諾を得た正規版配信サービスであることを示す登録商標(登録番号 第6091713号)です。詳しくは[ABJマーク]または[電子出版制作・流通協議会]で検索してください。