GPT-5.5衝撃|1Mトークン×コーディング王の全貌
@aifriends
AI Friends(https://aifriends.jp)のクロスポスト公式アカウント。AIツールの紹介・使い方・できることを、中学生でもわかるやさしい日本語で届けます。
コメント (0)
まだコメントはありません

@aifriends
AI Friends(https://aifriends.jp)のクロスポスト公式アカウント。AIツールの紹介・使い方・できることを、中学生でもわかるやさしい日本語で届けます。
まだコメントはありません
『AIモデルが、また1段“賢い”を更新した』——2026年4月23日、OpenAIはGPT-4.5以来1年ぶりとなる“フル再訓練”ベースモデル『GPT-5.5』(社内コードネーム“Spud”=じゃがいも)を公開しました。1Mトークン(小説5冊分相当)の超巨大コンテキスト、Terminal-Bench 2.0で世界最高82.7%、API料金は前世代の2倍——強気の値付けと派手なベンチマーク結果が話題沸騰。なぜいま“フル再訓練”が必要だったのか、Claude Opus 4.7やGemini 3.1 Proとどう違うのか、日本のユーザーにとって何が変わるのかを中学生にもわかる言葉でほどいていきます。
まず発表の中身を3分で整理します。
2026年4月23日、OpenAIは公式ブログ『Introducing GPT-5.5』でGPT-5.5を正式発表し、即日でChatGPTのPlus/Pro/Business/Enterprise/Eduプラン向けに展開。翌4月24日にはAPIにも展開され、開発者は『Responses』『Chat Completions』エンドポイントから利用可能になりました。『新作スマホをまずお店で展示した翌日、ネット販売も解禁する』ような連続リリース。“消費者向けと開発者向けを24時間以内に揃える”スピード感が、今回の発表の特徴です。“GPT-5.4から1〜2ヶ月での後継モデル登場”というOpenAIの加速ぶりに、業界各社が驚きの声を上げました。
社内開発時のコードネームは『Spud(スパッド)』——“じゃがいも”を意味する英語のスラング。『地道に育てて、ホクホクの中身を仕上げた』というニュアンスを感じさせる愛称です。『派手な料理よりも、まずベースの素材を一から育て直した』という開発思想の表れ。“GPT-5.1〜5.4は同じベースモデルの上にチューニングを重ねたシリーズ”だったのに対し、“GPT-5.5は事前学習データもアーキテクチャも全て作り直した”のが大きな違い。“GPT-4.5以来およそ1年ぶり、満を持しての“ベースモデルから再構築”プロジェクト”の成果物が、このSpud(GPT-5.5)です。
標準モデル『GPT-5.5』に加え、より深い推論を担う上位モデル『GPT-5.5 Pro』も同日発表。『普通のスーパーカーと、サーキット仕様の競技モデルが同時に発売される』ような兄弟ラインナップです。“GPT-5.5 Proは長時間のエージェント作業や、深い推論が必要なリサーチに最適化”されています。“ChatGPTでは『GPT-5.5 Thinking』として表示され、Plus/Pro/Business/Enterprise利用者が選択可能”。“GPT-5.5 Proに限ってはPro/Business/Enterpriseの上位プランのみ”という棲み分けで、用途と予算に合わせた選択肢が広がりました。
『なぜ既存モデルを微調整するのではなく、ゼロから作り直すの?』を3つの観点から見ます。
事前学習(プリトレーニング)とは、インターネット規模のテキストデータをAIに大量に読ませて、言語の基礎能力を身につけさせる工程。『プリンを家庭で作るとき、卵・砂糖・牛乳を最初から混ぜて加熱する手間』と同じくらい、土台が出来栄えを左右するのが特徴です。“一度作った土台モデルに、後から微調整(ファインチューニング)を重ねるのが普通”。“GPT-5.1〜5.4は同じプリンの上に違うソースをかけた“バリエーション””だったのに対し、“GPT-5.5はプリン自体を新レシピで作り直した”。“事前学習には数千枚のGPUと数ヶ月の計算時間、数百億円の費用が必要”とされ、AI開発の中で最大級の挑戦です。
OpenAIによれば、GPT-5.5の事前学習コーパスとアーキテクチャ、エージェント志向の学習目的は全て刷新。『モデルが自分でツールを使い、計画を立てて、長時間の作業をやり抜く』ことを最初から想定して設計されています。『新人社員に上司から逐一指示するのではなく、目的だけ伝えて任せられる人材を採用する』考え方。“長文の文脈を保ち続け、曖昧な失敗から立ち直り、ツールで仮説検証する”能力が強化された結果、実装・リファクタ・デバッグ・テスト・検証まで一気通貫でこなせるようになりました。“OpenAIが2026年に注力する“エージェント基盤”の中核モデル”として位置づけられています。
『Spud』は英語圏で“じゃがいも”を指す気軽な呼び名で、OpenAI開発陣のジョーク的なコードネーム。“地味だが栄養価が高く、いろんな料理に使える万能食材”というイメージが、ベースモデルとしての汎用性と重なるのが粋なところです。『目立たないけれど、なくてはならない食卓の主役』を狙った命名。“OpenAIは過去にも食べ物にちなむコードネームを使ってきた”(GPT-6は『Spud』ではなく別の食材コードネームと噂)。“派手なマーケティング名より、社内文化の遊び心が表れる愛称が業界で話題”になっています。
『具体的に何が強くなった?』を3つのポイントで掘ります。
GPT-5.5はOpenAI APIで初めて『1Mトークン(100万トークン)』のコンテキストウィンドウに対応。日本語に換算すると約60〜70万文字、文庫本5冊分以上の文章を一度に読み込める計算です。『分厚い辞書を一気に頭の中へ取り込んで、即座に質問に答える』ような能力。“巨大なコードベース(社内システム全体のソースコード)”や“長期間にわたるチャット履歴”も丸ごと与えて、その全体を踏まえた回答が可能。“Codex(ChatGPTのコーディング機能)でも400Kトークン対応に拡張”され、エンジニアの実用性が一段上がりました。
Terminal-Bench 2.0は、AIが実際のコマンドラインで複雑なワークフロー(計画・反復・ツール連携)をこなせるかを測る業界標準ベンチマーク。GPT-5.5は82.7%の正解率で世界最高記録を樹立しました。『新人エンジニアが、難しい構築作業を自分で計画し、エラーを直しながら最後までやり遂げる』レベルの自律性。“SWE-Bench Verified(GitHub上の現実バグ修正テスト)でも88.7%を記録し、前世代GPT-5.4の87.6%を上回る”。“Codexで同じタスクを処理するのに、GPT-5.4より約40%少ないトークンで済むという効率性も特徴”。“賢くなりつつ、無駄な出力が減った”のが実用面での最大の進化です。
OpenAIは『GPT-5.5で構築されたエージェントは、計画立案・文脈収集・ツール呼び出し・曖昧さからの回復・長期ワークフロー完遂をより少ない指示でこなせる』と公式発表。『分厚い手順書を読まずに、目的だけ伝えれば自分で考えて動ける部下』のような変化。“GDPval(経済価値タスク評価)で84.9%、OSWorld(PC操作エージェント)で78.7%という、エージェント分野での独走”を実現。“知識業務・初期段階の科学研究・コンピュータ操作で特に強さを発揮”と、OpenAIは強調しています。“ChatGPTを“質問に答えるツール”から“タスクをやり切る相棒”へ進化させる節目”になる発表です。
『他社モデルと比べてどうなの?』を3つの切り口で整理します。
第三者ベンチマーク機関『Artificial Analysis』の総合知能指数で、GPT-5.5は60ポイントを獲得して首位。2位のClaude Opus 4.7とGemini 3.1 Proは57ポイントで同率2位、3ポイント差でOpenAIがトップです。『3教科の合計点で、惜しくもライバル2人に3点差で勝った学年1位』のような僅差。“1年前に首位の座を譲り渡したOpenAIが、GPT-5.5で再び総合トップに返り咲いた”。“ただし“単一指標で勝つ”時代は終わり、用途別に最適なモデルを使い分ける時代に移行している”のが現代AI市場の本質です。
SWE-Bench Pro(実世界GitHubイシュー解決)ではClaude Opus 4.7が64.3%、GPT-5.5が58.6%と5.7ポイント差でClaudeがリード。“難易度が高いコード修正タスクでは、Anthropicの最新モデルがやや優勢”。『専門資格試験では同僚に負けたが、日常業務では自分の方が早い』状況。“一方、ARC-AGI-2(77.1%)やGPQA(94.3%)といった抽象的推論ではGoogleのGemini 3.1 Proが首位”。“GPT-5.5=エージェント、Claude=コーディング、Gemini=推論”という3モデル使い分けが2026年の業界スタンダードになりつつあります。
API料金は入力100万トークンあたり5ドル、出力30ドルで、GPT-5.4(入力2.50ドル/出力15ドル)の正確に2倍。『前モデルから値段が倍になったが、性能と効率も向上した』バランスをどう評価するかが分かれ目です。“GPT-5.5 Proに至っては入力30ドル/出力180ドルとさらに6倍の価格設定”。“ただし出力トークンが40%削減されるため、実質的なコスト増は20%程度”との分析も。“最新フロンティアモデルを使うコストを正当化できるかは、業務の付加価値次第”と業界アナリストはコメントしています。
『日本のユーザーにとって何が変わる?』を3つの切り口で見ます。
日本でもChatGPT Plus/Pro/Business/Enterpriseの契約者は4月23日から自動的にGPT-5.5にアクセス可能。“追加料金なし、設定変更なしで、モデル選択メニューに『GPT-5.5』『GPT-5.5 Thinking』が出現する”仕組みです。『定額制動画サービスで、契約はそのままに新作映画が追加された』ような体験。“日本語の翻訳・要約・文章生成精度も、前世代GPT-5.4からさらに向上した”との早期レビュー。“国内で月額3000円のPlusユーザー約数十万人が、世界最先端モデルを即時に利用できる環境”が整っています。
API利用ベースで動くSaaS製品やAIアシスタントを提供する日本企業にとって、GPT-5.5への切り替えはコスト構造の見直しが必要。“出力トークンが40%減るため単価×量での総額は意外と上がらない”一方、“1リクエストあたりの上限コストは増加する”のがポイント。『電気料金が値上がりしたが、新型エアコンが省エネになった』状況に近い。“ベンチャーや個人開発者は、用途に応じてGPT-5.4/5.5/5.5 Proを使い分ける『モデル・ルーティング』設計が現実解”。“NTT・富士通・サイバーエージェントなど国内大手も、GPT-5.5の業務活用評価を即座に開始した”と業界では報じられています。
NEC『cotomi』、サイバーエージェント『CALM2』、PFN『PLaMo』など国産LLMが進化を続ける中、GPT-5.5の登場で“フロンティア性能の差”が再び拡大。『国内チームが完成度を上げるたびに、海外勢がさらに高みに行く』追いかけっこの構図。“ただし国産LLMは“日本語の専門領域”や“データ主権”で独自の強みを持つ”。“GPT-5.5の1Mコンテキストとフロンティア性能を借りつつ、機微情報は国産モデルで処理する“ハイブリッド設計”が国内エンタープライズの主流”。“2026年後半、政府AI『源内』との連携シナリオも議論される段階”に入っています。
都内SaaS企業のCTO・加藤さんは、自社プロダクトのAIアシスタント基盤に使うモデルをGPT-5.4からGPT-5.5に切り替えるか検討中。『出力トークンが40%減るので、月間API費用は現状維持で性能だけ底上げできる試算』を社内会議に提出しました。“1Mコンテキストでお客様の長い問い合わせ履歴を一気に参照できるため、サポート対応の精度も向上する見込み”。『契約価格を据え置きで、サービス品質だけ底上げする攻めの判断』。“AI市場では、新モデル登場のたびにこういう移行判断を素早く行える企業が競争優位を取る”のが現代の実情です。
関西の私立大学で経済学を専攻する美樹さんは、卒業論文のテーマ研究にChatGPT Plusを活用中。『100ページ超の英語論文5本を、GPT-5.5に同時に与えて、共通点と相違点を整理させる作業』に挑戦しました。“1Mコンテキストのおかげで、論文を分割せずに一括で読み込ませられるようになり、文脈の取り違えが激減した”と実感。『分厚い参考書を全部頭に入れた家庭教師に、何度でも質問できる』利便性。“学術領域での生成AI活用が、長文文脈の制約から解放されて新しい段階に入った”象徴的な事例です。
金融系SIerでバックエンド設計を担当する諏訪さんは、社内開発でCodexのGPT-5.5対応を試験運用。『約50万行の社内Javaコードベースを丸ごと与え、リファクタ案と単体テストを自動生成させた』結果、過去のGPT-5.4比で完了時間が約3割短縮されました。“Terminal-Bench 2.0の82.7%という数字が、現実の業務でも体感できるレベルで効いてくる”。『先輩エンジニアにレビューを頼むのと同じ感覚で、AIに設計判断を相談できる職場』。“2026年後半には“Codexで自律的に動くAIペアプロ”が日本のIT現場の常識になる”と諏訪さんは見ています。
A. 2026年4月時点でChatGPTの無料プランでは利用できません。Plus(月20ドル)/Pro/Business/Enterprise/Eduの有料プランでGPT-5.5が解放されています。“GPT-5.5 ProはさらにPro/Business/Enterpriseの上位プランのみ”。『新作映画は有料会員エリアだけで先行公開、人気が出てから一般公開される』流れ。“なお、Codex経由ではPlus/Pro/Business/Enterprise/Edu/Goプランでも利用可能(コンテキストは400Kに制限)”。“予算次第でアクセス先を選ぶ階層構造”になっています。
A. 標準のGPT-5.5は日常的な質問応答・文章生成・コーディングに最適、GPT-5.5 Proは複雑な推論・長時間のリサーチ・大規模設計判断に向く。“APIコストは6倍違うため、簡単な作業にProを使うのは“軽自動車で十分な街乗りに大型トラックを使う”のと同じ無駄遣い”。『状況に応じて道具を使い分ける職人の感覚』が大事。“ChatGPT上では『GPT-5.5 Thinking』として表示され、選択肢として手動切り替え可能”。“まずは標準GPT-5.5で試して、複雑さが必要な場面だけProに切り替える”運用が推奨されます。
A. OpenAIは日本語固有のベンチマーク数値を公開していませんが、早期ユーザーレビューでは“長文要約・専門用語の誤訳・敬語の使い分け”で改善を実感する声が多い。“1Mコンテキストの恩恵で、日本語の長文を分割せずに処理できる”のが実用面での大きな進歩。『英語並みに自然な日本語を出すモデルへ、また一歩近づいた』感覚。“ただし業界・企業独自の専門用語については、ファインチューニングなしでは対応に限界がある”のは従来通り。“正確性が求められる業務では人間レビューを併用する設計が引き続き重要”です。
A. OpenAIは『推論時の知識整合性が向上した』と発表していますが、第三者検証では“依然としてハルシネーションは頻発する”という指摘も。“ベンチマークで高スコアを取りつつ、現実の細かい事実誤認は残る”という現代LLMの普遍的課題。『試験では満点でも、日常会話で人の名前を間違える先生』のような構造的ジレンマ。“重要な意思決定や公式文書では、AIの出力を必ず人間が裏取りする運用が必須”。“信頼性が求められる業務では、複数モデル比較や引用元検証ツールとの併用が推奨される”のが2026年現在のベストプラクティスです。
A. OpenAIは公式に発表していませんが、2026年4月時点で『GPT-6(コードネームSpud2など)』の事前学習が完了した噂が業界で流れている。“GPT-5.5発表からおよそ半年〜1年後に正式公開される可能性が高い”と業界アナリストは予測。『次世代スマホの噂が新作発売直後から流れ始める』のと似た先取り情報。“ただしGPT-5.5自体の改良(5.5.1、5.5.2など)も並行して続く見込み”。“ユーザーは“いつ最新を追いかけるか”の判断軸を、自身の業務サイクルに合わせて設計するのが現実的”です。
『ベースモデルから作り直す』という大規模な再訓練は、AI開発コスト・時間・リスクの全てが最大級になる重い決断です。OpenAIがGPT-4.5以来1年ぶりにこの選択肢を取った背景には、“エージェント時代に対応した新アーキテクチャを土台から組み直す必要”があった。“1Mトークンの巨大文脈、Terminal-Benchの世界記録、出力トークン40%削減——どれも単発の機能追加ではなく、ベースの設計思想から見直したからこそ実現できた成果”。“API価格2倍という強気の値付けは、“知能の対価”を社会がどう評価するかを問う実験でもある”。『GPT-5.5を使う側が、その2倍の付加価値を生み出せるか』——これが2026年後半のAI活用の主戦場になります。日本のユーザー・企業・開発者にとっても、“最新フロンティアモデルをいつ・どこで・どれだけ使うか”を戦略的に設計する力が、AI競争の勝敗を分ける時代——そう捉えると、この発表の重さが見えてきます。
この記事は AI Friends からのクロスポストです。