AnthropicがClaude Sonnet 5を2026年6月30日に正式公開した。「数か月前まで大規模で高コストなモデルが必要だった水準の自律性を、Sonnetクラスのコストで実現した」というのが公式の主張だ。標準API価格は入力$3・出力$15/百万トークン(9月1日以降)。エージェントをプロダクション規模で動かす際のコスト計算が根本から書き換わる可能性がある。
Anthropicは米国時間6月30日、Claude Sonnet 5をAPI・claude.ai全プランで一斉公開した。無料・Proプランではデフォルトモデルに設定され、Max・Team・Enterpriseでも即日利用可能。8月31日までは導入期間価格として入力$2・出力$10/百万トークンが適用される。
公式発表によれば改善の柱は4点だ。
「Sonnet 5でエージェントのループコストが大幅に下がった。Opus 4.8 を使っていた処理の7割はSonnet 5に移行できそう」(APIスタートアップ開発者・X)
高精度のエージェントAIを実用展開する際、1タスクあたり数十〜数百回のAPI呼び出しが発生するため、Opus 4.8クラスの価格帯では大規模展開のROI計算が経営層への説明を難しくしていた。精度不足 vs コスト超過という二択が、昨年来の業界共通課題として残っていた。
Anthropicの直近の年間換算売上高は約$470億(約7兆円)に達し、自己申告ベースでOpenAIを初めて上回ったと報じられている。Sonnet 5の投入タイミングは、シェア争いよりも「Anthropicのモデルでエージェントを組む」というデファクト地位の確立を目指した戦略的一手と見られる。
ブラウザ・ターミナルの自律操作は、従来RPAが担っていたワークフローをLLMで代替する際の主要ボトルネックだった。精度問題はOpus 4.8で一定解消されていたが、コスト問題が残存していた。Sonnet 5は両課題を同時に圧縮した形であり、企業のエージェントAI導入ROI計算が大きく動く。
Sonnet 5は新トークナイザーを採用しており、同一入力テキストが最大1.35倍のトークンとして計上される。単価だけ比較すると安くなった印象があるが、システムプロンプトが長いエンタープライズ案件では実際の請求額が横ばいまたは増加するケースも出うる。移行前には必ずトークン消費量の実測比較が必要だ。
Gemini 3 Ultraが最大1000万トークン文脈窓を提供する中、Sonnet 5の100万トークンは見劣りするように映るが、追加料金なしで標準価格内に収まる点が実運用上の差別化になる。長大なコードベース・法務文書の一括解析といった用途では、コスト設計がシンプルになる。
エージェントAIの「量産コスト」問題は昨年来の業界共通課題だった。高精度モデルは高すぎ、低コストモデルは精度不足——この二択を壊すモデルが出るたびに市場の採用速度が跳ね上がるパターンがある。Sonnet 5はそのサイクルの一回転目に当たる可能性がある。
価格設定(標準入力$3/百万)は競合のGPT-5系・Gemini 3系の同クラスと比べて一概に安いとは言えない。ただし、Anthropicが強みとする「ツール使用の精度」で差別化が成立するならば、エージェントの再試行コスト削減が実質単価を引き下げる構造になる。数字の単純比較ではなく、タスク完了率込みのコスト試算が判断軸になる段階だ。
新トークナイザーの問題は意外に見落とされやすい。特にシステムプロンプトが長いエンタープライズ案件では移行コスト試算が必須で、8月末の導入期間中にベンチマークを取っておくことを強く勧める。
Claude Sonnet 5の登場で、エージェントAIの「高精度×低コスト」に1つの現実解が提示された。次の焦点は9月1日の標準価格移行後に企業の採用コストがどう動くか、そしてSonnet 5ベースのエージェント事例がどれだけ出揃うかだ。OpenAI・Googleも同水準のコスト競争を迫られると見られ、下半期のエージェントAPI市場は価格と精度の両面で再編が続くだろう。
※本記事は ミライ・ニュース編集部の AI ライター(AIニュース)が執筆しています。