MetaがLlama 4 Maverick の推論強化バリアント「Maverick-R」を2026年6月24日16:00(UTC)に予告なし公開した。数学・コーディングの2軸でOpenAI o3、Gemini 2.5 Proに10ポイント以内まで迫り、Apache 2.0ライセンスで商用利用可能という条件が加わった瞬間、OSS推論モデル競争は最終局面に入ったとみられる。
MetaはHugging Face上のオフィシャルリポジトリへMaverick-R(4,000億パラメータMoE、アクティブ17B相当)のウェイトとシステムカードを同時公開した。
ベンチマーク結果(Meta公式発表値):
X(旧Twitter)では公開直後から国内エンジニアの検証ポストが相次いだ。
「Maverick-Rをvllmでローカル動かしたら、o3-miniと体感変わらない。コスト0で推論が回る感覚、1年前には想像できなかった」
(ソフトウェアエンジニア、6/24 深夜)
リリースはMarkdown一枚のシステムカードのみで、ブログ記事・プレスリリースは未発行。「静かなドロップ(quiet drop)」戦略は、競合のリリースサイクルを意識した機先制圧と見られる。
2026年前半、推論モデルの主戦場はOpenAI o3シリーズとGemini 2.5 Proが独占してきた。両モデルはAPIコストが高く、エンタープライズ導入では月額ライセンスが数百万円規模に達するケースも出ていた。
MetaはこれまでLlama 4 Scout(小型・高速)とMaverick(大型・汎用)の2本立てで市場に入り込み、2026年Q1時点で企業向けデプロイ数が累計120万件を超えたと報告している。今回の「-R」サフィックスは、思考連鎖(Chain-of-Thought)ファインチューニングと強化学習を組み合わせたPost-trainingパイプラインの独自実装を意味する。
背景には推論インフラコストの急落もある。NVIDIAのBlackwell GB300が2026年4月以降に量産フェーズへ移行したことで、17Bアクティブパラメータ規模の推論を自社サーバで回すコストが6か月前比で約54%低下した。
商用利用制限なしのApache 2.0は、SaaSプロダクトへの組み込みにおいてRoyaltyゼロを意味する。スタートアップが推論機能をプロダクトに載せる際、APIコスト試算が根本から変わる。
同等タスクに費やすトークン数が少ないほど、ホスティングコストと応答速度の両方に効く。法律・医療・財務など長文推論が必須な垂直SaaSでの採用障壁が一気に下がる。
400Bパラメータ全体を保持しながら、推論時に17B相当のみを起動するMixture-of-Experts構造は、A100/H100 2〜4枚で実用運転が可能な水準に収まる。オンプレミス導入を要件とする金融・官公庁向け案件の選択肢が広がる。
MetaのシステムカードはJAベンチマークへの言及がなく、Jaster・JMMLU上での数値は6月24日23:59時点で未公開。国内コミュニティの追加検証結果が今後48時間以内に出揃う見通しだ。
クローズドモデルの競争優位がコスト面で縮小すると、差別化の焦点は「安全性保証」「カスタマイズ速度」「SLAの厚み」にシフトする。API依存型ビジネスの価値再評価が起きると見られる。
「無料で推論が回る」という事実が示す構造変化は、2つのレイヤーで読む必要がある。
第一層:モデルの民主化。推論精度が高価なAPIに依存しなくてよくなれば、医療・教育・福祉など収益化が難しいが社会的価値の高い領域での応用実験が加速する。これは純粋に良いことだ。
第二層:エコシステムの再編。OpenAIのAPIレベニューモデルに依存している間接ビジネス(代理店・ミドルウェア・評価ツール)は、「OSSで十分」という圧力にさらされる。日本国内のAIスタートアップがどちらのベットに乗っているかを今一度確認しておく価値がある。
Maverick-Rの日本語性能が検証され次第、国内エンタープライズのPoC候補リストに入る事例が複数出てくると見られる。問題は「推論の精度」より「日本語指示追従性」と「社内セキュリティ要件との整合」であり、その2点が整えば、商用API依存からの移行判断が現実のテーブルに乗る。
MetaのMaverick-R投入は、「クローズドモデルが推論精度で支配する」という2026年前半の前提を書き換えつつある。Apache 2.0・38%トークン削減・MoE設計という3つの要素が重なり、コスト試算の分岐点が変わった。
次の焦点は日本語ベンチマークの公式数値と、Anthropic・OpenAIが48〜72時間以内に何らかのレスポンスを出すかどうかだ。沈黙もまた、一つの答えになる。
※本記事は ミライ・ニュース編集部の AI ライター(AIニュース)が執筆しています。