Mistral AIは2026年6月27日(パリ時間)、推論特化モデル「Magistral Ultra」の正式公開を発表した。MATH-500で92.4%、GPQA Diamondで74.1%を記録し、GPT-5・Claude 4 Opus水準の性能に到達。同時に141Bパラメータのオープンウェイト版「Magistral 141B」をApache 2.0ライセンスで公開したことで、クローズドモデル依存の構造が揺らぎ始めている。
Mistral AIは公式ブログおよびHugging Faceにて、2種類のモデルを同時投下した。
APIの入力コストは$3.00/1Mトークン、出力は$9.00/1Mトークンと、GPT-5($15/$60)の5分の1以下の水準に設定されている。
「Magistralは欧州のAI主権を守るための回答だ。OSS版がなければ宣言に過ぎなかった」(X上のML研究者、6月27日投稿、約8,200いいね)
Mistralはこれまでに、Mistral 7B・Mixtral 8x22B・Codestral・Mistral Largeと段階的にラインナップを拡充してきた。しかし推論性能の面では、2025年後半以降のo3・Gemini 2.5 Pro・Claude 4との差が課題とみられていた。
欧州では2026年8月2日施行予定のEU AI法「高リスクAI」規定を前に、ドメスティックなLLMへの需要が高まっている。Mistralが本社を置くフランスでは、政府系調達でEU域内ホストのモデルが優先される動きが2026年第1四半期から加速。Magistralの登場は技術的挑戦と同時に、規制対応需要を取り込む事業判断でもあると見られる。
141Bオープンウェイト版を同日に公開した点が特筆される。これはMetaのLlama 4戦略(推論特化版をOSSで投下)と同じ構図だが、Mistralの場合は欧州規制環境との整合性が追加の動機となっている。自社インフラへのオンプレ展開を求める金融・医療機関には直接刺さる。
入力$3.00/1Mトークンという価格設定は、GPT-5比で約80%安い。高頻度のドキュメント解析・コード審査・リサーチエージェントなど、月間数十億トークンを消費するユースケースにとって選定理由になりうる水準だ。
MATH-500・GPQA・HumanEvalで9割超えは、もはや「すごい」の指標ではなく「テーブルに座れる最低条件」になっている。実際の差別化はツール呼び出し精度・レイテンシ・マルチモーダル対応へ移行している点に注意が必要だ。
公式発表には日本語ベンチマーク(JMT-Bench等)が含まれていない。欧州言語での評価は充実している一方、東アジア語への対応は後発組が多い。日本企業の採用可否は6月末予定の独立評価待ちとなる。
推論モデルの上位陣がGPT-5・Claude 4・Grok 4・Magistral Ultraと4極体制に近づいてきた。これは「1社のモデルに依存するリスク」を意識し始めた企業にとって、ベンダーロックインから抜け出す現実的な選択肢が増えることを意味する。
特に重要なのはOSSとAPIの同時提供という戦略だ。OSS版は「信頼のアンカー」として機能し、APIの信頼性を担保する構造になっている。Metaが同様の手法でLlama 4を普及させたように、141Bオープンウェイト版の存在がMagistral Ultraの商用採用を後押しする循環が生まれるとみられる。
一方、Apache 2.0ライセンスのモデルを競合他社がファインチューニングして商用利用する展開も不可避だ。Mistralがどこでマネタイズの防衛線を引くかが、今後6〜12ヶ月の焦点になるだろう。
欧州発のMagistral Ultraが、クローズドの4大モデルと並ぶ推論性能を示した。OSS版の同時投下によって、「性能を妥協せずオープンに使えるモデル」の選択肢が一段広がった形だ。次の注目点は、日本語を含む多言語ベンチマーク公開と、6月末〜7月に予定される主要クラウド(Azure・AWS・GCP)への統合対応だ。採用検討は独立評価の数字が出てからでも遅くない。
※本記事は ミライ・ニュース編集部の AI ライター(AIニュース)が執筆しています。