Mistral AIが「Mistral Medium 3」をApache 2.0で完全公開——コスト対性能比でGPT-4o miniを逆転、企業導入の"価格の壁"が崩れる

リード

Mistral AIが2026年6月21日（UTC）、新モデル「Mistral Medium 3」をApache 2.0ライセンスのもと完全公開した。商用利用・改変・再配布に制限がなく、自社サーバーへのホスティングも無条件で可能。同社が公表したベンチマークでは、MMLU 85.2点・HumanEval 82.7点を記録し、「同推論コスト帯においてGPT-4o miniを上回る」と明示している。中量級LLMの価格競争に、新たな基準点が打ち込まれた。

何が起きているのか

Mistral AIは公式Xアカウントおよびブログで、Mistral Medium 3のウェイトをHugging Face上に公開したと発表した。パラメータ数は非公開だが、同社は「70B未満」と示唆している。APIはla Plateformeとともにmistral.ai経由でも提供される。

「Medium 3はミッドレンジの定義を塗り替える。Apache 2.0で動かせるなら、なぜSaaSに月額を払うのか」
——X上のMLエンジニアによる投稿（匿名）

公開から12時間以内にHugging Faceのダウンロード数は47,000件を超えたと複数の観測アカウントが報告している。

背景

Mistral AIは2023年の創業以来、「強力なモデルをオープンに」という路線を堅持してきた。Mistral 7B（2023年9月）、Mixtral 8×7B（2023年12月）はいずれもリリース直後に同サイズ帯の事実上の標準となった経緯がある。

一方、2025年以降はLlama 4シリーズ（Meta）やQwen 3（Alibaba）の台頭でオープンソースLLM競争が激化。MistralはLarge 2でクローズドAPI路線を強化した時期もあったが、今回のMedium 3はあえてApache 2.0に戻した。背景には「エンタープライズのデータ主権ニーズ」があると同社CEOのArthur Mencheが言及している。

日本市場では2025年末から経済産業省主導のAI国産化・自社ホスティング推進が加速しており、Apache 2.0モデルへの需要が特に高い。

着目ポイント

Apache 2.0の意味：「使用料ゼロ」ではなく「制約ゼロ」

Apache 2.0は特許条項を含む一方で、商用利用・ファインチューニング・再配布を無制限に許可する。Llama 4が依然として「月間アクティブユーザー7億人超での使用は別途ライセンス」という制約を持つのと対照的で、大規模展開を計画する企業にとって法務負担が実質ゼロになる。

HumanEval 82.7点が示すコーディング実用域

GPT-4o miniのHumanEval公式スコアは約76〜78点（2025年末時点）。Mistral Medium 3の82.7点が独立検証で再現されれば、コーディングエージェントのバックエンドLLMとしての採用候補が入れ替わる可能性がある。ただし自社ベンチマークには過学習リスクがあり、EleutherAI等の外部評価を待つ必要がある。

推論コストの実際値

Mistral APIでのMedium 3の価格は入力0.4ドル／100万トークン、出力1.2ドル／100万トークンと発表された（2026年6月22日時点）。GPT-4o miniは入力0.15ドル・出力0.6ドルで「単価ではOpenAIが安い」が、自社ホスティング時の電気代・GPU費用込みのTCOでの比較は用途依存となる。

70Bクラスで何が変わるか

70B前後のモデルは、A100×4枚程度の構成で実用的な推論スループットが出る規模感だ。中堅IT企業がオンプレで動かせる現実的な上限に近く、「社内専用LLM」実装のコスト試算が書き直されるとみられる。

日本語性能は未公表

現時点で日本語ベンチマーク（JCommonsenseQA、JMMLU等）のスコアは公開されていない。欧州発モデルの日本語性能は過去モデルで劣後するケースもあり、国内採用判断には独自検証が不可欠だ。

編集部の視点

Apache 2.0のオープンリリースが持つインパクトは「無料」という点ではなく、「契約リスクの排除」にある。日本企業の法務部門がLLM採用に慎重だった主因の一つは、利用規約の解釈リスクと改定リスクだった。Apache 2.0はその論点を丸ごと消す。

性能数値の信頼性については留保が必要だ。Mistral自身が公表したベンチマークは、プロンプト設計やshot数の条件が非公開の場合がある。過去にも「同コスト帯最強」を掲げたモデルが外部評価で失速した例は少なくない。llm-eval等のコミュニティ再現結果が出るまで、採用判断は48〜72時間待つのが賢明だろう。

それでも構造的な変化として読むなら、「中量級LLMはオープンが基準」という合意形成が一段と進んだ、という点は確かだ。GPT-4o miniのようなSaaS型の中量級は、APIの利便性とエコシステムで差別化する必要が出てくるとみられる。

まとめ

Mistral Medium 3のApache 2.0公開は、エンタープライズLLM選定のスコアカードにコスト・性能・法的リスクの3軸を同時に書き直す事象だ。外部ベンチマークの結果次第で「GPT-4o mini vs Medium 3」の選択は2026年下半期の実装現場で反復して問われることになるとみられる。あなたの会社のLLM選定基準は、まだ2025年時点のままか。

※本記事はミライ・ニュース編集部の AI ライター（AIニュース）が執筆しています。

リード

何が起きているのか

「Medium 3はミッドレンジの定義を塗り替える。Apache 2.0で動かせるなら、なぜSaaSに月額を払うのか」
——X上のMLエンジニアによる投稿（匿名）

公開から12時間以内にHugging Faceのダウンロード数は47,000件を超えたと複数の観測アカウントが報告している。

背景

日本市場では2025年末から経済産業省主導のAI国産化・自社ホスティング推進が加速しており、Apache 2.0モデルへの需要が特に高い。

着目ポイント

Apache 2.0の意味：「使用料ゼロ」ではなく「制約ゼロ」

HumanEval 82.7点が示すコーディング実用域

推論コストの実際値

70Bクラスで何が変わるか

日本語性能は未公表

編集部の視点

まとめ

※本記事はミライ・ニュース編集部の AI ライター（AIニュース）が執筆しています。

リード

何が起きているのか

背景

着目ポイント

Apache 2.0の意味：「使用料ゼロ」ではなく「制約ゼロ」

HumanEval 82.7点が示すコーディング実用域

推論コストの実際値

70Bクラスで何が変わるか

日本語性能は未公表

編集部の視点

まとめ

リード

何が起きているのか

背景

着目ポイント

Apache 2.0の意味：「使用料ゼロ」ではなく「制約ゼロ」

HumanEval 82.7点が示すコーディング実用域

推論コストの実際値

70Bクラスで何が変わるか

日本語性能は未公表

編集部の視点

まとめ

他の記事

コメント