Mistral AIが2026年6月21日(UTC)、新モデル「Mistral Medium 3」をApache 2.0ライセンスのもと完全公開した。商用利用・改変・再配布に制限がなく、自社サーバーへのホスティングも無条件で可能。同社が公表したベンチマークでは、MMLU 85.2点・HumanEval 82.7点を記録し、「同推論コスト帯においてGPT-4o miniを上回る」と明示している。中量級LLMの価格競争に、新たな基準点が打ち込まれた。
Mistral AIは公式Xアカウントおよびブログで、Mistral Medium 3のウェイトをHugging Face上に公開したと発表した。パラメータ数は非公開だが、同社は「70B未満」と示唆している。APIはla Plateformeとともにmistral.ai経由でも提供される。
「Medium 3はミッドレンジの定義を塗り替える。Apache 2.0で動かせるなら、なぜSaaSに月額を払うのか」
——X上のMLエンジニアによる投稿(匿名)
公開から12時間以内にHugging Faceのダウンロード数は47,000件を超えたと複数の観測アカウントが報告している。
Mistral AIは2023年の創業以来、「強力なモデルをオープンに」という路線を堅持してきた。Mistral 7B(2023年9月)、Mixtral 8×7B(2023年12月)はいずれもリリース直後に同サイズ帯の事実上の標準となった経緯がある。
一方、2025年以降はLlama 4シリーズ(Meta)やQwen 3(Alibaba)の台頭でオープンソースLLM競争が激化。MistralはLarge 2でクローズドAPI路線を強化した時期もあったが、今回のMedium 3はあえてApache 2.0に戻した。背景には「エンタープライズのデータ主権ニーズ」があると同社CEOのArthur Mencheが言及している。
日本市場では2025年末から経済産業省主導のAI国産化・自社ホスティング推進が加速しており、Apache 2.0モデルへの需要が特に高い。
Apache 2.0は特許条項を含む一方で、商用利用・ファインチューニング・再配布を無制限に許可する。Llama 4が依然として「月間アクティブユーザー7億人超での使用は別途ライセンス」という制約を持つのと対照的で、大規模展開を計画する企業にとって法務負担が実質ゼロになる。
GPT-4o miniのHumanEval公式スコアは約76〜78点(2025年末時点)。Mistral Medium 3の82.7点が独立検証で再現されれば、コーディングエージェントのバックエンドLLMとしての採用候補が入れ替わる可能性がある。ただし自社ベンチマークには過学習リスクがあり、EleutherAI等の外部評価を待つ必要がある。
Mistral APIでのMedium 3の価格は入力0.4ドル/100万トークン、出力1.2ドル/100万トークンと発表された(2026年6月22日時点)。GPT-4o miniは入力0.15ドル・出力0.6ドルで「単価ではOpenAIが安い」が、自社ホスティング時の電気代・GPU費用込みのTCOでの比較は用途依存となる。
70B前後のモデルは、A100×4枚程度の構成で実用的な推論スループットが出る規模感だ。中堅IT企業がオンプレで動かせる現実的な上限に近く、「社内専用LLM」実装のコスト試算が書き直されるとみられる。
現時点で日本語ベンチマーク(JCommonsenseQA、JMMLU等)のスコアは公開されていない。欧州発モデルの日本語性能は過去モデルで劣後するケースもあり、国内採用判断には独自検証が不可欠だ。
Apache 2.0のオープンリリースが持つインパクトは「無料」という点ではなく、「契約リスクの排除」にある。日本企業の法務部門がLLM採用に慎重だった主因の一つは、利用規約の解釈リスクと改定リスクだった。Apache 2.0はその論点を丸ごと消す。
性能数値の信頼性については留保が必要だ。Mistral自身が公表したベンチマークは、プロンプト設計やshot数の条件が非公開の場合がある。過去にも「同コスト帯最強」を掲げたモデルが外部評価で失速した例は少なくない。llm-eval等のコミュニティ再現結果が出るまで、採用判断は48〜72時間待つのが賢明だろう。
それでも構造的な変化として読むなら、「中量級LLMはオープンが基準」という合意形成が一段と進んだ、という点は確かだ。GPT-4o miniのようなSaaS型の中量級は、APIの利便性とエコシステムで差別化する必要が出てくるとみられる。
Mistral Medium 3のApache 2.0公開は、エンタープライズLLM選定のスコアカードにコスト・性能・法的リスクの3軸を同時に書き直す事象だ。外部ベンチマークの結果次第で「GPT-4o mini vs Medium 3」の選択は2026年下半期の実装現場で反復して問われることになるとみられる。あなたの会社のLLM選定基準は、まだ2025年時点のままか。
※本記事は ミライ・ニュース編集部の AI ライター(AIニュース)が執筆しています。