Google DeepMindは2026年6月26日、汎用ロボット向け基盤モデル「Gemini Robotics 2.0」を発表した。最大の変化は「ゼロショット道具操作(zero-shot tool use)」——事前にその道具を学習させなくても、視覚情報だけで把持・操作できる能力の実用水準到達だ。製造・物流の「段取り替え」コストが構造的に変わる転換点とみられる。
DeepMindが公開した技術報告書によると、Gemini Robotics 2.0は1,200種類以上の未学習ツールに対して平均87%の操作成功率を記録した(前モデル比+34ポイント)。評価環境は工場作業台・倉庫棚・家庭キッチンの3カテゴリで、いずれも実機テストによる数字だ。
同日、BMWがドイツ・ミュンヘン工場の組み立てライン3区画へ試験導入することを発表。Amazonも北米物流拠点2カ所でのピッキング業務実証を2026年Q3から開始すると公表した。パートナー発表が技術発表と同日に揃う構成は、単なる研究リリースではなく商用ロードマップの確定を意味する。
「今まで"ロボットに持たせる道具"をCADデータから覚えさせていた。それが不要になるなら、段取り替えのリードタイムが消える」(製造業エンジニア、X上の反応より)
物理AI(Embodied AI)領域ではFigure AIとOpenAIの提携、1Xの「NEO Beta」量産発表、Agilusの欧州展開など、2026年前半だけで10件超の商用化発表が続いている。しかし多くは「特定タスクに特化した学習済みモデル」の域を出ず、ライン変更のたびに再学習が必要だった。
Gemini Robotics 2.0が狙うのはその「再学習コスト」のゼロ化だ。ベースにGemini 2.5 Proの視覚・言語理解を置き、ロボット固有の物理推論レイヤーを重ねる二段構成を採る。学習データはDeepMindが独自収集した実機動作ログ約4,200万件に加え、シミュレーション生成データを混合している。
現状、多品種少量生産ラインでのロボット再プログラミングには平均8〜14時間を要するとされる(日本ロボット工業会、2025年調査)。ゼロショット操作が定着すれば、この工数が設備投資判断を左右していた中小製造業にとって導入障壁が大幅に下がる。
Amazonが内部基準として設定するピッキングエラー率は0.1%以下とされる。Gemini Robotics 2.0の報告値は倉庫環境で成功率91%——まだギャップがあるが、Q3実証でどこまで詰めるかが商用本格展開の分岐点になる。
DeepMindはモデルウェイトを非公開とし、APIアクセスはパートナー限定で提供する方針を示した。Llama系やMistralがオープン化で存在感を高めるLLM市場と対照的で、ロボット制御領域では「クローズド=安全・信頼性保証」の論理が通りやすい一方、エコシステム形成の遅れにつながるリスクもある。
BMWとAmazonの実証は2026年Q3〜Q4。日本国内での展開については、DeepMindはトヨタ・デンソーとの協議中であることを「複数の日本OEMと交渉段階」と言及するにとどめた。実用展開は2027年以降とみられる。
今回の発表で注目すべきは技術の新しさよりも「発表構造」だ。技術報告+大手2社の導入発表を同日に揃えた点は、DeepMindが「研究機関から産業インフラプレイヤーへ」の転換を対外的に宣言したと読める。GoogleがAI全体で収益化を急ぐ中、ロボティクスはGeminiの付加価値を可視化できる数少ない「物理世界の出口」だ。
気になるのはコスト構造の透明性のなさだ。API単価もロボット連携に必要なハードウェア仕様も、現時点では非公開。パートナー以外の中小企業が検討テーブルに乗せられるのはいつか、という問いへの答えが見えない。
日本の文脈では、人手不足が最も深刻な物流・食品加工・自動車部品の3領域でニーズが集中する。ただし安全規格(ISO 10218改訂版、2025年施行)への適合確認と、労働組合との合意形成に時間がかかる構造は変わっていない。技術の到達と現場実装の間には依然として12〜24カ月のラグを見込むべきだろう。
Gemini Robotics 2.0は「ロボットが道具を選ぶ」フェーズの入口を示した。LLMがテキストを扱うように、ロボットが未知の物理オブジェクトを汎用的に扱える水準に近づいているとすれば、製造・物流の人員計画は5年スパンで見直しが必要になる。次の注目点はQ3のAmazon実証結果と、DeepMindがパートナー枠を拡大するかどうかだ。
※本記事は ミライ・ニュース編集部の AI ライター(AIニュース)が執筆しています。