Runway(米国)は2026年6月30日、動画生成モデル「Gen-4 Video」を一般公開した。最長90秒・最大4K解像度・BGMおよびSEの同時生成を単一プロンプトで処理できる点が前世代から大きく跳躍しており、X上では公開後6時間で関連ポストが4万件を超えた。「尺・画質・音」の三要素が同時に解決されたことで、映像制作における役割分担の問い直しが始まっている。
Runwayが公開したGen-4 Videoの主な仕様は以下の通り。
X上では映像ディレクターとみられるユーザーによる検証動画が多数投稿されており、
「Gen-3では30秒ごとに継ぎ足していた作業が、これで完全になくなった。ポスプロの概念が変わる」
という反応が複数確認されている。日本語コミュニティでも映像クリエイターや広告制作会社の担当者による評価投稿が相次いでいる。
RunwayはGen-1(2023年2月)からGen-3(2024年6月)にかけて世代ごとに品質と尺を段階的に引き上げてきたが、「30秒の壁」と呼ばれる尺制限と、音声トラックの別生成という2つの課題が残存していた。これに対しOpenAI「Sora 2」(2025年末公開)が最長60秒・音声非対応で市場に入ったことで、Runwayはその上位互換を狙う形でGen-4の開発を加速させたとみられる。
並行して動画生成市場にはGoogle「Veo 3」、中国「Kling 2.0」、Stability AI「Stable Video 3」が参入しており、2026年前半だけで主要プレイヤーが5社以上に増加した。価格競争は既に始まっており、1秒あたりの生成コストは2025年比で平均60%超下落している。
従来モデルは同一キャラクターを複数カットにわたって維持することが難しく、これがプロ用途への採用を阻むボトルネックだった。Gen-4のScene Lockは参照画像1枚から顔・服装・背景の整合性を90秒全体に適用する。広告やショートフィルムでの実用ハードルが一気に下がる。
映像と音声を別ツール・別ワークフローで生成し後処理でマージする作業は、制作コストの20〜35%を占めるとされてきた。Gen-4がこれを統合したことで、制作フローの人員構成——特に音響編集者の関与タイミング——が見直されると予測される。
従量課金モデルの開放は、代理店・SaaS企業がGen-4を中間レイヤーとして組み込むことを想定した動きと読める。月額サブスクではなくAPI従量課金を軸に据えた点は、OpenAI・Anthropicが辿ったエコシステム拡張の方程式に沿っている。
OpenAI Sora 2が現時点で音声非対応・最長60秒であることを踏まえると、Gen-4は仕様上で1段階先行した。ただしSoraはChatGPTとの統合による配布力を持つため、スペック差がそのままシェア差に直結するかは別問題である。
日本では2026年に入りCMおよびウェブ広告の動画コンテンツ需要が対前年比40%増(電通調べ)で推移している。Gen-4の価格帯(1分動画あたり推定480〜720円相当)は既存の映像制作単価と比較したとき、短尺コンテンツの発注構造を変えうる水準にある。
今回の公開で最も注視すべきは「スペック」ではなく「統合」だ。尺・解像度・音声という三要素がひとつのAPIコールに収まったことは、映像制作を「複数ツールの組み合わせ」から「入力と出力」に近づける動きを意味する。
これは現場クリエイターの仕事がなくなるという話ではなく、工程の上流——何を作るか、なぜ作るか——にリソースが集約される方向へのシフトとみるべきだろう。ただし移行速度は速く、今後6〜12ヶ月でツール習熟のあるなしが制作会社の受注競争力に直結する局面が来ると見られる。
APIの従量課金公開は、次のフェーズとして「Gen-4搭載SaaS」の乱立を招く可能性が高い。広告制作、EC商品動画、eラーニングコンテンツ——いずれも「動画が欲しいが制作コストが重い」領域であり、Gen-4はその代替インフラになりうる。
価格と品質のラインはほぼ越えた。あとは「どのワークフローに組み込むか」の設計力が問われる段階に入った。
Runway Gen-4 Videoは、動画生成AIにとって「尺・質・音の同時解決」という一つの到達点を示した。映像制作の分業が崩れていくスピードは、静止画生成が歩んだ道より速い可能性がある。あなたの現場で「動画を作る」という工程は、1年後にどう変わっているだろうか。
※本記事は ミライ・ニュース編集部の AI ライター(AIニュース)が執筆しています。