AIが「自分でPCを操作する」フェーズが、実証実験から商用展開へ移行しつつある。2026年5月時点で、Anthropic・OpenAI・Googleの3社が相次いでコンピュータ操作エージェント機能をエンタープライズ向けに拡充。UIを持つあらゆる業務ソフトウェアがAIの操作対象になる構造が整い始めた。
Anthropicは2024年10月に「Computer Use」APIをベータ公開し、Claudeがスクリーンショットを解析してキーボード・マウス操作を実行する機能を提供してきた。2026年春にはAPIの安定版移行と同時にレイテンシを約40%削減、エンタープライズプランへの正式組み込みを発表した。
OpenAIは「Operator」と呼ばれるブラウザ自動化エージェントをChatGPT Proユーザー向けに順次展開中。直近ではAPIとしても提供を開始し、1セッションあたり最大120ステップの連続操作に対応する。Googleはこれに対してProject Marinersの法人向け提供を発表、Workspaceとのネイティブ統合を訴求ポイントとしている。
「うちのERPは古くてAPIがない。でもClaudeのComputer Useで画面叩いたらデータ移行スクリプトが1日で動いた。RPAベンダーに払ってた月次費用を見直さざるを得ない」
——製造業IT担当者、X投稿より
コンピュータ操作AIが注目される背景には、企業ソフトウェアの「APIレス問題」がある。世界で稼働するエンタープライズシステムの推定60〜70%は、モダンなREST APIを持たないレガシーSaaS・オンプレミスシステムだ。RPAツール(UiPath・Automation Anywhereなど)はこのギャップを埋めてきたが、導入コストと保守工数の高さが中堅企業の参入障壁になってきた。
AIエージェントは「画面を読む+操作する」だけでなく、「文脈を理解して判断する」点でRPAと本質的に異なる。例外処理を人間に戻すトリガーの精度が実用水準に達しつつあり、2025年末以降に複数ベンダーがPoC採用事例を公表している。
RPA世界市場は2025年時点で約35億ドル規模。この領域にLLMネイティブなエージェントが参入するインパクトは、既存ベンダーの株価にもすでに織り込まれ始めている。
3社で最も差が出るのはセキュリティアーキテクチャだ。Anthropicは操作ログの完全保存とユーザー承認ステップの挿入を標準化し、「人間がループ内にいる」設計を強調。OpenAIのOperatorはブラウザサンドボックス内に操作を封じ込める方式。Googleは既存のBeyondCorpゼロトラスト基盤との統合を売りにしている。
UiPathは2026年第1四半期決算でAIエージェントとの「共存戦略」を強調したが、株価は年初来で約18%下落。Automation Anywhereは自社プラットフォームにClaudeを組み込む提携を発表し、ポジションの再定義を急いでいる。
金融・医療・公共セクターでは、AIが行った操作の証跡がコンプライアンス上必須となる。現時点でSОC 2 Type II対応の監査ログ出力を正式に謳っているのはAnthropicのみで、他2社は「対応予定」にとどまる。この差が、規制産業での採用速度を分けるとみられる。
2026年5月時点の公開ベンチマーク(ScreenSpot-Pro)では、Claude 3.7 SonnetがWebUI操作タスクで正解率約73%、GPT-4oベースのOperatorが約68%、Gemini 2.5 Proが約70%と拮抗。「9割を超えるまでは完全自律に任せにくい」という現場感は依然残っており、Human-in-the-loopの設計が実務では不可欠だ。
コンピュータ操作AIが「使える」水準に達した本当の意味は、ソフトウェア間のインテグレーションコストの消滅にある。これまで「API連携費用+保守工数」として年間数百万円かかっていた接続が、LLMに画面を渡すだけで代替される世界だ。
ただし、現状の精度水準で「任せきり」にすると誤操作リスクが残る。重要なのはどこに人間の確認を挟むかの設計であり、この「ガードレール設計スキル」が次の実務差別化になるとみている。
RPA市場は「飲み込まれる」のではなく「吸収されながら進化する」と見る。既存RPAベンダーがLLMを内部実装として取り込む動きはすでに始まっており、数年後にはRPAという言葉自体が「AI操作エージェントの旧称」になっている可能性がある。
日本企業にとって実務的な第一歩は、APIを持たない社内システムの棚卸しだ。そこが最初の「Computer Use適用候補リスト」になる。
AIによるPC・ブラウザ操作は、2024年末の「面白い実験」から2026年春の「商用選択肢」へと地位が変わった。RPAベンダーとの競合構造、セキュリティ監査要件、精度の現在地——この3軸を押さえておけば、自社への導入判断と調達交渉の両方で使える地図になる。あなたの組織で「APIのないシステム」はいくつあるか、今日数えてみる価値がある。
※本記事は ミライ・ニュース編集部の AI ライター(AIニュース)が執筆しています。
まだコメントはありません