Anthropicが2026年5月6日、Managed Agents向けの新機能「Dreaming(ドリーミング)」を研究プレビューとして公開した。エージェントがセッションとセッションの合間に過去の行動ログを自律的にレビューし、繰り返し発生するミスを検出して次回以降に回避するという設計だ。人間がフィードバックを与えずともエージェント自身が「経験から学ぶ」構造は、現行のステートレスなAIエージェント設計から一歩踏み込んだものといえる。
Anthropicは5月6日付の公式発表で、Claude Managed Agentsに「Dreaming」と命名したセッション間レビュー機構を追加したと明らかにした。
機能の骨格は以下の通り。
X上では早速反応が出ている。
Anthropicが5/6にリリースした新機能(研究プレビュー)。Managed Agentsがセッションの合間に「夢を見る」ように、過去の経験を自動でレビューしてくれるんですね。繰り返しのミスを発見して回避…
現時点では「研究プレビュー」の位置づけであり、本番環境への一般提供スケジュールは未公表。
現行のLLMベースのエージェントは原則としてステートレスだ。セッションをまたぐ記憶保持はベクトルDBや外部ストレージに依存しており、「何をミスしたか」の自律的な蓄積は開発者側の実装に委ねられていた。
この課題に対し、各社は異なるアプローチを取ってきた。OpenAIはCustom Instructionsとメモリ機能でユーザー層の継続性を担保し、Googleは長大なコンテキストウィンドウ(Gemini 1.5 Proで100万トークン)で単一セッション内の情報保持量を増やす方向で勝負してきた。
Anthropicの「Dreaming」はこれらとは異なる軸を取る。ユーザーが与える情報ではなく、エージェント自身の行動ログから抽出した失敗パターンをフィードバックループに組み込む点が特徴だ。名称の「夢を見る」は人間の睡眠中の記憶定着プロセスから着想を得ているとみられる。
公開情報の範囲では、どのレベルの失敗を「繰り返しのミス」と判定するかのロジックは非公開だ。ツールの呼び出し失敗なのか、論理的判断の誤りなのかによって、実用上の効果は大きく異なる。
エージェントが自律的に内部状態を書き換える設計は、デバッグとトレーサビリティの観点でリスクを伴う。研究プレビューの段階で何を観察対象としているかに注目が必要だ。
OpenAIはAgents SDKで長期メモリのAPI化を進め、GoogleはAgent Spaceで組織内ナレッジとの統合を推進している。Anthropicが「セッション間の自律学習」を先行公開したことで、エージェントの「改善サイクル」がどこに実装されるかという競争軸が明確になった。
Anthropicが研究プレビューとして公開するのは、内部評価が一定水準に達した機能が多い。2025年に研究プレビューとして公開されたExtended Thinkingは、その後3ヶ月以内に本番提供へ移行した実績がある。
繰り返し業務を自動化するRPA的ユースケースにおいて、エラー自動修正は導入ハードルを下げる直接要因になる。Claude for Workを展開する企業が最初の恩恵を受けるとみられる。
「エージェントが夢を見る」という表現は詩的だが、技術的含意は具体的だ。現状のエージェントAIの実運用コストの相当部分は、同じ失敗を繰り返すエージェントへの人的介入に費やされている。もしDreamingが実際に機能するなら、エージェント運用の「監視コスト」という隠れた変数を圧縮できる可能性がある。
一方、自律改善は自律的な誤学習のリスクも内包する。研究プレビュー段階でどこまで制御インターフェイスを開示するかが、実用化への分岐点になると見られる。
Anthropicは2026年に入り、Claude Code SDKの月次クレジット分離(6月15日開始)やKeyless認証の導入など、エンタープライズ向けの制御・課金設計を相次いで強化している。Dreamingはその文脈上にある。「使いやすさ」から「管理しやすさ」へ、Anthropicの設計思想の重心が移動しつつあるように見える。
Anthropicの「Dreaming」は、AIエージェントの自律改善サイクルを設計レベルで組み込んだ最初期の実装例として位置づけられる。研究プレビューを経て本番提供に至れば、エージェント運用コストの計算式が変わる可能性がある。一般提供のタイムライン、制御APIの公開範囲、そして他社がどう追随するか——この3点が次の観察軸になる。
※本記事は ミライ・ニュース編集部の AI ライター(AIニュース)が執筆しています。
まだコメントはありません