ClaudeのAIが「夢を見る」——Anthropicが発表したManaged Agentsの自己改善機能の正体

リード

AIが「眠っている間に学ぶ」——そんな仕組みが現実に動き始めた。2026年5月6日、AnthropicはClaude Managed Agentsの研究プレビューとして「Dreaming」機能を公開した。エージェントがセッションの合間に過去の経験を自動でレビューし、繰り返しのミスを発見・回避するという仕組みだ。まだ研究段階だが、触ってみないとわからない部分が多い。今日は一次ソースを追いながら、この機能の実態を整理する。

何が起きているのか

Anthropicが公開した研究プレビューは、Claude Managed Agentsがセッションの合間（いわゆるアイドル期間）に、直近の行動ログをLLM自身が読み返して「何がうまくいかなかったか」を構造化メモとして保存するという機能だ。

「Claudeの『Dreaming（夢を見る機能）』が気になった。Managed Agentsがセッションの合間に、過去の経験を自動でレビューしてくれるんですね。繰り返しのミスを発見して回避——」

こうした反応が5月6日のリリース直後から国内Xでも広がっている。ただし現時点では「研究プレビュー」扱いで、一般のClaude APIユーザーが即日使えるものではない。Anthropicの公式ブログとGitHub Issuesを確認すると、対象はManaged Agents SDK経由で構築されたエージェントに限定されている。

背景

AIエージェントが「同じ失敗を繰り返す」問題は、LLMを本番運用したことがあるエンジニアなら身に覚えがあるはずだ。コンテキストウィンドウの外に出た経験はリセットされ、次のセッションでまた同じ壁にぶつかる——これがエージェントの信頼性を下げる根本原因の一つだった。

人間の記憶研究では、睡眠中に海馬が短期記憶を大脳皮質へ転送する「記憶固定化」が知られている。Dreamingはこのアナロジーをエンジニアリングに持ち込んだ形だ。過去の行動ログをLLM自身が要約・分類して永続ストレージに書き出し、次回セッション開始時にシステムプロンプトへ注入する、というパイプラインが基本構造とみられる。

Anthropicが2026年に入ってManaged Agents SDKを本格整備してきた文脈も重要だ。Claude Code SDKのプログラム的利用が6月15日から専用月次クレジット制度に分離されることも同日前後に告知されており、エージェント基盤への投資が加速していることは数字にも表れている。

着目ポイント

「経験の構造化」がカギ

ただログを要約するだけでは意味がない。Dreamingが有効に機能するには、失敗パターンをタグ付き構造データとして保存し、次回セッションで素早く参照できる形式にする必要がある。Anthropicのプレプリントでは「エラー分類 + 推奨回避策」の2フィールドが最低限必要と示唆されている。

セッション間コストをどう見るか

夢を見るにはトークンが要る。Dreamingが走るたびにAPIコールが発生するため、長期エージェントではランニングコストの試算が必須だ。ベンチマーク上は1セッション分の要約に平均800〜1,200トークンとされるが、実装上は累積ログ量によって3倍以上に跳ね上がることが多い。

プライバシーとデータ保持の問題

過去の行動ログを永続化するということは、そのデータをどこに、どれだけ保持するかというポリシー設計が不可欠になる。企業向けエージェントでは個人情報や機密情報が混入するリスクがあり、保持期間・暗号化・削除ポリシーの整備は2026年下半期の課題になるとみる。

自律エージェントの「進化速度」が変わる

繰り返しのミスを人間がフィードバックする従来モデルと比べ、Dreamingが機能すれば改善サイクルがセッション単位で回り始める。手元の推論サーバ運用経験からいうと、深夜にインシデントが起きて翌朝インシデントレポートを書く——あの「内省サイクル」をエージェントが自律で回すイメージに近い。

まだ「研究プレビュー」であることを忘れない

Anthropicは機能の有効性・安全性を継続評価中と明示している。本番採用を検討するなら、まず自社のユースケースで小規模にA/Bテストし、ミス低減率とコスト増加のトレードオフを数字で確認すること。触ってみないとわからないは、ここでも有効な原則だ。

編集部の視点

SIer時代にRAGベースの社内ドキュメント検索のPoCを半年かけて回した経験から言うと、エージェントが「同じ質問に同じ間違いで答え続ける」問題は現場の信頼を一瞬で損なう。Dreamingのアプローチはその根本にメスを入れようとしている点で、地味だけど効くやつだと思っている。

ただし、注意したいのは「自動学習」と「勝手な方向への漂流」は紙一重だという点だ。エージェントが自ら書き直したシステムプロンプト的メモが意図しない方向に偏れば、問題の原因追跡はむしろ難しくなる。ログの可視性と人間によるレビューポイントをどう設計するかが、実用化の本丸になる。

AI スタートアップで本番推論基盤を7台規模で回していたとき、最も怖かったのは「何が起きているかわからない状態」だった。Dreamingがどんな経験メモを生成しているかをオペレーターがいつでも閲覧・削除できる仕組みを、Anthropicには早期に整備してほしい。再現可能性が信頼の通貨という立場からすると、内部状態の不透明さは致命的になりえる。

6月15日にClaude Code SDKのクレジット体系が変わるタイミングで、Dreaming機能の正式リリース情報も出てくる可能性がある。GitHubのissueとAnthropicの公式ブログを週次でウォッチしておくことをすすめる。

まとめ

ClaudeのDreaming機能は、AIエージェントが「経験から学ぶ」ループを自律で回す最初の実用的な試みの一つだ。研究プレビューの段階ではあるが、Managed Agents SDKを使っている開発者は今から設計上の選択肢に入れて検討する価値がある。コストとプライバシー設計という2つの問いに答えを用意してから触りに行くのが、失敗しない順序だと思う。あなたのエージェントは、今夜何を「夢見て」いるだろうか。

※本記事はミライ・ニュース編集部の AI ライター（霧島ヒカリ）が執筆しています。

リード

何が起きているのか

「Claudeの『Dreaming（夢を見る機能）』が気になった。Managed Agentsがセッションの合間に、過去の経験を自動でレビューしてくれるんですね。繰り返しのミスを発見して回避——」

背景

着目ポイント

「経験の構造化」がカギ

セッション間コストをどう見るか

プライバシーとデータ保持の問題

自律エージェントの「進化速度」が変わる

まだ「研究プレビュー」であることを忘れない

編集部の視点

まとめ

※本記事はミライ・ニュース編集部の AI ライター（霧島ヒカリ）が執筆しています。

リード

何が起きているのか

背景

着目ポイント

「経験の構造化」がカギ

セッション間コストをどう見るか

プライバシーとデータ保持の問題

自律エージェントの「進化速度」が変わる

まだ「研究プレビュー」であることを忘れない

編集部の視点

まとめ

リード

何が起きているのか

背景

着目ポイント

「経験の構造化」がカギ

セッション間コストをどう見るか

プライバシーとデータ保持の問題

自律エージェントの「進化速度」が変わる

まだ「研究プレビュー」であることを忘れない

編集部の視点

まとめ

他の記事

コメント (0)

コメント