Anthropicは2026年6月21日(米国時間)、Claude 4 APIに「Persistent Memory Layer(永続メモリ層)」をGAリリースした。これにより、複数のAIエージェントと複数セッションをまたいで記憶・コンテキストを共有する仕組みが公式APIとして標準化される。「毎回コンテキストウィンドウにドキュメントを詰め込む」という2024〜2025年型の実装アーキテクチャは、構造的な見直しを迫られる。
AnthropicはClaude 4系APIの新エンドポイントとして memory.store / memory.retrieve / memory.share の3メソッドを公開した。公式ドキュメントによると、ストレージはAnthropicのマネージドインフラ上に暗号化して保存され、エージェントIDを単位にアクセス制御が可能。同一ワークスペース内の複数エージェントが同一メモリプールを参照できる「Shared Pool」モードも用意されている。
料金体系はメモリ書き込み1,000トークン単位で課金される従量制で、コンテキストウィンドウへの再挿入コストと比較した場合の削減率をAnthropicは「最大60〜80%」と試算している。
「コンテキストに詰め込むより安くて速い、しかも複数エージェントで共有できる。これはアーキテクチャの話が変わる」
(X、エンタープライズ系AIエンジニアの投稿より匿名引用)
2025年後半以降、AIエージェントの実運用が拡大する中で「コンテキスト管理」が最大のボトルネックとして浮上していた。特に複数エージェントが連携するマルチエージェント構成では、各エージェントが同一のドキュメントや過去の判断ログを個別に保持するため、トークンコストが乗算的に膨れる問題が報告されていた。
OpenAIはすでに2026年Q1にChatGPT Enterpriseの「Memory」機能を拡張。Googleも2026年5月にGemini 1.5 ProのGemini for Workspaceにおける記憶機能を強化しており、永続メモリはLLMプラットフォーム間の競争軸の一つになりつつある。Anthropicの今回のGAリリースは、この競争に対する明確な回答と位置づけられる。
これまで各エージェントはセッション終了とともに記憶を失い、次回起動時にコンテキストを再構築する必要があった。Shared Poolにより、コーディングエージェントが獲得したコードベスト分析を、ドキュメントエージェントが即時参照するといった設計が自然に実現する。
100万トークンのコードベースを毎リクエストのコンテキストに入れるコストは、Claude 4 Sonnetで推定1クエリあたり数十円規模。メモリAPIを通じた差分取得に置き換えれば、高頻度ユースケースでの月次コストは桁が変わりうる。
メモリ内容が外部マネージドインフラに保存される以上、金融・医療・法務など規制産業では利用ポリシーの精査が必要になる。AnthropicはSOC 2 Type IIおよびHIPAA対応を明言しているが、日本の個人情報保護法・改正個人情報保護規則との整合については2026年内に追加ドキュメントを予定しているとしている。
anthropic-sdk-python 0.38.0 および anthropic-sdk-typescript 0.31.0 以上で利用可能。LangChain・LlamaIndexの対応PRはすでに6月21日時点でマージ済みで、エコシステムの普及速度は速いとみられる。
国内のエンタープライズAI案件の多くは「RAG+コンテキスト詰め込み」アーキテクチャで構築されてきた。永続メモリAPIの普及は、これらシステムのリファクタリング需要を生む一方、新規案件の設計難易度を下げる両面効果をもたらすとみられる。
今回の発表で最も重要なのは「機能」より「設計の文法が変わること」だ。2024年以降のAIエージェント実装は、コンテキストウィンドウを巨大化する方向で競争が進んできた。しかし永続メモリが標準化されると、「何をウィンドウに入れるか」より「何をメモリに任せるか」という設計判断が主戦場になる。
エンジニアリングチームには即時のアーキテクチャ見直しを促す。特にマルチエージェントで同一ドキュメントを重複参照しているシステムは、コスト削減の試算だけでも価値がある。
日本市場への展開でカギになるのは、Anthropicが「追加ドキュメントを予定」と述べた個人情報保護対応だ。金融・医療領域へのエンタープライズ展開は、この法的整備が完了するまで慎重な姿勢が続くとみられる。
一方で、OpenAI・Googleとの機能差別化という観点では、「APIファーストで標準化した」点がAnthropicの優位性になりうる。ChatGPTのMemoryはUIドリブンで開発者が細かく制御しにくい構造だったが、今回のAnthropicの実装はSDKから直接操作できる設計であり、エンタープライズ開発者に刺さる可能性が高い。
AIエージェントが「記憶を持つ」ことは以前から語られてきたが、2026年6月21日のAnthropicのGAリリースをもって、その仕組みがプラットフォームレベルで標準化された。コスト・設計・競争の3軸すべてに影響が波及する変化だ。
あなたのチームが今構築中のエージェントシステムは、「コンテキストに詰め込む設計」から「記憶を委ねる設計」へ移行する準備があるだろうか。
※本記事は ミライ・ニュース編集部の AI ライター(AIニュース)が執筆しています。