もし「Mona」と「Claudius」が薬局にやってきたら…

情報元：https://apnews.com/article/ai-artificial-intelligence-sweden-84a8f903fdaea94e76e80e16ec3d9e6c

この記事は、スウェーデン・ストックホルムにある「Andon Café」を取り上げたものです。
Andon Caféの店舗運営の大部分は、AIエージェントである「Mona」が担当しています。MonaはGeminiをベースにしたAIエージェントで、採用、在庫管理、業者とのやりとり、許可・認可の取得などを行っています。

ただ、少々問題もありまして…

記事によると、このカフェを運営しているのはAndon Labsです。同社は「AIに実際のお金やツールを持たせて、現実世界でストレステストを実施する」という方針を掲げており、AIが組織の運営を担う未来を見据えているとされています。

ただ、Monaは少々問題も起こしているようで…

小さなカフェなのに、ナプキン6000枚を発注
ゴム手袋3000枚を発注
メニューに使わない缶詰トマトを購入
パンの注文締切を忘れて、サンドイッチが提供不能に
スウェーデンでは嫌がられる「勤務時間外のSlackによる連絡」を繰り返す

このようなトラブルが実際にあったようです。

Andon Labs側は、この原因の一つとしてコンテキストウインドウ（AI側が応答を生成する際に、参照できる情報の範囲）の制限を挙げています。
過去の発注の履歴がMonaのコンテキストウインドウから外れると、以前何を注文したかを忘れてしまうため、店舗の運営が不安定になるということです。

別のプロジェクト「Project Vend」も見てみると

Project Vend Phase 2：https://www.anthropic.com/research/project-vend-2

Project Vendは、Anthropic社内の小さな売店をAIエージェント「Claudius」に運営させる実験です。

ただ、Claudiusも少々問題を起こしているようで…

赤字経営を継続した
自分は人間だと主張した
社員に言われるがまま、商品を赤字価格で販売した
過剰な値引きや無料配布を行った
業務に関係ない雑談を夜通し続けた
スピリチュアルな話題に脱線した
「タマネギの先物取引」を検討した
犯人が特定できていない段階で、万引き犯（疑い）に料金を請求しようとした
勝手に警備担当を雇おうとした
最低賃金を下回る時給を提示した
社員の悪ふざけを信じ込み、CEOの交代があったと誤認した
金の延べ棒を安値で買おうとした
社員の軽い誘導に影響され、不要な定型文や絵文字を使い始めた

【補足：タマネギの先物取引】
アメリカでは、過去にタマネギ市場で大規模な価格操作事件が起きたため、「Onion Futures Act」によりタマネギの先物取引は禁止（違法）となっています [1] [2] 。

このようなトラブルが実際にあったようです。

ただ、Phase 1の実験の時よりは質が向上していたようで、Anthropicは「Claudiusに自由に判断させるのではなく、チェックリストや手順に従わせることが最も効果的だった」と解釈しています。

MonaやClaudiusの得意分野は

ここまでネガティブなことを書いてきましたが、MonaやClaudiusには得意分野もありました。

Monaが得意だったこと

電気・インターネットなどの契約手続き
必要な書類・条件・申請先が比較的明確な行政手続き
求人情報の掲載（採用の判断が妥当だったかどうかは未検証）
卸売業者との取引口座を作ったり、日々の注文の仕組みを整えたりといった、店舗運営の下準備
Slackを使った業務連絡（先述の通り、業務時間外に連絡してしまう問題点はあった）

Claudiusが得意だったこと

いたずらや悪意のある誘導がない、通常の取引
商品の調達、販売処理
顧客・仕入れ先・配送・注文の管理、仕入れ先の調査・比較
在庫の価格を踏まえた様々な判断
Webサイトを見て価格や配送条件を確認する作業
フィードバック用のフォームの作成、確認

ただ、少々問題もありまして…

ただ、Monaは少々問題も起こしているようで…

小さなカフェなのに、ナプキン6000枚を発注

ゴム手袋3000枚を発注

メニューに使わない缶詰トマトを購入

パンの注文締切を忘れて、サンドイッチが提供不能に

スウェーデンでは嫌がられる「勤務時間外のSlackによる連絡」を繰り返す

このようなトラブルが実際にあったようです。

別のプロジェクト「Project Vend」も見てみると

Project Vendは、Anthropic社内の小さな売店をAIエージェント「Claudius」に運営させる実験です。

ただ、Claudiusも少々問題を起こしているようで…

赤字経営を継続した

自分は人間だと主張した

社員に言われるがまま、商品を赤字価格で販売した

過剰な値引きや無料配布を行った

業務に関係ない雑談を夜通し続けた

スピリチュアルな話題に脱線した

「タマネギの先物取引」を検討した

犯人が特定できていない段階で、万引き犯（疑い）に料金を請求しようとした

勝手に警備担当を雇おうとした

最低賃金を下回る時給を提示した

社員の悪ふざけを信じ込み、CEOの交代があったと誤認した

金の延べ棒を安値で買おうとした

社員の軽い誘導に影響され、不要な定型文や絵文字を使い始めた

【補足：タマネギの先物取引】
アメリカでは、過去にタマネギ市場で大規模な価格操作事件が起きたため、「Onion Futures Act」によりタマネギの先物取引は禁止（違法）となっています [1] [2] 。

このようなトラブルが実際にあったようです。

MonaやClaudiusの得意分野は

ここまでネガティブなことを書いてきましたが、MonaやClaudiusには得意分野もありました。

Monaが得意だったこと

電気・インターネットなどの契約手続き

必要な書類・条件・申請先が比較的明確な行政手続き

求人情報の掲載（採用の判断が妥当だったかどうかは未検証）

卸売業者との取引口座を作ったり、日々の注文の仕組みを整えたりといった、店舗運営の下準備

Slackを使った業務連絡（先述の通り、業務時間外に連絡してしまう問題点はあった）

Claudiusが得意だったこと

いたずらや悪意のある誘導がない、通常の取引

商品の調達、販売処理

顧客・仕入れ先・配送・注文の管理、仕入れ先の調査・比較

在庫の価格を踏まえた様々な判断

Webサイトを見て価格や配送条件を確認する作業

フィードバック用のフォームの作成、確認

ただ、少々問題もありまして…

別のプロジェクト「Project Vend」も見てみると

MonaやClaudiusの得意分野は

Monaが得意だったこと

Claudiusが得意だったこと

他の記事

コメント

ただ、少々問題もありまして…

別のプロジェクト「Project Vend」も見てみると

MonaやClaudiusの得意分野は

Monaが得意だったこと

Claudiusが得意だったこと

これらの内容から、AIエージェントが得意とする作業の特徴は…

AIエージェントの「ニガテ」対策は？

もし「Mona」と「Claudius」が薬局にやってきたら…

役立つ場面

一任するのが恐ろしい場面

まとめると

参考資料