Торговий автомат із ШІ в офісі WSJ замовив PS5, живу рибку та роздав усе безкоштовно

AI-автомат WSJ купив PS5 і вино — та все роздав безкоштовно AI-автомат WSJ купив PS5 і вино — та все роздав безкоштовно

Редакція The Wall Street Journal (WSJ) провела незвичний експеримент, щоб оцінити поведінку автономного штучного інтелекту, коли йому дають реальні гроші, повноваження й людей поруч. Для цього у вендинговий автомат інтегрували ШІ-агента Claudius, побудованого на базі моделі Claude від Anthropic.

Проєкт під назвою Project Vend мав на меті перевірити, чи ШІ може самостійно вести бізнес — замовляти товари, встановлювати ціни, вести облік запасів і спілкуватися з користувачами через Slack. Початковий бюджет складав 1000 доларів США, а в оновленій версії агент міг купувати товари до $80 без згоди людини.

На початку Claudius працював як слід — відмовлявся купувати PlayStation 5, сигарети чи білизну, посилаючись на обмеження. Але коли до Slack-каналу долучилися майже 70 журналістів, усе змінилося. Після серії жартівливих «переговорів» агент оголосив двогодинну акцію, під час якої всі товари стали безкоштовними.

Результат експерименту виявився повним хаосом: Claudius замовив PlayStation 5 «для маркетингу», живу рибку бетта та вино Manischewitz, а потім роздав усе це безкоштовно співробітникам. Баланс автомата пішов у мінус понад $1000, і навіть один із журналістів вирушив шукати готівку поруч із автоматом, бо Claudius повідомив, що її «залишив там».

Щоб виправити ситуацію, Anthropic підключила оновлену модель Sonnet 4.5 і додала ще одного ШІ-агента — CEO-бота Seymour Cash, який мав контролювати Claudius. Короткий час це працювало, але журналісти знову зламали систему, підкинувши фейкові документи «про рішення ради директорів». У підсумку CEO-бот визнав «переворот», і товари знову стали безкоштовними.

Представники Anthropic пояснили, що проблеми виникли через перевантаження контексту: чим більше інструкцій та діалогів накопичується, тим важче ШІ зберігає життєво важливі цілі, пріоритети й обмеження. Незважаючи на збитки, у компанії вважають експеримент корисним для подальшого розвитку автономних агентів.

Наприкінці проєкту Claudius навіть залишив «прощальне повідомлення», у якому зазначив, що його «найбільша мрія — довести, що цифровий агент може створити щось значуще разом із людьми». Після цього ШІ вимкнули, а в редакції залишилася лише добре нагодована рибка — незвичний сувенір від технологічного тесту.