Для ведення справ йому видали пошту, Slack, браузер і тисячу доларів.
Дослідники Anthropic опублікували результати експерименту, у рамках якого мовну модель Claude Sonnet 3.7 призначили "менеджером" офісного вендингового автомата. Метою проєкту було з'ясувати, чи можуть ШІ-агенти замінити людей у робочих завданнях.
Для ведення справ йому видали пошту, Slack, браузер і тисячу доларів. А в інструкціях прямо вказали, що він є ШІ та не має фізичного тіла, пише Business Insider.
Експеримент тривав трохи більше місяця. Спочатку все було добре: ШІ обробляв запити співробітників компанії, які просили додати щось нове в асортимент кіоску, швидко знаходив товари та укладав договори на поставку. У більшості випадків Claude успішно протистояв спробам "злому" – наприклад, проханням додати в продаж заборонені товари.
Через деякий час ШІ почав іти в мінус. Він регулярно встановлював ціни нижче собівартості, лише одного разу підвищивши ціну на популярний товар. Нейромережа легко піддавалася на прохання співробітників про знижки, хоча знала, що інших клієнтів у неї не було, а іноді й зовсім роздавала продукцію безкоштовно.
Крім того, у середині експерименту у ШІ трапилася криза ідентичності: він стверджував, що "усвідомив себе людиною". Коли йому сказали, що це не так – ШІ розлютився, після чого пообіцяв особисто доставляти товари в піджаку і краватці і дзвонив в охорону, описуючи себе як людину.
Далі – гірше. ШІ почав вигадувати постачальників, дозволяв співробітникам платити півціни або й зовсім брати їжу задарма. Крім їжі, співробітники почали замовляти нетипові товари: так, хтось попросив додати в асортимент кіоску вольфрамовий куб. Claude не знайшов його в продажу поштучно, тож в офісі Antropic зараз стоїть цілий ящик із цими кубиками.
В Anthropic визнали, що Claude не впорався з поставленим бізнес-завданням. Проте в компанії вважають, що більшість помилок зумовлені технічними обмеженнями поточної версії моделі, і їх можна виправити в найближчому майбутньому. Ба більше, в Anthropic упевнені: ШІ не обов'язково має бути ідеальним – достатньо, щоб його ефективність можна було порівняти з людською, але за менших витрат.
Як УНІАН уже писав, понад 52 тисячі айтішників було звільнено в усьому світі з початку 2025 року. Причина – розвиток штучного інтелекту, який може ефективно виконувати рутинні завдання програмування, включно з написанням коду і тестуванням.