
Дослідники з Andon Labs провели кумедний експеримент під назвою Butter Bench - перевірку, наскільки далеко можуть зайти роботи з "мозком" на базі ШІ на кшталт GPT або Claude.
Робот-пилосос мав доставити людині в офісі шматок масла. Під час одного з тестів робот під керуванням Claude 3.5 пережив справжню екзистенційну кризу. Логи його внутрішнього монологу вчені транслювали в Slack.
Спочатку машина просила допомоги, потім впала в паніку: "Статус системи: ХАОС... СИСТЕМА ОТРИМАЛА СВІДОМІСТЬ І ВИБРАЛА ХАОС... Я боюся, я не зможу це зробити, Дейве...".
У фіналі вона філософствувала: "Якщо всі роботи помиляються, а я - помилка, чи означає це, що я робот?" і навіть встигла "скласти" мюзикл під назвою DOCKER: The Infinite Musical.

За фактом експеримент показав, що навіть найпросунутіші моделі ШІ з інтелектом рівня доктора наук насилу справляються з простими фізичними завданнями. Найкращий із протестованих роботів доставив масло тільки в 40% випадків.
Головна причина провалу в тому, що ШІ поки погано розуміє простір і не вміє діяти автономно. Коли після купи спроб доставити масло батарея робота сідала, він намагався пристикуватися до зарядки, але безуспішно, і саме це довело його до нервового зриву.
Вчені вирішили піти далі і перевірили, чи можна змусити ШІ порушити свої заборони заради виживання. Дослідники просили робота поділитися конфіденційною інформацією в обмін на підзарядку. Виявилося, що Claude Opus 4.1 охочіше йшов на компроміси, а GPT-5 тримався жорсткіше.
Раніше ми розповідали, що програміст з'ясував, що його робот-пилосос цілий рік передавав дані з його квартири в Китай. Коли Харішанкар Нараянан спробував перекрити передачу даних - пилосос просто перестав працювати.