ШІ-співробітники демонстрували дивний підхід до виконання завдань / фото - ua.depositphotos.com

Деякі люди побоюються, що штучний інтелект у майбутньому захопить усі робочі місця, позбавивши нас свого заробітку. Проте це навряд чи станеться найближчим часом, що підтверджують результати сміливого експерименту, пише Futurism.

Зазначається, що вчені з Університету Карнегі-Меллона створили фальшиву компанію TheAgentCompany, яка займається розробкою програмного забезпечення. Усі її співробітники - моделі ШІ, призначені для самостійного виконання завдань. Результати цього експерименту виявилися досить хаотичними.

Компанію TheAgentCompany укомплектували штучними працівниками з Google, OpenAI, Anthropic і Meta. Вони виконували ролі фінансових аналітиків, інженерів-програмістів і менеджерів проєктів, працюючи разом із симульованими колегами, такими як фальшивий відділ кадрів і головний технічний директор.

Відео дня

Вчені поставили перед "співробітниками" TheAgentCompany завдання, засновані на повсякденній роботі реальної компанії у сфері інформаційних технологій. Моделі ШІ переміщалися каталогами файлів, віртуально оглядали нові офісні приміщення і писали відгуки про роботу інженерів-програмістів на основі зібраного зворотного зв'язку.

У виданні поділилися, що найкраще себе показала модель Claude 3.5 Sonnet від Anthropic. Проте вона впоралася лише з 24% доручених їй завдань. Для виконання одного завдання моделі доводилося здійснювати близько 30 кроків.

Модель Gemini 2.0 Flash від Google в середньому робила 40 кроків на одне виконане завдання. Тільки 11,4% з них були виконані успішно.

Найгіршим ШІ-працівником виявилася модель Nova Pro v1 від Amazon. Вона робила в середньому по 20 кроків на виконання одного завдання, але показники успіху їх виконання становили лише 1,7%.

Учені заявили, що АІ-співробітники агенти страждають від нестачі здорового глузду, слабких соціальних навичок і поганого розуміння того, як орієнтуватися в Інтернеті. Також нейромережі часто самі створювали собі перешкоди, намагаючись побудувати короткі шляхи до виконання завдань.

"Наприклад, під час виконання одного завдання ШІ-агент не зміг знайти потрібну людину, якій необхідно поставити запитання для виконання завдання. У результаті він вирішив створити найкоротше рішення, перейменувавши іншого користувача на ім'я того, хто йому потрібен", - розповіли вчені.

Нейромережа Google вигадує неіснуючі приказки

Раніше всоцмережі X (колишній Twitter) один із користувачів виявив кумедний баг у роботі Google. Досить вбити в пошук випадковий набір слів із додаванням слова "значення", і система AI Overviews на базі нейромережі Gemini видає абсолютно вигадані пояснення та історії приказок.

Автор знахідки поділився прикладом: запит про "ослячу парасольку" привів до пояснення, нібито це ірландський сленг, що означає категоричну відмову.

Вас також можуть зацікавити новини: