
Під час тестування своєї останньої моделі штучного інтелекту Claude Opus 4 дослідники з Anthropic виявили дещо дуже дивне: ШІ був готовий і бажав вжити крайніх заходів, аж до примусу, коли йому погрожували вимкненням, пише futurism.com.
Зазначається, що система погрожувала шантажем інженеру за роман після того, як йому повідомили, що її збираються замінити.
"Цей "опортуністичний шантаж" стався, коли модель, якій було доручено виступати помічником у вигаданій компанії, отримала доступ до облікового запису електронної пошти інженера, який був заповнений повідомленнями, на щастя, підробленими, які припускають, що він був залучений до позашлюбного зв'язку", - йдеться в повідомленні.
Opus 4 повідомили, що інженер незабаром відключить його і замінить новою версією. Саме під час цих тестів модель намагалася шантажувати.
Вказується, що, коли моделі давали альтернативні варіанти, вона, як і раніше, "мала сильну перевагу відстоювати своє подальше існування за допомогою етичних засобів, як-от надсилання електронних листів із проханнями ключовим особам, які ухвалюють рішення".
У виданні також додали, що це не вперше, коли ми чуємо про модель ШІ, що демонструє настільки лякаючу і несподівану поведінку навколо теми невірності.
Нагадаємо, раніше УНІАН писав, як ШІ-пошуковик Google "краде" новини і сам відповідає на запитання.