
OpenAI поділилася результатами нового тесту GDPval, який уперше спробував оцінити, наскільки можливості сучасних провідних ШІ-моделей близькі до професійного рівня в економічно значущих професіях.
Тест охопив 9 провідних галузей економіки США та 44 професії – від агентів з продажу нерухомості та соціальних працівників до медсестер, інженерів і фінансових консультантів.
Результати показали, що найкраще ШІ-моделі проявили себе в рутинних та чітко сформульованих завданнях. Наприклад, GPT-5 і його конкуренти успішно підготували маркетингові матеріали, аналізували ринок, працювали з первинною юридичною документацією та обробляли медичні зображення.
До числа професій, де ШІ проявив найбільший потенціал, увійшли:
рієлтори
- юристи
- інженери
- розробники ПЗ
- соціальні працівники
- фармацевти
- фінансові консультанти
- медсестри
- фахівці з клієнтської підтримки.
Примітно, що лідером тесту виявився зовсім не GPT-5, а Claude Opus 4.1 від Anthropic. Він набрав найкращі оцінки від галузевих експертів за 220 завданнями. ШІ-модель від OpenAI посіла друге місце, продемонструвавши точність виконання завдань на одному рівні з галузевими експертами.
У OpenAI наголосили, що результати включають тільки обмежений набір завдань, тому говорити про повне заміщення професій поки зарано. Проте компанія фактично визнає, що штучний інтелект уже здатний виконувати частину завдань швидше і дешевше за фахівців.
Ключова проблема залишається незмінною – галюцинації та помилки, що особливо критично під час використання ШІ в науці, освіті або, наприклад, у медицині.
З моменту запуску першої версії ChatGPT наприкінці 2022 року, ШІ чат-бот постійно вдосконалювався. На початку серпня 2025-го OpenAI представила модель нового покоління – ChatGPT 5. За словами авторів, використовувати її – немов спілкуватися з кандидатом наук.
Раніше ЗМІ повідомили про масові скорочення айтішників по всьому світу. З початку 2025 року було звільнено понад 50 тисяч фахівців. До того ж під ударом опинилися не тільки новачки, а й досвідчені співробітники з багаторічним досвідом роботи в Google, Microsoft і Amazon.