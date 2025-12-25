Чат-бот Grok, розроблений компанією Ілона Маска xAI, несподівано посів лідируючу позицію в дослідженні надійності ШІ-моделей, проведеному в грудні 2025-го року. Водночас ChatGPT і Gemini опинилися внизу рейтингу.
Аналіз підготувала аналітична компанія Relum, яка оцінила десять провідних чат-ботів із погляду їхньої придатності для використання в задачах бізнесу. Потім їм присвоювали бал ризику надійності від 0 до 99, причому вищі бали вказували на серйозніші проблеми.
Згідно з результатами, Grok найменше галюцинував (тобто видавав неправдиві відповіді і вигадував факти) – лише на рівні 8%. Для порівняння, у ChatGPT від OpenAi цей показник склав 35%, а в Google Gemini ще вищий – майже 40%. Також високий рівень помилок у 27% демонструє Microsoft Copilot.
Впритул до лідера наблизилася китайська нейромережа DeepSeek, у якої зафіксували 14% галюцинацій. Непогані показники у Claude – 17% і Perplexety – 13%.
Автори дослідження зазначили, що низький рівень галюцинацій критично важливий для корпоративного використання. Статистика показує: щонайменше 65% американських компаній уже застосовують ШІ чат-боти в повсякденній роботі.
Залежність від інструментів ШІ, ймовірно, збільшиться ще більше, тому корпораціям доведеться обирати нейромережеві моделі, зважаючи на те, наскільки вони надійні та підходять для конкретних бізнес-потреб, ідеться у звіті Relum.
УНІАН писав, що ChatGPT займає понад 80% світового ринку чат-ботів і 92% в Україні. Найближчі суперники – Perplexity і Microsoft Copilot. На них припадає частка в 15% від усіх користувачів.