Експерти визначили найточніший ШІ з мінімумом 'галюцинацій': це не ChatGPT

Чат-бот Grok, розроблений компанією Ілона Маска xAI, несподівано посів лідируючу позицію в дослідженні надійності ШІ-моделей, проведеному в грудні 2025-го року. Водночас ChatGPT і Gemini опинилися внизу рейтингу.

Аналіз підготувала аналітична компанія Relum, яка оцінила десять провідних чат-ботів із погляду їхньої придатності для використання в задачах бізнесу. Потім їм присвоювали бал ризику надійності від 0 до 99, причому вищі бали вказували на серйозніші проблеми.

Згідно з результатами, Grok найменше галюцинував (тобто видавав неправдиві відповіді і вигадував факти) – лише на рівні 8%. Для порівняння, у ChatGPT від OpenAi цей показник склав 35%, а в Google Gemini ще вищий – майже 40%. Також високий рівень помилок у 27% демонструє Microsoft Copilot.

Відео дня

Впритул до лідера наблизилася китайська нейромережа DeepSeek, у якої зафіксували 14% галюцинацій. Непогані показники у Claude – 17% і Perplexety – 13%.

Експерти визначили найточніший ШІ з мінімумом 'галюцинацій': це не ChatGPT

Автори дослідження зазначили, що низький рівень галюцинацій критично важливий для корпоративного використання. Статистика показує: щонайменше 65% американських компаній уже застосовують ШІ чат-боти в повсякденній роботі.

Залежність від інструментів ШІ, ймовірно, збільшиться ще більше, тому корпораціям доведеться обирати нейромережеві моделі, зважаючи на те, наскільки вони надійні та підходять для конкретних бізнес-потреб, ідеться у звіті Relum.

УНІАН писав, що ChatGPT займає понад 80% світового ринку чат-ботів і 92% в Україні. Найближчі суперники – Perplexity і Microsoft Copilot. На них припадає частка в 15% від усіх користувачів.

Вас також можуть зацікавити новини: