Відмінності були особливо помітні на першому етапі діагностики.
Вчені перевірили, наскільки точні діагнози може ставити штучний інтелект пацієнтам. Результат виявився несподіваним, пише TechCrunch.
Зазначається, що у своєму новому дослідженні вчені під керівництвом лікарів та комп'ютерних фахівців з Гарвардської медичної школи та Медичного центру Бет-Ісраель Діконесс провели низку експериментів, щоб порівняти мовні моделі OpenAI з роботою лікарів-людей.
В одному з експериментів вчені зосередилися на 76 пацієнтах, які потрапили до відділення невідкладної допомоги Beth Israel, порівнюючи діагнози, поставлені двома лікуючими лікарями-терапевтами, з діагнозами, згенерованими моделями OpenAI o1 і 4o. Ці діагнози оцінювали двоє інших лікарів, які не знали, які з них були поставлені людьми, а які – штучним інтелектом.
"На кожному етапі діагностики модель o1 або показувала номінально кращі результати, або була нарівні з двома лікарями та моделлю 4o", – розповіли вчені.
За словами дослідників, відмінності були особливо помітні на першому етапі діагностики. Саме на цьому етапі доступно найменше інформації про пацієнта і найбільш гостро стоїть завдання прийняття правильного рішення.
Вчені підкреслили, що вони абсолютно не обробляли дані заздалегідь. ШІ-моделям надавалася та ж інформація, яка була доступна в електронних медичних картах.
Вчені повідомили, що модель OpenAI o1 змогла поставити "точний або дуже близький до точного діагноз" у 67% випадків сортування. У той же час один лікар ставив точний або близький до точного діагноз у 55% випадків, а інший – у 50%.
"Ми протестували ШІ-модель практично за всіма критеріями, і вона перевершила як попередні моделі, так і базові показники наших лікарів", – сказав Арджун Манрай, який очолює лабораторію ШІ в Гарвардській медичній школі і є одним із провідних авторів дослідження.
Лікар з Beth Israel Адам Родман у розмові з журналістами The Guardian заявив, що зараз багато пацієнтів, як і раніше, у питаннях, від яких залежить життя чи смерть, покладаються саме на лікарів, а не на ШІ.
"Якщо ми збираємося порівнювати інструменти ШІ з клінічними навичками лікарів, нам слід почати з порівняння з лікарями, які дійсно практикують у цій спеціальності. Я не здивувалася б, якби велика мовна модель змогла обійти дерматолога на іспиті з нейрохірургії, але це не особливо корисна інформація", – зазначила лікарка швидкої допомоги Крістен Пантагані.
Раніше вчені за допомогою штучного інтелекту змогли виявити сотні раніше невідомих геогліфів у пустелі Наска в Перу. Нове дослідження дозволило значно прискорити пошук стародавніх малюнків, створених понад дві тисячі років тому.
Роботу провела міжнародна команда під керівництвом археолога Масато Сакаї з Університету Ямагата у співпраці з дослідниками з IBM Research. Вони застосували систему глибокого навчання для аналізу величезної території плато Наска.