AlphaStar віддавав накази трьом загонам, що знаходяться в різних зонах, одночасно / deepmind.com

Штучний інтелект AlphaStar, створений компанією DeepMind (належить холдингу Alphabet Inc.), здолав двох професійних гравців у стратегію StarCraft II, що відбувається в реальному часі.

Про це йдеться на сайті компанії, передає Naked Science.

Матчі алгоритму з двома професійними гравцями - Даріо Вуншем (Dario «TLO» Wünsch) та Гжегожем Комінчем (Grzegorz «MaNa» Komincz) - проходили ще в грудні, але на цьому тижні, 24 січня, відбувся останній поєдинок, перед яким властивості програми змінили. У результаті перемога вперше дісталася людині.

Раніше алгоритми DeepMind здолали найсильнішого гравця в го і набагато краще передбачили форму білка, порівняно з професійними біологами. Проте в кожному з цих випадків для штучного інтелекту була відкрита вся доступна інформація. Зі стратегією в реальному часі, такою як StarCraft II, все інакше: це гра із закритою інформацією. Машина не знає, що відбувається за туманом війни, і не може передбачити дії гравця, тому їй доводиться адаптуватися до його маневрів миттєво.

Читайте такожІнженери Google навчили штучний інтелект грати в гру Quake III (відео)

Розробники програми використовували для її навчання ігри реальних людей, які їм надала компанія Blizzard. Перейнявши поведінкові патерни гравців, вона навчилася перемагати вбудований в гру штучний інтелект найвищої складності в 95 відсотках випадків. Потім її агенти стали змагатися один із одним в турнірі на вибивання. Він проходив у прискореному режимі, тому кожен з них отримав приблизно 200 років.

Вибравши найуспішнішого агента, автори виставили його проти TLO і MaNa. Спершу він виграв п'ять з п'яти матчів у TLO, а потім інша версія нейромережі стільки ж разів здолала MaNa. При цьому алгоритм здійснював менше дій в хвилину, ніж його противники. Ймовірно, це пояснюється невеликою перевагою, яку він все-таки мав. На відміну від людини, він бачив не частину відомої карти (той же екран), а всю її цілком, тому йому не доводилося переключатися між різними областями. Більш того, глядачі помітили, що він віддавав накази трьом загонам, що знаходяться в різних зонах, одночасно, на що точно не здатна людина.

Відео: DeepMind

В останньому матчі розробники пішли на поступки й відключили цю здатність штучного інтелекту - цього разу виграв MaNa. Однак автори помітили, що версія алгоритму, якій треба переміщати камеру, навчалася в турнірі всього сім днів, що становить половину від попереднього періоду тренувань. Сам MaNa похвалив дії програми: "Грай я з реальною людиною, він би не зміг так філігранно управляти своїми сталкерами (юніт однієї з рас. - прим. ред.)".

Розробники сказали, що такі ігри, як StarCraft II, служать лише тренувальним майданчиком для штучного інтелекту. Надалі він візьметься за інші цілі. Наприклад, раніше в DeepMind заявили, що їх алгоритм буде діагностувати хвороби очей.

Довідка. StarCraft II - комп'ютерна гра в жанрі стратегії в реальному часі. Сюжетно дія гри відбувається на кількох планетах, де розгортається конфлікт між трьома расами - людьми, зергами та протоссами. Гра є дисципліною у багатьох кіберспортивних лігах світу. Гра увійшла в сотню кращих ігор всіх часів (Top 100 Games of All Time) за версією IGN.