Карл Маркс вибігає з бутика за авторством нейромережі / Фото - ChatGPT

OpenAI представила свій новий генератор зображень для ChatGPT, який компанія називає "найбільш просунутим".

Головна відмінність нового генератора - поліпшена точність і контроль над деталями. Дослідник Габріель Го розповів The Verge, що система набагато краще справляється з біндингом, коректним розташуванням об'єктів і їхніх характеристик. Раніше нейромережі часто плутали кольори, форми або забували про деталі, але тепер ШІ може точно передавати властивості навіть за складних запитів із 15-20 об'єктами.

Важливе поліпшення - якісне відображення тексту на зображеннях. Раніше генератори часто ламали слова і символи, перетворюючи написи на хаотичний набір букв. В OpenAI визнали, що домогтися чіткості тексту виявилося складніше, ніж очікувалося, але після місяців роботи вони довели результат до стабільної якості.

Відео дня

У демонстрації OpenAI показала, як нейромережа може створювати наукові схеми, комікси з послідовними сценами і діалогами, афіші та плакати з точними написами, а також зображення з прозорим фоном, наприклад, для стікерів і логотипів. Також в одному з прикладів нейромережа послідовно зробила з кота користувача головного героя комп'ютерної гри.

Галерея

Функція доступна користувачам усіх рівнів підписки, включно з безкоштовним. Однак ліміти на генерацію зображень поки залишаються невідомими.

Раніше генеральний директор OpenAI Сем Альтман розповів, що варто вивчати студентам замість програмування.

Вас також можуть зацікавити новини: