
Google випустила оновлення для свого чат-бота Gemini, яке додає підтримку Veo 2, моделі ШІ для перетворення тексту на відео. Це відповідь на платформу генерації відео Sora від OpenAI.
Модель вміє генерувати восьмисекундні відео з роздільною здатністю 720p і краще, порівняно з конкурентами, "розуміє фізику реального світу та нюанси людських рухів і міміки". Моментами від живих зйомок реально складно відрізнити, пише Android Authority.
Користувачі можуть обирати Veo 2 у випадаючому меню моделей як на веб-платформі, так і в мобільному застосунку. Наразі доступ надали тільки через підписку Google One AI Premium, яка коштує $20 на місяць.
Google заявляє, що існує місячний ліміт на кількість створюваних відео, хоча у компанії не уточнюють його, обіцяючи повідомляти користувачів про наближення до ліміту.

Альтернативний спосіб отримати доступ до Veo 2 – використовувати інструмент Whisk Animate, який дає змогу перетворювати зображення на короткі 8-секундні анімації. Як і Veo 2, ця функція доступна тільки для підписників Gemini Advanced через Google Labs.
Раніше цього місяця вийшла нова версія Midjourney для генерації зображень. За заявами розробників, це їхня "найрозумніша, найкрасивіша і найзв'язніша модель".
Оновлення Midjourney вийшло всього за тиждень після того, як у ChatGPT став доступний просунутий ШІ-редактор зображень. Він швидко став вірусним через картинки в стилі Ghibli, і зараз доступний для всіх користувачів, платних і безкоштовних.