Розробники Stable Diffusion представили модель для написання музики / фото Stability AI

Компанія Stability AI, яка розробила одну з найпопулярніших у світі нейромереж для генерації зображень за текстовим запитом  – Stable Diffusion – запустила новий сервіс, який може перетворювати текст в пісні або фонове аудіо. Він називається Stable Audio.

Сервіс використовує останню модель Stable Diffusion. Але її вчили не на картинках, а на великому масиві аудіофайлів – музиці, звукових ефектах і звучанні окремих музичних інструментів. Приклади роботи нейромережі є на сайті Stability AI.

Stable Audio матиме три цінові рівні:

  • Безкоштовний: до 20 треків на місяць тривалістю до 45 секунд;
  • Професійний ($11,99 на місяць): до 500 треків на місяць тривалістю до 90 секунд;
  • Корпоративний: умови тарифу обговорюються в індивідуальному порядку.

На відміну від більшості схожих моделей, які перетворюють текст в аудіо, Stable Audio здатна генерувати музичні треки різної тривалості, без фіксованої довжини. Таким чином, у творців є більше контролю над тим, наскільки довгою буде композиція.

Відео дня

Для реєстрації в веб-сервісі Stable Audio знадобиться тільки адреса електронної пошти. Щоб перетворити текст в пісні або фонове аудіо, достатньо ввести текстовий опис бажаного результату, а також вказати тривалість треку.  

Нещодавно компанія HeyGen презентувала нейромережу, яка може автоматично переводити слова людей на відео на інші мови і відповідно підлаштовувати їх міміку. Нейромережа вже завірусилася серед українських користувачів, які почали перекладати популярні українські відеомеми на різні мови.

А до цього серед українських користувачів "завірусилася" нейромережа, яка робить з вас героя аніме. Попри те, що весь інтерфейс на китайському, сервіс максимально простий у використанні.

Вас також можуть зацікавити новини: