Компанія Stability AI, яка розробила одну з найпопулярніших у світі нейромереж для генерації зображень за текстовим запитом – Stable Diffusion – запустила новий сервіс, який може перетворювати текст в пісні або фонове аудіо. Він називається Stable Audio.
Сервіс використовує останню модель Stable Diffusion. Але її вчили не на картинках, а на великому масиві аудіофайлів – музиці, звукових ефектах і звучанні окремих музичних інструментів. Приклади роботи нейромережі є на сайті Stability AI.
Stable Audio матиме три цінові рівні:
- Безкоштовний: до 20 треків на місяць тривалістю до 45 секунд;
- Професійний ($11,99 на місяць): до 500 треків на місяць тривалістю до 90 секунд;
- Корпоративний: умови тарифу обговорюються в індивідуальному порядку.
На відміну від більшості схожих моделей, які перетворюють текст в аудіо, Stable Audio здатна генерувати музичні треки різної тривалості, без фіксованої довжини. Таким чином, у творців є більше контролю над тим, наскільки довгою буде композиція.
Для реєстрації в веб-сервісі Stable Audio знадобиться тільки адреса електронної пошти. Щоб перетворити текст в пісні або фонове аудіо, достатньо ввести текстовий опис бажаного результату, а також вказати тривалість треку.
Нещодавно компанія HeyGen презентувала нейромережу, яка може автоматично переводити слова людей на відео на інші мови і відповідно підлаштовувати їх міміку. Нейромережа вже завірусилася серед українських користувачів, які почали перекладати популярні українські відеомеми на різні мови.
А до цього серед українських користувачів "завірусилася" нейромережа, яка робить з вас героя аніме. Попри те, що весь інтерфейс на китайському, сервіс максимально простий у використанні.