Новый ИИ от Microsoft умеет синтезировать речь по трехсекундному образцу. Технологию не обнародуют: она слишком опасна
Microsoft представила новый искусственный интеллект под кодовым именем VALL-E, который умеет синтезировать текст в аудиофайл, произносимый заданным голосом. Для создания имитации звучания реально существующего голоса технологии требуется лишь трехсекундный образец.
В отличие от других подобных проектов, VALL-E требует для работы именно сочетание текстовых и аудиоданных. Получающиеся на выходе файлы звучат настолько близко к реальности, что Microsoft испугалась возможностей мошенников и решила не давать технологию общественности в руки — ни кода, ни возможности пощупать в открытом доступе нет. Зато на официальном сайте можно послушать сгенерированные VALL-E файлы и образцы звучаний, которые действительно звучат пугающе хорошо.
Прочувствуйте запашок. Новое устройство Aroma Shooter способно передавать запахи из игр и фильмов Подробнее