Новый ИИ от Microsoft умеет синтезировать речь по трехсекундному образцу. Технологию не обнародуют: она слишком опасна

Автор admin Опубликовано Янв 10, 2023

Microsoft представила новый искусственный интеллект под кодовым именем VALL-E, который умеет синтезировать текст в аудиофайл, произносимый заданным голосом. Для создания имитации звучания реально существующего голоса технологии требуется лишь трехсекундный образец.

Сейчас читают:

Телеграм-канал взломщицы игр Empress собрал более 130 тысяч…

Замглавы Минцифры Украины призвал запретить продажи Atomic…

В отличие от других подобных проектов, VALL-E требует для работы именно сочетание текстовых и аудиоданных. Получающиеся на выходе файлы звучат настолько близко к реальности, что Microsoft испугалась возможностей мошенников и решила не давать технологию общественности в руки — ни кода, ни возможности пощупать в открытом доступе нет. Зато на официальном сайте можно послушать сгенерированные VALL-E файлы и образцы звучаний, которые действительно звучат пугающе хорошо.

Прочувствуйте запашок. Новое устройство Aroma Shooter способно передавать запахи из игр и фильмов Подробнее

Источник