Новый ИИ от Microsoft умеет синтезировать речь по трехсекундному образцу. Технологию не обнародуют: она слишком опасна

0 5

Microsoft представила новый искусственный интеллект под кодовым именем VALL-E, который умеет синтезировать текст в аудиофайл, произносимый заданным голосом. Для создания имитации звучания реально существующего голоса технологии требуется лишь трехсекундный образец.

В отличие от других подобных проектов, VALL-E требует для работы именно сочетание текстовых и аудиоданных. Получающиеся на выходе файлы звучат настолько близко к реальности, что Microsoft испугалась возможностей мошенников и решила не давать технологию общественности в руки  — ни кода, ни возможности пощупать в открытом доступе нет. Зато на официальном сайте можно послушать сгенерированные VALL-E файлы и образцы звучаний, которые действительно звучат пугающе хорошо.


                Новый ИИ от Microsoft умеет синтезировать речь по трехсекундному образцу. Технологию не обнародуют: она слишком опасна

Прочувствуйте запашок. Новое устройство Aroma Shooter способно передавать запахи из игр и фильмов Подробнее

Источник

Оставьте ответ

Ваш электронный адрес не будет опубликован.