Специалисты китайской лаборатории Baidu Research, принадлежащей крупнейшему поисковому гиганту Поднебесной, создали алгоритм ИИ Deep Voice, способный преобразовывать текст в речь. Подобные проекты, существовавшие до этого, сталкивались с проблемой скорости синтеза звука, поэтому для генерации голоса предшественникам Deep Vice требовалось от нескольких минут до пары часов, чтобы корректно и максимально натуралистично воспроизвести текст человеческим голосом. Новая разработка китайских учёных основана на нейронных сетях и способна преобразовывать текст в голос в реальном времени.
Deep Voice умеет имитировать тембр, интонацию голоса и акцент, делая их очень правдоподобными и почти неотличимыми от настоящих, при этом голос может быть мужским или женским. Разработчики уверены, что их технологию можно использовать в качестве цифровых помощников, применять для записи голосов в идеоиграх или же вовсе использовать для синхронного перевода фильмов по субтитрам.
Присоединяйтесь к ОК, чтобы подписаться на группу и комментировать публикации.
Нет комментариев