Home / Компания Бекмамбетова начала «клонировать» голоса знаменитостей

Компания Бекмамбетова начала «клонировать» голоса знаменитостей

Тимур Бекмамбетов

(Фото: Евгений Биятов / РИА Новости)

Screenlife Technologies, компания продюсера Тимура Бекмамбетова, и «Стафори» (разработчик HR-сервиса на основе искусственного интеллекта «Робот Вера», в которую инвестирует ФРИИ), создают совместное предприятие для развития проекта Vera Voice. Об этом говорится в поступившем в РБК сообщении компаний.

Проект Vera Voice позволит воспроизводить голоса знаменитостей на русском языке. Он основан на технологии нейросети, которая обучается копировать речь на примере оригинала. Стоимость разработки основатели не назвали.

В России уже реализовывались подобные проекты. В частности, инвестором в подобные технологии является Сбербанк: учрежденная банком в 2013 году компания АБК в январе представила короткий ролик с синтезированным голосом актера Иннокентия Смоктуновского. На нем голос актера произносит: «Прослушав всего около 18 часов записи великого артиста, нейронная сеть теперь способна говорить его голосом».

После этого Сбербанк представил технологию на Российском инвестиционном форуме в Сочи. Зампред правления банка Станислав Кузнецов отметил, что подобные проекты могут использоваться и с незаконными целями. В качестве примера он включил запись, на которой некий вымышленный губернатор голосом Смоктуновского просит 5 млрд руб. на постройку моста.

Открытый алгоритм для синтеза человеческой речи с помощью нейросети под названием WaveNet еще в 2016 году представила принадлежащая Google компания DeepMind. На Западе подобные технологии «клонирования» голоса уже активно применяются: в июле 2019 года инженеры Facebook представили синтезатор речи, который, в частности, сгенерировал голос основателя Microsoft Билла Гейтса. В сентябре Amazon объявил, что голосовая колонка компании — Alexa — сможет разговаривать голосами знаменитостей. Первым стал актер Самуэль Ли Джексон. По оценке консалтинговой компании Markets&Markets, к 2023 году рынок клонирования голоса достигнет $1,73 млрд.

Реклама на РБК www.adv.rbc.ru

«Как и многие стартапы на русском языке — это клон уже существующей идеи. Есть разделы проблем машинного обучения, связанные с языком, для которых можно делать продукт на локальном рынке по образу и подобию англоязычных. Главное собрать достаточно большую выборку данных на нужном языке. В РФ этим занимаются такие гиганты как Яндекс и Сбербанк. Но для узких задач есть место и мелким игрокам», — заявил РБК российский специалист по data science Павел Плесков.

Индустрия развлечений может быть главным применением для такой технологии, добавил он. «Мошенничество — это самая главная угроза. «Синтезировать голос можно уже по семплу длиной в три секунды. А при текущей популярности робоколов (robocall — автоматический звонок. — РБК) «поделиться» со злоумышленниками таким семплом можно, просто сказав: «Алло! По какому вопросу звоните? С кем я разговариваю?» Дальше мошенники смогут, например, пройти авторизацию в банке по голосу», — пояснил он.

Генерацию голоса из текста старой задачей назвал и специалист компании ESR Labs AG из Германии Дмитрий Шефтелович. «Что касается «клонирования» голоса, то, как и во всех задачах машинного обучения, количество данных играет определяющую роль: для профессионального генерирования речи не так давно требовалось несколько часов записей определенной формы. На данный момент существуют реализации, которым хватает только нескольких секунд необязательно профессионально записанной речи, чтобы «научиться» голосу», — считает специалист.

«Синтез голосов знаменитостей — часть всеобщего интереса к «эмоциональному искусственному интеллекту», когда компании-разработчики пытаются добиться от роботов более естественного звучания, чтобы они не вызывали отторжения у клиентов и пользователей», — заявил РБК гендиректор группы компаний «Центр речевых технологий» Дмитрий Дырмовский. Он отметил, что у данной технологии может быть достаточно широкое применение — от озвучивания книг до маркетинговых компаний с голосами знаменитостей. В то же время синтез голоса может использоваться в ложной рекламе или для фальсификации новостей, отметил Дырмовский.

Подпишитесь на рассылку РБК.
Рассказываем о главных событиях и объясняем, что они значат.

Авторы:
Александра Посыпкина, Артём Губенко, Роман Кирьянов

Источник

About admin

сосновоборск новости, сосновоборск портал, портал красноярск, новости, видео, фото, городской портал сосновоборск сайт красноярский край работа портал недвижимость сосновоборск красноярск авто квартира сосновоборск сосновоборск красноярский сосновоборск красноярский край работа сосновоборск красноярский край недвижимость сосновоборск красноярский край объявления сосновоборск красноярский край квартира сосновоборск красноярский край новости сосновоборск красноярский край видео сосновоборск красноярский край сосновоборск наши новости

Check Also

Крупнейший франчайзи SPAR в России закроет часть магазинов

Фото: Почуев Михаил / ТАСС За последние два месяца на портале «Федресурс» появилось семь заявлений …