Искусственный интеллект wavenet от google deepmind сделает компьютерную речь более человечной

Компания Гугл уже давно занимается изучением ИИ в разных его проявлениях. Но ей, как и остальным игрокам рынка, не удалось сделать так, дабы компьютерная обращение была более живой и человечной. В случае если воспользоваться голосовым поиском либо озвучиванием слов в переводчике от Google, то слышно, что голос весьма роботизированный. Для решения данной неприятности Гугл DeepMind создала новый ИИ WaveNet, талантливый имитировать людскую обращение. Произношение всё ещё не совершенное, но оно на 50% лучше того, что существует на сегодня. Этот ИИ может кроме того создавать собственную музыку на базе изученных хороших произведений на фортепиано.

Смотрите кроме этого: ИИ оказывает помощь Гугл экономить электричество

Издание Bloomberg сказало, что Гугл применяет ИИ DeepMind для понижения электропотребления в собственных центрах обработки данных. Увы, правильных информации о том, так компании удалось сократить потребление энергии, на данный момент нет. Источники отмечают, что экономия образовывает пара процентов. Но, учитывая потребности Гугл в электричества (в 2014 году компания потребляла порядка 4,4 ГВт·ч энергии), кроме того незначительное понижение потребления разрешает компании сэкономить миллионы долларов.

С целью достижения более человечной речи WaveNet применяет обучение посредством нейронных сетей и фрагменты настоящих людских голосов. Помимо этого, совокупность подбирает фонетики и правила лингвистики для каждой отдельной фразы. Но что более принципиально важно — для синтеза таковой речи WaveNet за одну секунду обрабатывает 16 000 образцов звука, что и разрешает сделать компьютерный голос более человечным.

К сожалению, ожидать применения WaveNet в сервисах Гугл в скором будущем не следует, поскольку на обработку для того чтобы аудио нужно через чур много вычислительной мощности. Послушать примеры произношения WaveNet возможно в официальном блоге DeepMind.

Источник: androidauthority.com

Нейронные сети обучили в точности воспроизводить любой голос


Похожие статьи: