Локальное распознавание
Гугл создал совокупность голосового управления смартфоном в настоящем времени, владеющую низким коэффициентом погрешности и наряду с этим не требующей наличия интернет-подключения. Более того, она подходит для устройств с маленьким количеством памяти, поскольку занимает всего 20,3 МБ.
Коэффициент погрешности
Совокупность была удачно опробована на «эталонном» смартфоне LG Nexus 5. Он владеет 2 ГБ оперативной памяти и 4-ядерным процессором с тактовой частотой 2,26 ГГц.
На протяжении тестирования совокупность показала коэффициент погрешности 13,5%. Это хуже, чем у облачных аналогов, но, однако, показатель достаточно неплохой, утверждают в Гугл.
Для сравнения, распознавание речи в Гугл Now происходит с погрешностью 8%, а у Apple Siri это значение равняется 5%. Обе эти разработки трудятся лишь при наличии подключения к интернету, поскольку обработка команд выполняется на сервере (другими словами являются облачными).
Гугл создал аналог Гугл Now и Apple Siri без подключения к интернету
Технологические приемы
Как поведали в Гугл, новая совокупность включает квантованную звуковую модель Long Short-Term Memory (LSTM) вкупе с разработкой Connectionist Temporal Classification (CTC). По словам разработчиков, им удалось сократить размер совокупности благодаря применению схемы сжатия на базе SVD и применению единой языковой модели для диктовки и голосовых команд, созданной с применением байесовской интерполяции. Наконец, для верного распознавания имен в языковую модель был интегрирован перечень контактов с мобильного устройства. Затем совокупность была научена при помощи 3 млн голосовых сотрудничеств неспециализированной длительностью более чем 2 тыс. часов.
В компании не уточнили, будет ли когда-нибудь подобная система в коммерческих продуктах.