Москва +7(499)
11-30-878
меню
мы в соцсетях
Подпишитесь на новые статьи

Перспективы развития голосового поиска

4.7 из 5 на основе 3 оценок
16.02.2018 Написать комментарий

Каждое исследование актуальных тенденций, выпущенное в 2018 году, упоминает голосовой поиск в качестве важного тренда, заслуживающего пристальное внимание. После упоминания генеральным директором Google Сундаром Пичаи того факта, что 20% запросов, совершенных посредством мобильных устройств – голосовые, мир действительно обратил внимание.

Сегодня мало что известно об указанном тренде и его возможном влиянии на повседневную жизнь пользователей. Представители корпорации обещали запустить аналитику в консоль поиска. Новая функция позволит веб-мастерам анализировать, как их сайт обрабатывает голосовые запросы.

Всем желающим получить подробную информацию о последней тенденции, перспективах ее дальнейшего развития рекомендуется отслеживать деятельность большой четверки (Amazon, Google, Apple, Facebook), изучать прогресс, которого удалось достичь казанным гигантам.

Текущее положение вещей

Контекст и намерение пользователя

Гугл запустил новую функцию Voice Match в октябре прошлого года. Опция позволяет поисковой системе распознавать отдельные голоса и предоставлять персонализированную информацию: время, проведенное в дороге, краткую сводку за день, даже любимую музыку. Беспроводной динамик Google Home поддерживает Voice Match для 6 пользователей.

Alexa также позволяет создавать собственный речевой профиль. Бренд предоставляет возможность внедрять персонализированные функциональные характеристики в новые навыки. Речевой профиль можно удалить в любой момент через приложение, а профили неактивные больше трех лет удаляются автоматически. При отключении устройства, информация о профилях автоматически удаляется из облака.

Apple также учит Siri распознавать голоса. Для разблокировки девайса компания применяет комбинацию специальной фразы и аутентификации уникального голоса, чтобы убедиться, что Siri отвечает владельцу смартфона.

Языки

В прошлом году инструмент распознавания речи Google Speech Recognition API добавил поддержку еще 30 языков, доведя их общее количество до 119. Впрочем, Dialogflow – сервис, позволяющий создавать чат-ботов в настоящее время поддерживает только 15 языков без учета диалектов.

Для внедрения новых вариантов, команда начинает собирать образцы речи у носителей на предмет выявления наиболее распространенных фраз. С целью улучшения точности  поисковых запросов модель обрабатывается с помощью машинного обучения.

Apple использует аналогичную модель, но транскрибирует ударения и диалекты вручную. Указанный подход позволяет системе понять точную интерпретацию устного текста. Выделение ряда звуков помогает разработать акустическую модель, пытающуюся предугадать последовательность слов.

Apple Siri может говорить на 21 языке, локализованном для 36 стран. Microsoft Cortana, напротив, поддерживает восемь языков, предназначенные для 13 стран. Alexa от Amazon в настоящее время поддерживает японский и немецкий помимо стандартного английского.

Чтобы сделать инновационные технологии умнее, нужно просто открыть людям, способным их улучшить.

Руководство по контролю качества

С целью повышения качества результатов голосового поиска, Гугл набрал команду специалистов, оценивающих запросы в соответствии с определенными параметрами. К ним относятся: информационная удовлетворенность, длина, формулировка, озвучка. Рассмотрим подробнее каждый критерий:

  • Информационная удовлетворенность: ответ должен соответствовать информационным потребностям пользователя.
  • Длина: ответ должен иметь соответствующую длину и соответствовать сложности заданного вопроса.
  • Формулировка: ответ должен отличаться  грамматической корректностью и должен быть сформулирован так, как на него отвечает носитель.
  • Озвучка: интонация должна звучать естественно.  Каждое произносимое слово должно иметь отчетливое произношение.

Превращение разговора в действие

Alexa Skills Kit позволяет использовать устройства умного дома, размещать свежий контент, вызывать такси в режиме hands-free посредством голосовых команд. Alexa Voice Design Guide помогает создавать навыки, проектировать модели взаимодействия, понимать намерение пользователя.

Аналогичным образом, Actions на Гугл позволяют разрабатывать и интегрировать интерактивный пользовательский интерфейс в мобильные приложения, веб-сайт, устройства.  Dialogflow используется при разработке приложений для Google Assistant.

Возможные проблемы

Необъективность алгоритмов

Согласно данным отчета, алгоритм, используемый для Google Translate, обнаруживает гендерные предрассудки при переводе местоимений. Алгоритм предпочитает местоимения мужского рода  в ситуациях, где современный переводчик-человек  сделала бы политически корректный выбор.

Язык

Google использует сети Нейронного Машинного Перевода, сокращенно НМП для повышения гибкости и точности результатов, выдаваемых сервисом перевода. Для обучения сети НМП использует исходные предложения.

Идентификация параллельного контента в Интернете представляет собой проблему, особенно если текст написан на местном диалекте, что существенно усложняет для обучающих машин задачу по переводу содержимого. Кроме того, перевод должен решать проблемы более мелкого характера: уметь распознавать нюансы и оттенки значений, понимаемых безошибочно лишь человеком.

Реклама

Если единственный ответ на голосовой запрос - платный, возникает вопрос: стоит ли ему доверять? Пользователи не смогут  игнорировать звуковые  объявления так же, как они игнорируют рекламу на экране. Более того, зачем аудитории слушать рекламу для получения ответов на возникшие вопросы? Goolge долгое время не предоставлял данные о количестве таких запросов во избежание вопросов от журналистов относительно способов монетизации указанной технологии.

Перспективы развития

Сегодня наблюдается стремительное развитие технологий голосового поиска. Специалисты предсказывают, что в будущем он будет играть очень важную роль. Наглядным тому доказательством служит появление новых устройств, управляемых голосом, улучшенное распознавание языков и диалектов. Главная задача оптимизаторов – отслеживать последние тенденции, приспосабливаться к меняющимся условиям осуществления поисковых запросов.

мы в соцсетях
Подпишитесь на новые статьи