Система голосового управления

Голосовой поиск Google

Голосовой поиск для десктопов

Чтобы использовать голосовой поиск Гугл на десктопе, достаточно скачать браузер Google Chrome с официальной страницы. На главной странице браузера в поисковой строке будет значок голосового поиска. По команде «Окей Google» голосовой поиск перестал активироваться с 2015 года. Поэтому нужно просто кликнуть по значку и задать поисковый запрос.


Голосовой поиск на мобильных устройствах

Голосовой поиск на мобильных устройствах доступен через официальное приложение Google и в браузере Google Chrome.

На устройствах с операционной системой Android приложение Google установлено по умолчанию и голосовой поиск доступен на одном из экранов – в виде строки поиска со значком микрофона. Голосовой поиск активируется кликом по значку или командой «Окей Google».

Чтобы пользоваться голосовым поиском на устройствах с операционной системой iOS, нужно скачать приложение Google из AppStore. После нужно открыть приложение, по команде «Ок Гугл» голосовой поиск активируется. Также можно просто нажать на значок микрофона.

Как настроить голосовой поиск и что делать, если голосовой поиск не работает? Нужно зайти в Настройки приложения Google, кликнув на меню в левом верхнем углу.

В Настройках находим Голосовой поиск:

Указываем все необходимые настройки, прежде всего это Распознавание «Окей Google»:

Если возникают какие-либо вопросы по работе с голосовым поиском на мобильных устройствах в Настройках голосового поиска есть справка с инструкциями по решению популярных проблем, например, что делать, если команда «Окей Google» не работает:

Голосовой поиск также доступен в мобильной версии браузера Google Chrome.

Видео о том, как работает голосовой поиск Гугл https://www.youtube.com/watch?v=mx2z-GYoMYw&showinfo=0&rel=0

История разработки

Источник идеи — статья «Используем Google Voice Search в своем приложении .NET»[] 2011 года.

В 2012 году был разработан прототип, который делал автоматическую запись голоса с микрофона и вставлял текст через буфер обмена в любое текстовое поле.

В 2013 году прототип был представлен публике[]. Помимо диктовки текста он обладал простейшим функционалом голосовых команд.

В начале 2014 прототип стал частью BrutalPlayer и приобрел пользовательский интерфейс[].

К концу 2014 продукт стал самостоятельным и получил название Laitis[].

В 2015 вышла стабильная версия 2.0 с новым функционал управления веб-сайтами[].

В 2016 вышла версия 3.0, в которой значительно ускорилось распознавание и был добавлен функционал общения с голосовым ботом.

В 2017 году вышла 4 версия Laitis, в которой управление веб-сайтами работает через расширение для браузера. А так-же добавилось несколько новых типов действий и сервисов распознавания и произношения.


Версия 5.0 вышла в середине 2017 года. В ней добавлен функционал поиска элемента на экране по его названию и наведение на него курсора мышки. Это значительно расширило функционал программы и избавило ее от большого кол-во лишних голосовых команд.

В 2018 вышла версия 6. Программа стала поддерживать три языка: Русский, Украинский, Английский. Были значительно улучшены алгоритмы записи звука и распознавания. Пост с демонстрацией диктовки текста стал самым сохраняемым за неделю на сайте pikabu[].

Как настроить голосовое управление на смартфоне

Нужно рассматривать каждую связку отдельно:

IOS-Siri. Голосовой ассистент уже предустановлен в систему. Для настройки нужно перейти в Настройки -> «Siri и Поиск» и включить опцию «Слушать «Привет, Siri»» (может отличаться на разных версиях ОС). Чтобы помощник «говорил», нужно перейти в Настройки -> «Siri и Поиск» и выставить параметр Аудиоотзыв (возможные варианты: всегда, только при подключенной гарнитуре). Теперь для запуска необходимо произнести команду и запрос.

Андроид-Google Ассистент. Помощник должен быть уже предустановлен. Нужно перейти в Настройки -> «Google» -> «Поиск, Ассистент и голосовое управление» (на разных прошивках может сильно отличаться расположение этого пункта). Перейти в меню «Голосовой ввод» -> «Voice Match» и активировать «Доступ с помощью Voice Match». Система попросит вас произнести зарезервированную фразу «Ок Google», чтобы выучить ваш голос. Теперь можно запускать сервис как кнопкой «домой», так и с помощью голоса. Там же есть множество настроек, связанных с политикой конфиденциальности.

IOS- Google Ассистент. Нужно установить соответствующее приложение из магазина (распространяется бесплатно). Для общения необходимо открыть это приложение, сказать «OK, Google» или нажать значок микрофона. Для запуска голосом с рабочего стола можно применить чит – сказать «Привет Siri, открой Google Ассистент».

Андроид-Алиса. Из магазина приложений скачиваем «Яндекс – с Алисой» (распространяется бесплатно). Если приложение запущено, можно сказать «слушай Алиса» или нажать кнопку запуска в правом нижнем углу. На вопрос: « Можно ли тебя вызвать с рабочего стола?» она отвечает «Пока никак, к сожалению». После ответа Алиса ожидает вашего обращения, и чтобы закончить диалог, нужно ей об этом сказать. Другой способ получить этого помощника – установить Яндекс.Лончер. Тогда она будет слушать вас постоянно

Алиса старается обращать внимание на предыдущие высказывания – строить осмысленный диалог. Авторы наделили её характером и чувством юмора

Также с ней можно поиграть в «города», «крокодил», «угадай песню». Детям она может рассказать сказку или показать мультфильмы.

IOS-Алиса. Для работы необходимо установить приложение «Яндекс» (распространяется бесплатно). После запуска можно вызывать приложение фразой «слушай, Алиса». В остальном – работа идентична предыдущему варианту.

Кому можно отдать пальму первенства? Максимально интегрирован в систему будет сервис компании-производителя – для Google это Assistent, для Apple – Siri. Для iphone, ipad и ipod идеальным решением будет именно Siri. Для Андроид не всё так однозначно. Их помощник очень мощный и постоянно развивается, но нацелен больше на англоязычную аудиторию. Функция просмотра предыдущих сообщений при ответе пока работает только на этом языке. Алиса хорошо интегрирована с сервисами Яндекса. Она будет очень удобна, если вы пользуетесь ими. Попробуйте сервисы, доступные на вашем устройстве, и решите, что больше подходит именно вам.

Управляем iPhone и iPad через Siri

В современных смартфонах iPhone и планшетах iPad компании Apple, работающих под управлением операционной системы iOS, имеется собственная функция распознавания речи, встроенная в так называемый голосовой помощник Siri. Текущая версия Siri предполагает обязательное наличие активного подключения к интернету, в то время как уже в следующей отдельные функции голосового управления будут доступны и без такого подключения.

Чтобы запустить Siri, нужно нажать и удерживать в течение пары секунд кнопку Home на iPhone или iPad (предварительно эту службу нужно включить в настройках). К сожалению, Siri до сих пор не поддерживает русский язык, зато качество распознавания английской речи, даже с самыми чудовищными акцентами, можно оценить как превосходное.

Можно задавать Siri самые различные вопросы, включая банальный «Который час». Можно попросить её что-то поискать в Google, сказав, к примеру: «Google Mr. Putin», — после чего откроется стандартная страница результатов поиска Google. Можно найти нужный адрес в адресной книге, запланировать какое-то мероприятие, продиктовать электронное письмо или текстовое сообщение. Самый полный на сегодня список распознаваемых команд на английском языке можно найти, например, здесь.

Существуют неофициальные версии Siri с поддержкой русского языка и русскоязычных команд — например, SiriPort.ru, однако число распознаваемых команд по сравнению с англоязычной версией относительно невелико. Увы, пока не известно, когда Apple реализует официальную поддержку русского языка в Siri: Россия традиционно не входит в число приоритетных рынков для этой компании.

Алиса Яндекс (десктопная версия)

Алиса – голосовой помощник, устанавливаемый на ПК (Windows 7-10), Android и IOS. Алиса может показать прогноз погоды, найти данные об общественных местах, найти музыку, проводить конвертацию валют, решает несложные математические вычисления и может поддержать разговор.  Программа очень молодая и все время совершенствуется. «Алиса» позволяет вести диалог в текстовом виде и голосовом. Голосовой помощник Алиса способен понимать смысл ваших фраз: «Где здесь можно пошопиться?», она понимает: «Где здесь магазины?».

Поисковая строка Яндекс или другое название – Яндекс.Строка находится в панели задач операционной системы Windows. Поисковая строка Яндекс умеет находить на просторах Интернета информацию, которую пользователь вводить с помощью голоса или текста. Пользователь может задать команду открыть любую папку и документ, расположенные на компьютере. Программа открывается на портативном компьютере с помощью нажатия кнопки Строки или же горячих клавиш. По сути это частный случай Алисы для ПК. Для экономии места на панели задач 8 см кнопку заменяют на иконку с микрофоном. Подробнее способах отображения помощника на ПК в статье Настройки Алисы для Windows.

Tasker

Если после всего прочитанного тебе все равно не хватает команд для воплощения своих фантазий, то, имея немного времени, можно настроить Google Now на выполнение практически любых команд. Для этого нам понадобятся прежде всего Tasker и плагин AutoVoice.

Вариант 1. Присоединись к сообществу «Xakep.ru», чтобы читать все материалы на сайте

Членство в сообществе в течение указанного срока откроет тебе доступ ко ВСЕМ материалам «Хакера», увеличит личную накопительную скидку и позволит накапливать профессиональный рейтинг Xakep Score! Подробнее

Вариант 2. Открой один материал

Заинтересовала статья, но нет возможности стать членом клуба «Xakep.ru»? Тогда этот вариант для тебя! Обрати внимание: этот способ подходит только для статей, опубликованных более двух месяцев назад.

Я уже участник «Xakep.ru»

Как работает функция сохранения аудиозаписей

Как сохраняются аудиозаписи

Google записывает ваш голос и другие звуки, включая несколько секунд перед активацией голосового управления, когда вы:

  • касаетесь значка микрофона;
  • нажимаете специальную кнопку на гарнитуре;
  • произносите «Окей, Google» или другую команду активации.

Важно! Иногда аудио может сохраняться при ошибочном обнаружении активации, например если прозвучит фраза, похожая на «Окей, Google». Мы стараемся улучшать свои системы, чтобы такие ситуации возникали как можно реже

Когда функция сохранения аудиозаписей включена

Записи будут сохраняться в аккаунте Google, только когда:

  • установлен флажок «Сохранять аудиозаписи»;
  • вы вошли в аккаунт Google;
  • история приложений и веб-поиска включена;
  • вы взаимодействуете с Google Поиском, Ассистентом или Картами.

Если аудиозапись будет создана в офлайн-режиме, она может сохраниться в вашем аккаунте при следующем подключении к Интернету.

Как сохранение аудиозаписей улучшает голосовое управление

Аудиозаписи используются, чтобы:

  • Разрабатывать и улучшать технологии распознавания аудио, а также сервисы, в которых они используются (такие как Google Ассистент).
  • Улучшать распознавание вашего голоса со временем. Например, устройства, на которых включена функция Voice Match, могут точнее распознавать фразу «Окей, Google».

Как проверка аудиозаписей помогает улучшить наши технологии

Чтобы улучшить распознавание речи сервисами Google, квалифицированные специалисты анализируют небольшой процент автоматически отбираемых аудиофрагментов.

Чтобы проанализировать и лучше интерпретировать образец аудио, эти специалисты прослушивают его, преобразовывают в текст и отмечают, в каких случаях слова были распознаны правильно. Например, образец может включать аудиозапись слов, произнесенных в шумной обстановке или на определенном языке.

Мы предпринимаем меры, чтобы защитить вашу конфиденциальность во время такого анализа. Например, аудиозаписи, которые получают специалисты, не связаны с вашим аккаунтом.

Speaker

Голосовое управление компьютером с Windows 10 или 7 в программе Speaker, по сравнению с Typle предоставляет пользователю больше возможностей. Среди них:

  • создание снимков состояния экрана;
  • переключение раскладки клавиатуры;
  • завершение работы Windows 7;
  • запуск приложения;
  • открытие файла.

Процесс считывания и распознавания поступающей на микрофон информации запускается после нажатия на заданную клавишу (лучше выбирайте кнопку, наименее редко используемую вами во избежание ложных срабатываний программы). На обработку, распознание речи и выполнение команды уходит достаточно много времени – 5 и более секунд, чем придется заплатить за дешевизну. Ключевые слова задаются текстом, а не словами, потому распознанная речь сравнивается уже с введенным текстом, что делается далеко не идеально. Управление проигрывателем в приложении отсутствует.

Встроенные утилиты

Голосовое управление компьютером Windows 8 осуществляется с помощью встроенной утилиты Windows Speech Recognition. К сожалению, в настоящий момент управление компьютером на русском языке невозможно. Компания Microsoft, во всей видимости, старается ориентироваться на наиболее распространённые языки, однако не исключено, что в скором времени будет выпущена поддержка и русского языка.

Если же вы всё-таки хотите попробовать управлять своим железным товарищем с помощью английского языка, следуйте следующей инструкции.

  1. Заходите в панель управления в подпункт «Язык». Вам необходимо установить язык системы — английский. Если он у вас отсутствует, то вам потребуется загрузить соответствующий языковой пакет.
  2. После загрузки и установки языка переходим в начальный экран с «плиткой».
  3. Вводим в поиск Windows Speech Recognition и нажимаем Enter. Так запускается программа распознавания голоса.
  4. При первом запуске вам будет предложено настроить микрофон. Выберите вашу разновидность и произнесите пару слов.
  5. Затем вам будет предложен 20-минутный обучающий курс. Он проводится на английском, поэтому, если вы не понимаете язык, можете смело его пропускать. Интерфейс у программы абсолютно понятный, поэтому разобраться с ним сможет даже ребёнок.
  6. Чтобы включить голосовое управление компьютером, вам будет необходимо произнести ключевую фразу «Start listening». Это означает — «начать прослушивание». Теперь можете запускать необходимую вам программу и начинать надиктовывать текст.

Вообще, возможности этой утилиты неисчерпаемы. Кроме использования базовых команд, вы также можете создавать свои.

Коллекция сторонних программ

Помимо встроенного инструмента распознавания речи и голосового помощника Кортана, некоторые пользователи могут обратиться к сторонней альтернативе. Поскольку это категория программ находится в постоянном развитии, на рынке существуют различные продукты, совместимые с Windows 10. Единственный вопрос — это ваши потребности и пожелания.

Некоторые из программ, такие как:

  • Typle отличная программа для управления голосом на компьютере, простой русскоязычный интерфейс;
  • Dragon от производителя Nuance, специализируются на быстрой диктовке и в целом на преобразовании речи в текст;
  • Voice Attack, предназначены для голосового управления игровым процессом (да, вы можете перезагрузить оружие в Call of Duty с помощью голосовой команды);
  • еще одна неплохая утилита — VoxCommando. Чаще всего используется в мультимедийных программах, таких как Kodi или iTunes, но также может быть полезной при автоматизации домашних устройств.

Голосовое управление компьютера с помощью программы Typle

  1. Скачайте программу и установите на компьютер, следуя инструкции установщика.

  2. Интерфейс программы простой и понятный. При приветствии в окне программы есть подсказки для пользователя. Для начала нажмите кнопку «Добавить».

  3. В открывшемся окне введите в поле свое имя, далее введите команду, затем нажмите на кнопку записи и произнесите команду голосом. Нажмите кнопку «Добавить».

  4. Нажмите кнопку «Добавить».

  5. Отметьте галочкой необходимый пункт. Выберите программу, нажмите красную кнопку и произнесите эту команду вслух. Затем нажмите «Добавить».

  6. Вы увидите созданную команду, для проверки нажмите «Начать говорить» и произнесите эту команду. Если все работает таким же образом добавляете остальные команды.

Попробуйте TalkTyper

Это онлайн-приложение, которое позволяет диктовать текст, а затем предлагает несколько базовых вариантов того, что с ним делать. Любителям минимализма оно точно понравится.

Интерфейс онлайн-приложения TalkTyper

TalkTyper использует алгоритм голосовой почты Google. Конечно, для его использования также требуется браузер Chrome. Для использования приложения необходимо:

Вы можете скопировать начитанное в буфер обмена, отправить по электронной почте, напечатать, твитнуть и перевести на другой язык. Чтобы перевести текст просто нажмите кнопку, и выберите язык перевода. TalkTyper автоматически откроет в браузере новую вкладку с текстом, вставленным в переводчик Google.

Обратите внимание на Tazti


Tazti выделяется среди других программ двумя отличительными особенностями:

  • вы можете использовать приложение для управления компьютером и играми с помощью голосовых команд. И если у Tazti нет нужной вам команды, ее можно создать (и еще 299);
  • программа способна запускать установленные приложения, вебсайты, каталоги или использовать командную строку.

Настраивайте Tazti по своему усмотрению. Если вам не нужна команда, тогда отредактируйте ее или полностью удалите. Вы даже можете добавить команды «щелчок» и «двойной щелчок», чтобы избавиться от необходимости использования мыши.

Интерфейс программы Tazti

Тем не менее у Tazti есть один большой недостаток — она не имеет функции диктовки текста, поэтому не способна распознавать голос. Разработчик Voice Tech Group признает, что другие продукты намного лучше справляются с диктовкой, поэтому компания решила сосредоточить все усилия на других особенностях своего детища.

Tazti больше ориентируется на геймеров, которые хотят использовать свой голос для отправки персонажей на битву или тех, кто предпочитает запускать программы, медиаплееры и просматривать веб-страницы без необходимости использования клавиатуры. Тот факт, что вы можете контролировать важные части Windows с помощью Tazti, делает его достойным противником вышеупомянутых приложений, даже если и не предлагает диктовку.

Итак, если распознавание речи или Кортана не соответствуют вашим требованиям (или вы попросту не можете ими воспользоваться), тогда попробуйте вышеперечисленные утилиты.

Включение Окей Гугл на мобильном устройстве

Запуск OK Google:

  1. в зависимости от версии Андроида, нажмите на строку поиска Google или микрофончик около нее
  2. произнесите в микрофон одну из доступных команд

Именно таким образом производится включение OK Google.

В большинстве своем, запросы Окей Гугл просто вбиваются в поисковую строку после произнесения в микрофон. В некоторых случаях, ответ на голосовую команду может быть произнесен синтезированным голосом. К примеру, на вопрос «Где родился Пушкин?», робот ответит Вам на русском языке: «Александр Сергеевич Пушкин родился в Москве». При этом отобразится информация об упомянутом городе на экране телефона (в поисковой выдаче Google). Если перед фразой или командой произнести голосом «как выглядит …», то, результате голосового поиска, в поисковой выдаче Google отобразится результат поиска фотографий упомянутого в запросе предмета.

Приложение Окей Гугл и голосовой поиск в действии. Реакция на команды

Установка ОК Гугл на компьютер. В отличие от мобильных устройств, для установки голосовой надстройки OK Google на компьютер никаких дополнительных программ не требуется. Единственное условие — установленный браузер на вашем ПК и подключенный к ПК микрофон. Для голосового управления желательно использовать браузер Google Chrome: возможность поиска лучше всего реализована именно в нем. 

До 2015 года в настройках браузера Chrome была соответствующая опция в секции параметров «Поиск». Однако сейчас ее нет. Поэтому для использования Окей Гугл (т.е., функции голосового поиска), достаточно зайти на страницу Google и нажать кнопку справа от поисковой строки для произношения команды. 

Включаем голосовой Гугл в браузере Chrome

Typle

Приложение занимает лидирующие позиции среди русскоязычных пользователей, желающих командовать компьютером посредством голоса. Утилита с легкостью заменит значительную часть функций Кортаны на Windows 10, а на «семерке» добавит функцию, нередко демонстрируемую в фильмах, где люди управляют компьютерами при помощи голоса.

Перед началом работы создаем учетную запись и придумываем ключевую фразу, услышав которую приложение активируется. Затем задаем голосовую команду по управлению компьютером или выполнению определенного действия и закрепляем за ней операцию (запуск приложения, переход на указанный сайт). В окне редактирования созданных команд появляется возможность задавать параметры, с которыми приложение будет запускаться, и указать режим запуска (полноэкранный, оконный).

Функционал утилиты весьма ограничен, а интерфейсу далеко до стиля Метро, реализованного в Windows 10. Полноценное голосовое управление ПК посредством Typle реализовать не удастся: она поддерживает только открытие файлов, приложений (с аргументами) и переход по заранее заданным ссылкам. Отсутствует даже поддержка управления проигрывателем (поставить на паузу, запустить следующий трек).


С этим читают