Как попробовать распознавание речи Google Chrome и использовать его в Интернете

Google только что начал выпуск первой стабильной версии Chrome 11, последней версии кроссплатформенного веб-браузера (совместим с Windows, Linux и Mac OS X). Загружаемый на итальянском языке, ссылаясь на этот лист, Chrome 11 приносит с собой множество нововведений, но наиболее интересным и инновационным, безусловно, является поддержка распознавания голоса «в браузере», о которой мы уже говорили некоторое время назад, по случаю публикация первых превью-релизов.

В Chrome 11 реализованы новые API-интерфейсы ввода речи HTML5: благодаря им, например, можно будет взаимодействовать с веб-страницами, просто используя голосовые команды. С помощью нового API, являющегося результатом сотрудничества Google и компетентной в этой области рабочей группы W3C, разработчики могут разрабатывать веб-приложения, способные распознавать голос пользователя и преобразовывать его в письменный текст.

Механизм основан на взаимодействии с некоторыми «речевыми серверами» Google, которые позаботятся об управлении операцией преобразования голосового файла в редактируемый текст.

Первый пример можно использовать, подключив с этой страницы из Chrome 11. Как видите, в правой части текстового поля показан небольшой значок, представляющий микрофон.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Нажав на нее, Google может распознать язык, на котором произносится текст, и через несколько секунд ожидания вставит его в поле.

Качество результатов, предлагаемых механизмом распознавания голоса, еще можно улучшить, однако система выглядит намного более зрелой, чем первые тесты, проведенные в последние недели.

Google активировал распознавание голоса в Translate: подключившись к сервису нажмите здесь поэтому, выбрав перевод предложения с английского, можно будет произнести его и, таким образом, активировать его автоматическое распознавание (функция еще не включена на итальянских условиях).

Большим преимуществом является то, что функции речевого ввода можно использовать, добавив простой атрибут в тег HTML5. Новая версия языка разметки все больше и больше воодушевляет всех производителей основных веб-браузеров: потенциал, предлагаемый языком разметки, на самом деле огромен еще и потому, что различные рабочие группы, созданные в рамках W3C и других организаций, стремятся объединить аргументированным и хорошо задокументированным образом целый ряд возможностей, которые до сих пор использовались на веб-страницах, используя подходы, далекие от стандартов.

Различные спецификации HTML5 сегодня достигли разного уровня зрелости: некоторые в настоящее время считаются окончательными, а другие еще не исправлены (и не пользуются поддержкой всех поставщиков; в этой статье мы представили HTML5, иллюстрирующую основные новшества язык и его «современность»).

Активация функции распознавания речи на веб-странице происходит мгновенно: достаточно ввести атрибут x-webkit-speech в соответствие с тегом, используемым для отображения текстового поля внутри формы. Пример:

Пользователи Chrome 11, посетив веб-страницу, увидят значок микрофона, который позволит им запустить распознавание голоса. С другой стороны, те, кто использует другие браузеры, увидят текстовое поле в его традиционной форме, но сообщение об ошибке отображаться не будет.

Следующая веб-страница HTML5 позволяет просматривать обычное текстовое поле, которое, однако, использует функцию «распознавания речи», встроенную в Google Chrome 11:

Распознавание речи — тест

Поддержка звукового сопровождения недоступна в веб-браузере.
Сейчас только Google Chrome 11 предлагает бесплатную версию. После загрузки необходимо щелкнуть его

Как видите, код JavaScript (строки 13-17) позволяет проверить поддержку x-webkit-speech используемым браузером. Если функциональность не поддерживается, активируется сообщение «Поддержка распознавания голоса не включена в вашем веб-браузере. (...)». Это делается просто путем изменения стиля, связанного с тегом абзаца, содержащимся в блоке div, с помощью селектора типа идентификатора «речевой ввод».

Затем текстовое поле можно вставить в форму, добавив кнопку отправки и атрибуты действия и метода, чтобы, например, то, что было введено вручную или с помощью распознавания голоса, можно было передать в другой файл:

Распознавание речи — тест

<метод формы ="post" action="nomefile.php">

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)