Как голосовой набор текста — новая лучшая функция Документов Google

Раньше распознавание голоса было ужасно неточным. Это работало только для горстки людей. Но сейчас это действительно неплохо, благодаря совместным усилиям Nuance, Microsoft, Apple и Google, которые потратили бесчисленные ресурсы на его фактическое улучшение.

Из всех этих компаний лишь немногие согласились на приверженность распознаванию голоса Google, который сделал ее фундаментальной стратегией в области мобильных устройств и услуг.

Одним из самых ранних набегов Google был недолговечный GOOG-411 (или локальный поиск Google Voice). Он был запущен в 2008 году и позволял людям искать деловые номера телефонов, используя свой голос. Технология распознавания голоса также была центральной частью Android, и с запуском JellyBean

наконец он стал доступен в автономном режиме.

Ранее на этой неделе Google наконец-то ввел распознавание голоса в Google Docs.

Пользователи могут буквально диктовать свои документы (так же, как я делаю с этой статьей) без необходимости устанавливать дополнительное программное обеспечение или плагины. Это значительный скачок вперед для набора онлайн-офисов, но хорошо ли это?

Начиная

Прежде чем мы углубимся в его функции, я хочу коснуться того, как вы получаете Google Voice Typing. Если у вас есть учетная запись Google, у вас уже есть это. Просто откройте Google Docs и откройте новый или существующий документ. Затем появится окно, в котором вас спросят, хотите ли вы попробовать диктофон. Нажмите Попытайся.

GoogleVoiceTypingTry

Затем вы должны дать Google Документам разрешение на использование вашего микрофона. Это просто вопрос нажатия Разрешать во всплывающее окно.

MicrophonePermission

Затем вам нужно выбрать язык, который вы хотите использовать с Google Voice Typing. Диапазон предлагаемых языков и диалектов — от английского и испанского до африкаанс и арабский.

Снимок экрана 2016-02-25 в 10.14.12

Затем просто нажмите значок микрофона и начните говорить.

Насколько это точно?

Одно из самых больших препятствий на пути распознавания голоса в основной аудитории заключается в том, что зачастую оно недостаточно точное. Раньше считалось, что если вы используете распознавание голоса, вам придется потратить добрые несколько часов на редактирование и исправление текста. Так как же Google предлагает тариф в этом отношении?

Довольно благоприятно, на самом деле. По большей части Google Voice Typing понял, что я сказал, хотя у меня есть региональный английский акцент (об акцентах мы поговорим позже).

GoogleVoiceOn

Я был особенно впечатлен тем, как распознавание голоса Google обрабатывает фоновые шумы. Когда я писал эту статью, в моей гостиной лаял йоркширский терьер, и мое окно было частично открыто. Я живу на оживленной дороге, где машины постоянно проезжают. Но, несмотря на это, Google смог отфильтровать это и сосредоточиться только на том, что я говорил.

Самой большой проблемой была Google Voice Typing, часто боролась с пунктуацией. Я бы сказал «запятая», «точка» и «полная остановка», и это означало бы, что я хочу написать «запятая», «точка» и «полная остановка». Это было неприятно по двум причинам.

Полная остановка

Во-первых, потому что это дразнит меня, сначала используя правильную пунктуацию, прежде чем немедленно вернуться к изложенной версии слова. Не было никакого способа остановить это, и мне пришлось бы вручную редактировать документ, чтобы исправить это.

Но, что еще хуже, я не мог предотвратить это. Там нет словаря, где вы могли бы переопределить правописание. Это просто случается, и вам приходится иметь дело с этим.

Я не хочу преуменьшать, как это расстраивает. Это серьезно раздражает. Но я уверен, что это еще что-то, что будет улучшено по мере того, как все больше и больше людей будут использовать эту функцию, а Google будет выделять больше ресурсов для улучшения распознавания голоса.

Помимо этого особого раздражения, я был очень доволен точностью распознавания голоса Google.

Как это обрабатывает ударения

Я был поражен тем, сколько языков и диалектов поддерживает Google Voice Typing. Только на английском языке он поддерживает новозеландский, австралийский, индийский, южноафриканский, американский и британский диалекты, и это лишь некоторые из них. Проблема в том, что в действительности нет американского акцента, так же, как нет британского. Скорее, есть ряд акцентов и диалектов, которые отличаются от места к месту.

Это правда, что в Великобритании есть акцент для каждого почтового индекса. Команда MakeUseOf может похвастаться различными акцентами среди британского персонала. Кристиан Коули говорит с широким акцентом в Мидлсбро. Роб Найтингейл, родом из Саутпорта, имеет более северный оттенок. В то время как у Марка О’Нила есть шотландская мелодия.

Я живу в Ливерпуле, поэтому у меня есть акцент Scouse, который слегка дрейфует в Атлантику, во многом благодаря моей американской невесте и времени, которое я провел в Швейцарии.

И справедливо сказать, что программы распознавания голоса часто изо всех сил пытаются понять региональные английские диалекты. Например, когда вышла Siri, ее неспособность понять шотландских пользователей стала настоящей шуткой.

Но предложение Google было исключительным. Поверьте мне, когда я говорю, что вам не придется практиковаться в разговоре с другим акцентом

, Я говорил с несколькими друзьями, у которых также есть региональные английские акценты, и у них был такой же позитивный опыт. Хотя я признаю, что это небольшой и совершенно ненаучный образец, он, безусловно, многообещающий.

Скорость голосовой диктовки

Программы распознавания голоса традиционно страдают от неспособности идти в ногу со скоростью, с которой диктует пользователь. По общему признанию, я был немного обеспокоен тем, что предложение Google не будет отличаться, особенно если учесть, что это онлайн-сервис, а не программа, работающая на моем новом MacBook Pro.

Но я был впечатлен. Google не отставал от моего уровня речи с высоким содержанием кофеина и не служил узким местом для моей продуктивности. Это была полная противоположность моему опыту использования других инструментов голосовой диктовки.

VoiceRecognitionSpeed

Я не знаю, было ли это потому, что у меня быстрый FTTC (оптоволокно для кабинета)

домашнее подключение к Интернету или тот факт, что Google имеет в своем распоряжении неограниченное количество быстрых серверов. В любом случае, я смог сделать что-нибудь.

Примечание по микрофонам

Встроенные микрофоны, как правило, поражают воображение. По моему опыту, они либо превосходны, как на ноутбуках Apple, либо нет. Там очень редко где-либо среднего уровня.

Как правило, самые дешевые ноутбуки

будет иметь худшие внутренние микрофоны. Это всего лишь одна из тех функций, которые обычно игнорируются производителями устройств.

Я начал диктовать эту статью, используя внутренний микрофон на моем MacBook Pro. Хотя в Документах Google часто говорилось, что у меня проблемы со слухом, это не приводит к медленной или неточной диктовке. Все работало просто отлично.

Я также попробовал Google Voice Typing с дорогим внешним микрофоном Blue Yeti. Это микрофоны подкаст-качества, которые продаются на Amazon более чем за 100 долларов.

или редактор уценки И. А. Писатель

,

Но это два небольших неудобства, Google Voice Typing так же хорош, как он получает. Для контраста, я написал этот раздел статьи, используя встроенное распознавание голоса в OS X, и это было далеко не так точно и не так быстро.

Если это не убедит людей переключиться на Google Drive, я не знаю, что будет.

Теперь к вам! Вас искушало распознавание речи на Google Диске? Вы уже попробовали это? Расскажите мне все об этом в комментариях ниже.

Ссылка на основную публикацию
Adblock
detector