Переводим голос в текст или Яндекс Диктовка





Переводим голос в текст

Здравствуйте, Уважаемые друзья! Я снова рад вас приветствовать вас своем сайте Компьютерликбез.ру.

На днях российский поисковик Яндекс сообщил о своем новом сервисе, который называется Яндекс.Диктовка. По словам разработчиков, здесь применяются облачные технологии, которые расположены на серверах самой компании, где и будет происходить вся обработка и преобразование голоса в текст.

Что умеет Яндекс.Диктовка?

Яндекс.Диктовка может распознавать и синтезировать речь человека, активируя механизм распознавания после поступления голосовой команды. Поддерживается автоматическая установка знаков препинания во время диктовки текста. Все команды отдаются также голосом. Например для того, чтобы Диктовка «начала набирать текст» достаточно сказать «Записывай Яндекс» или «Слушай Яндекс».

Интерфейс невероятно прост. Достаточно запустить приложение, нажать на значок микрофона в правом нижнем углу и начать диктовать свой текст. Особых настроек в приложении нет. Впрочем, они и не потребуются.

Яндекс.Диктовка

По мере того как мы надиктовываем текст, знаки препинания расставляются в соответствии с паузами в речи. Так, например, точка ставится продолжительным молчанием. Есть возможность редактирования текста голосом (да и вообще в этом приложении все делается голосом), но также можно вызвать и виртуальную клавиатуру для более точных исправлений.

Голос в текст - Яндекс Диктовка

По словам самих разработчиков, Яндекс «научил» даже воспроизводить записанный текст. Понятное дело, что в итоге сам голос получается компьютерно-цифровым, но можно выбрать несколько типов озвучки в соответствии с эмоциями:

  • Больной;
  • Злой;
  • Добрый;
  • Нейтральный.

Озвучка текста происходит с помощью технологии SpeechKit и видимо в данный момент она еще дорабатывается, потому что мне удалось прослушать текст, озвученный обычным женским голосом. Чтобы Диктовка прочитала ваш текст достаточно сказать «Прочитать». Более широкий список команд вы можете посмотреть в «Примерах команд» внутри самого приложения. В конце статьи, вы можете прослушать мой эксперимент)))

Меню Яндекс Диктовка

Вообще стоит отметить, что Яндекс довольно активно стремится к развитию своих голосовых технологий. Ведь как мы знаем Гугл давно применяет голосовой поиск. Однако разработчики отечественного поисковика решили пойти дальше и не изобретать то что уже есть, а придумать что-то новое.

И надо сказать это им удалось! Разработка подобной технологии очень сложна и здесь нужно учитывать массу факторов человеческого голоса.

Например, больной, или как привели пример сами представители Яндекса, пьяный голос довольно легко распознается приложением за счет того что с разными голосами Диктовка работает по-разному. Повторюсь все происходит в режиме онлайн и все команды отправляются на сервера дата-центров Яндекса.

Где и кому может пригодится Диктовка?

  • Очевидно, тем, кто работает с текстами. Теперь будет проще и быстрее писать свои статьи не набирая их, а надиктовывая. Кстати, эту статью я пытался тоже надиктовать, поэтому она получилась такая рваная. Я не стал полностью ее переписывать, а просто внес лишь небольшие коррективы.
  • Людям, которые часто пишут какие-то посты в социальных сетях. Более того, только что надиктованный текст можно сразу же отправить в социальную сеть отдав команду «Отправить», а также можно выбрать отправку SMS, сохранения текстового файла на облако Яндекс.Диск.

Кстати, при сохранении на облако стоит давать имя файлу на латинице. Я попытался сначала сохранить с кириллическим именем, но ничего не вышло. Возможно со временем это исправят. Да, файл сохраняется в txt-формате.

По словам представителей Яндекса, Диктовка будет ориентирована на потребности медицинских учреждений, разработчиков программного обеспечения для call-центров, а также для систем корпоративной автоматизации.

Вот видео, которое я записал с помощью Vine. Включите звук, в правом нижнем углу видео и сами все услышите. Автозапуск звука я специально отключил чтобы не отпугивать вас при открытии страницы, а то было бы как-то странновато)))

Озвучка текста голосом

Друзья, даю ссылку на видео, потому что браузеры «ругаются» на iframe-код от Vine.

Что ж, вот вроде бы и все, Друзья, что мне удалось узнать о Яндекс.Диктовке. Напомню, что приложение уже доступно в Play Market  для Android, AppStore для iOS и в самом Яндексе. Для Windows Phone я пока еще его не встречал.

Ну, и, традиционно — жду ваших впечатлений от Яндекс Диктовки в комментариях!

С уважением, Руслан Ахтамьянов

Хотите получать новые статьи на почту?

Я старался. Расскажите друзьям!

Рекомендую ознакомиться с похожими статьями: