Переводим отсканированный текст в Word





Сканировать в вордВсем доброго времени суток!

В этой статье мы поговорим о том, что нужно сделать для того, чтобы можно было редактировать сканированный текст в популярных текстовых редакторах, таких как MS Word. Произвести простое сканирование – задача не сложная.  Достаточно нажать кнопку на сканере, выбрать качество сканирования и сохранить получившийся файл в каком-либо графическом формате *.tiff, *.jpeg, *.bmp и т.д. 

В таком формате редактирование текста не представляется возможным, т.к. получившийся файл является простой картинкой, ничем не отличающейся от рядовой фотографии. Сканер просто-напросто «не понимает» что буквы текста являются именно буквами. Для него это всего лишь пятна или точки черного цвета. Поэтому в этой статье мы разберем программу с помощью которой Вы сможете легко и просто сканировать в ворд.

Именно для того, чтобы «объяснить» компьютеру, что отсканированный файл является текстом и были созданы программы для распознавания текстов. Причем они позволяют распознавать текст введенный не только с помощью сканера, но и даже если этот текст был сфотографирован простым фотоаппаратом. Да, кстати, кто хочет узнать несколько полезных фишек по работе с Microsoft Word, может ознакомиться с моим мини видеокурсом.

А про он-лайн сервис распознавания сканированных текстов я рассказывал в этой статье. Почитайте ее и воспользуйтесь сервисом если нет желания устанавливать отдельную программу.

К современным программам для распознавания текстов предъявляется довольно широкий спектр задач. Сегодня эти программы должны уметь:

  1. Распознавать текст, набранный самыми различными шрифтами и даже рукописный текст;
  2. Распознавать текст, в котором содержатся слова на нескольких языках;
  3. Корректно распознавать таблицы и картинки;
  4. Распознавать некачественный текст (например, многократно ксерокопированные тексты);
  5. Самое главное – перевод сканированного текста в текстовые редакторы, такие как Word.

Самой актуальной программой, пожалуй, является ABBYY FineReader, созданной российскими программистами Дэвидом Яном и Александром Москалевым. Достоинств у «Файнридера» не перечесть, начиная от количества поддерживаемых языков, в числе которых и древние языки, до пакетной обработки многостраничных текстов. Файнридер, возможно, и справится с переводом, но это будет перевод электронного документа. А вот чтобы получить письменный перевод срочно, придется воспользоваться услугами экспертов.

Единственным недостатком является стоимость «Файнридера». Однако не стоит отчаиваться, ведь при покупке сканера, в зависимости от модели сканера, вполне может оказаться, что на диске с драйверами уже содержится стандартная модификация программы. Ну, а если у Вас еще нет Файнридера, то Вы можете приобрести его с 5% скидкой по этой ссылке. Скидка действует, если Вы введете промокод - computerlikbez.

Что ж, попробуем отсканировать и перевести текст в Word (рассмотрим эту процедуру на примере разворота книги):

Располагаем необходимый текст в сканере, запускаем FineReader и нажимаем кнопку «Сканировать»

Интерфейс FineReader

В следующем окне задаем необходимые настройки. Для улучшения качества можно задать бОльшее разрешение сканирования. Затем нажимаем «Сканировать»

Сканирование ABBYY FinReader

Далее запускается процесс автоматического сканирования и распознавания

Процесс сканирования

В следующем окне мы можем видеть две большие области: слева – отсканированную картинку, а справа уже распознанный текст. В области «Страницы» можно также увидеть что FineReader не только перевернул разворот книги вертикально, но и разбил текст на две страницы

Сканированный текст в FineReader

Далее, нажав на треугольник, справа от кнопки «Сохранить» выбираем необходимый формат

Перевод текста в Word

В следующем окне задаем имя будущего файла, указываем путь для сохранения. В нижней части окна можно выбрать дополнительные параметры сохранения

Параметры сохранения

Как видим, FineReader отлично справился. Причем распознавание произошло пакетно, т.е. обе страницы нашего текста оказались в одном файле.

Сканированный текст в Word

Кстати, недавно дописал, наконец-то, свою книгу! Ознакомиться с ней можно по ссылке.

Трактат о компах не научный