Переводим отсканированный текст в Word
Всем доброго времени суток!
В этой статье мы поговорим о том, что нужно сделать для того, чтобы можно было редактировать сканированный текст в популярных текстовых редакторах, таких как MS Word. Произвести простое сканирование – задача не сложная. Достаточно нажать кнопку на сканере, выбрать качество сканирования и сохранить получившийся файл в каком-либо графическом формате *.tiff, *.jpeg, *.bmp и т.д.
В таком формате редактирование текста не представляется возможным, т.к. получившийся файл является простой картинкой, ничем не отличающейся от рядовой фотографии. Сканер просто-напросто «не понимает» что буквы текста являются именно буквами. Для него это всего лишь пятна или точки черного цвета. Поэтому в этой статье мы разберем программу с помощью которой Вы сможете легко и просто сканировать в ворд.
Именно для того, чтобы «объяснить» компьютеру, что отсканированный файл является текстом и были созданы программы для распознавания текстов. Причем они позволяют распознавать текст введенный не только с помощью сканера, но и даже если этот текст был сфотографирован простым фотоаппаратом. Да, кстати, кто хочет узнать несколько полезных фишек по работе с Microsoft Word, может ознакомиться с моим мини видеокурсом.
А про он-лайн сервис распознавания сканированных текстов я рассказывал в этой статье. Почитайте ее и воспользуйтесь сервисом если нет желания устанавливать отдельную программу.
К современным программам для распознавания текстов предъявляется довольно широкий спектр задач. Сегодня эти программы должны уметь:
- Распознавать текст, набранный самыми различными шрифтами и даже рукописный текст;
- Распознавать текст, в котором содержатся слова на нескольких языках;
- Корректно распознавать таблицы и картинки;
- Распознавать некачественный текст (например, многократно ксерокопированные тексты);
- Самое главное – перевод сканированного текста в текстовые редакторы, такие как Word.
Самой актуальной программой, пожалуй, является ABBYY FineReader, созданной российскими программистами Дэвидом Яном и Александром Москалевым. Достоинств у «Файнридера» не перечесть, начиная от количества поддерживаемых языков, в числе которых и древние языки, до пакетной обработки многостраничных текстов. Файнридер, возможно, и справится с переводом, но это будет перевод электронного документа. А вот чтобы получить письменный перевод срочно, придется воспользоваться услугами экспертов.
Единственным недостатком является стоимость «Файнридера». Однако не стоит отчаиваться, ведь при покупке сканера, в зависимости от модели сканера, вполне может оказаться, что на диске с драйверами уже содержится стандартная модификация программы. Ну, а если у Вас еще нет Файнридера, то Вы можете приобрести его с 5% скидкой по этой ссылке. Скидка действует, если Вы введете промокод - computerlikbez.
Что ж, попробуем отсканировать и перевести текст в Word (рассмотрим эту процедуру на примере разворота книги):
Располагаем необходимый текст в сканере, запускаем FineReader и нажимаем кнопку «Сканировать»
В следующем окне задаем необходимые настройки. Для улучшения качества можно задать бОльшее разрешение сканирования. Затем нажимаем «Сканировать»
Далее запускается процесс автоматического сканирования и распознавания
В следующем окне мы можем видеть две большие области: слева – отсканированную картинку, а справа уже распознанный текст. В области «Страницы» можно также увидеть что FineReader не только перевернул разворот книги вертикально, но и разбил текст на две страницы
Далее, нажав на треугольник, справа от кнопки «Сохранить» выбираем необходимый формат
В следующем окне задаем имя будущего файла, указываем путь для сохранения. В нижней части окна можно выбрать дополнительные параметры сохранения
Как видим, FineReader отлично справился. Причем распознавание произошло пакетно, т.е. обе страницы нашего текста оказались в одном файле.
Кстати, недавно дописал, наконец-то, свою книгу! Ознакомиться с ней можно по ссылке.