5 лучших инструментов распознавания текста для извлечения текста из изображений

Я уже писал о преимуществах безбумажного офиса, о дзенском чувстве возможности войти в комнату, а не сальто головой из стопки бумаги и сломать себе шею. Но когда у вас есть стопки бумаги, как вы можете преобразовать весь этот печатный текст во что-то, что цифровая программа сможет распознавать и индексировать? Да, верно, вы используете службу или приложение OCR.

Извлечение текста с помощью OCR

это тема, которую мы освещали бесконечно, с момента рождения MUO в 2006 году. Но приложения OCR в этой области продолжают расширяться, поэтому вот еще 5, на которые вы должны обратить внимание, если вы хотите извлечь этот текст из отсканированного документа.

,

1. FreeOCR

5 лучших инструментов распознавания текста для извлечения текста из изображений freeocr

Мы начнем с программного обеспечения под названием «FreeOCR». Это приложение только для Windows, которое работает на всех ПК под управлением XP и выше (хотя, если вы используете XP, вам нужно будет установить дополнительную часть).

FreeOCR работает со сканерами TWAIN, файлами PDF и изображениями TIFF и выводит текст в файл Microsoft Word. Чтобы использовать это приложение, вам также необходимо загрузить механизм распознавания текста Google Open Source Tesseract.

2. FreeOCR to Word

5 лучших инструментов OCR для извлечения текста из изображений Бесплатный OCR to Word

Это тот, который мне понравился больше всего, так как он точно расшифровал то, что я ему дал. Компания, стоящая за приложением, обещает точность 99,8%, и приложение также сохраняет оригинальное форматирование. Как видно из заголовка, текст и форматирование переносятся в редактируемый документ Word, но также возможны текстовые (.txt) файлы.

Он распознает все основные форматы изображений, а также файлы Photoshop. Просто стыдно, что все эти замечательные приложения предназначены только для Windows. Где любовь к владельцам Mac и Linux?

3. gImageReader

5 лучших инструментов распознавания текста для извлечения текста из изображений gimagereader

Это снова возвращает нас к механизму распознавания текста Tesseract от Google, который выполняет роль машинного отделения для этого довольно хорошо разработанного графического интерфейса. Читатель был удобен, потому что он автоматически определяет макет страницы. Или, если он слегка суетится, вы можете вручную перенастроить области.

Текст размещается справа от изображения / отсканированного документа, чтобы вы могли видеть, все ли удаляется, как следует. Он выполняет базовое редактирование этого текста, а также проверку орфографии

(если вы скачали соответствующий словарь).

4. Capture2Text

5 лучших инструментов распознавания текста для извлечения текста из снимков экрана Capture2Text

Этот инструмент OCR выполняет двойную роль. Прежде всего, это инструмент для создания скриншотов, который затем делает скриншот и преобразует его в буфер обмена Windows. Затем вы можете скопировать и вставить текст в любое место.

Во-вторых, у него есть технология распознавания голоса, которая транскрибирует ваши слова для вас. На сайте говорится, что это экспериментально, поэтому не ожидайте отличных результатов в данный момент. Те, у кого такие мечтательные знойные акценты, как у меня, могут испытывать трудности.

5. VueScan

5 лучших инструментов распознавания текста для извлечения текста из изображений lg vuescan book

И ты думал, что мы закончим без какой-нибудь любви к Мак, не так ли? Ну, не бойся, OSX’ers! Если вам нужно сделать какое-либо распознавание текста, вот вам VueScan на помощь. Он ссылается на ваш сканер, и одно из преимуществ (на самом деле сайт перечисляет его как мошенничество) заключается в том, что это очень легкая базовая программа. Без раздумий, но не слишком много возможностей. Но он прост в установке, прост в использовании и выполняет свою работу, а это главное.

Итак, какие программы OCR плавают на вашей лодке? Возможно, вы пользователь OCR Google Drive? Или пользователь другого, которого мы здесь не освещали? Дайте нам знать в комментариях ниже.

Image Credit: Безбумажный знак (Shutterstock)

Ссылка на основную публикацию
Adblock
detector