Бесплатное и платное программное обеспечение для распознавания текста: сравнение Microsoft OneNote и Nuance OmniPage

Инструменты оптического распознавания символов (OCR) позволяют быстро преобразовывать печатный или рукописный текст в цифровой. Скажем, вы хотите быстро копировать и редактировать текст из изображения

в Instagram или отсканированное фото. Вы можете сделать это в одно мгновение с помощью инструмента OCR!

Интернет благословил нас тоннами бесплатных опций OCR

Платные варианты существуют хорошо. Итак, вот что я хочу знать: стоит ли платить за инструмент OCR, когда вы можете просто использовать бесплатный?

В этом посте я опробую один из лучших бесплатных инструментов OCR для проверки одного из лучших платных вариантов OCR.

Приготовьтесь к Microsoft OneNote (бесплатно) и Nuance OmniPage 18 (60 долларов).

Как использовать инструменты OCR

В целом, большинство инструментов OCR работают примерно одинаково:

  • Вы импортируете файл на основе изображения, такой как изображение JPG или PDF.
  • Вы говорите инструменту OCR преобразовать изображение в текстовый документ.
  • Инструмент начинает работать и создает версию текста, которую вы можете редактировать.

Эта общая процедура применима как к OneNote, так и к OmniPage.

Тестирование OneNote против платного инструмента OCR

Чтобы оценить, какой (если какой-либо) инструмент действительно лучше, я оцениваю каждый по нескольким тестам. И прежде чем мы пойдем дальше, позвольте мне уточнить:

Если вы собираетесь использовать OneNote для распознавания текста, используйте только версию программы OneNote 2016 для настольных компьютеров.

одна запись

Веб-приложение, которое, скорее всего, есть на вашем компьютере, если вы используете Windows 10, не обладает такими же возможностями, как программное обеспечение для настольных ПК 2016 года.

Если вы попытаетесь использовать OCR в любом приложении OneNote, которое не является настольным программным обеспечением 2016 года, оно не будет работать. Поверь мне, я попробовал.

Зайдите сюда, чтобы скачать OneNote 2016 бесплатно. Убедитесь, что вы нажали ссылку «Рабочий стол Windows»!

Процесс рейтинга

Чтобы измерить, насколько хорошо каждый инструмент выполняет определенные функции, я решил оценить точность каждого инструмента по шкале от 1 до 5. Оценка 5 будет означать, что инструмент расшифровывает текст точно, без орфографических или синтаксических ошибок.

Чтобы четко определить, какой инструмент наиболее полезен, я решил попытаться преобразовать следующие файлы в текст:

  • PDF
  • Скачанная JPG фотография с текстом
  • Фото смартфона с текстом
  • Отсканированная, отпечатанная вручную заметка
  • Отсканированная рукописная заметка

Что касается ожиданий, я ожидаю, что оба эти инструмента будут довольно равномерно складываться друг с другом. По моему опыту, платные инструменты и бесплатные инструменты часто относительно равны, за исключением, может быть, нескольких ярких функций со стороны платного инструмента. (Просто посмотрите на Google Docs и Microsoft Word

.)

Я не часто использую OneNote и, конечно же, никогда не использовал его ни для чего, кроме ввода простых заметок. Итак, я думаю, что эти тесты будут точным отображением не только функций OCR обоих инструментов, но и того, насколько они интуитивно понятны.

Ниже вы можете увидеть, насколько хорошо каждый из этих тестов работал как в OneNote, так и в OmniPage.

PDF в текст

Чтобы протестировать эту функцию с помощью обоих инструментов OCR, я загрузил этот PDF-файл с Lakeshore Learning.

Вот как работал каждый инструмент:

Одна запись

Чтобы получить PDF в OneNote, я использовал Распечатка файла возможность добавить PDF на одну из моих страниц Блокнота:

оптическое распознавание символов

Следуя инструкциям в этой статье Microsoft, я щелкнул правой кнопкой мыши изображение PDF и выбрал Скопируйте текст с этой страницы распечатки.

Мне пришлось потратить некоторое время на поиск в Google, чтобы понять, как это сделать, но после небольшого исследования процесс оказался относительно простым.

оптическое распознавание символов

На новой странице я вставил текст. OneNote успешно скопировал текст с первой страницы документа PDF. Он не очень хорошо справлялся с сохранением форматирования из PDF, но текст был редактируемым и доступным для поиска, и, казалось, ничего не было написано неправильно.

оптическое распознавание символов

Оценка OneNote: 5

OmniPage

OmniPage имеет пошаговое меню кнопок в верхней части основного экрана, в котором указано, что делать. Используя это, я загрузил файл PDF в программное обеспечение.

всеобщее оптическое распознавание символов

Затем я нажал следующий кнопка, чтобы выполнить OCR.

всеобщее оптическое распознавание символов

Далее я нажал Сохранить в файлы и назвал мой новый документ.

всеобщее оптическое распознавание символов

И когда я открыл файл, текст был аккуратно преобразован в документ Microsoft Word со всеми исходными изображениями PDF и 100-процентным редактируемым текстом. Форматирование все еще было в такте, и я не заметил ни слов с орфографической ошибкой, ни прерывистых строк текста.

Единственная странная вещь в OmniPage OCR заключалась в том, что при загрузке и конвертации файла PDF не открывались изображения.

Вы могли бы подумать, что увидите предварительный просмотр документа или чего-то еще, но этого не произошло. Хотя мне это и нравилось, потому что вы можете просто переходить от одного шага к другому и сразу же закончить распознавание текста.

OmniPage Оценка: 5

Загруженный JPG к тексту

Что может быть лучше, чтобы испытать эти инструменты OCR, чем испытать их на некоторых цитатах Pinterest?

Для этого теста я загрузил JPG-фотографию из учетной записи Pinterest в Down To Health.

Вот как складываются результаты этого теста:

Одна запись

С новой страницы в OneNote я вставил картинку. (Вы делаете это аналогично тому, как вставляете изображение в Microsoft Word или любую другую программу Office.)

оптическое распознавание символов

Как и в примере с PDF, я щелкнул правой кнопкой мыши на изображении и выбрал Копировать текст с картинки.

оптическое распознавание символов

Однако когда я попытался вставить скопированный текст под изображение, OneNote не смог ничего вставить.

Я попытался вставить его в виде простого текста, сохранить исходное форматирование и объединить форматирование, но ничего не получалось.

Возможно, OneNote не удалось скопировать текст из-за текстурированного фона на изображении. Тем не менее, текст на этом изображении довольно темный по контрасту, и я думаю, что хороший инструмент OCR должен быть в состоянии извлечь его.

Оценка OneNote: 1

OmniPage

Выполнив те же действия, что и в предыдущем тесте, я загрузил фотографию в OmniPage. На этот раз, однако, программа была немного не уверена в текстуре фона на фотографии.

всеобщее оптическое распознавание символов

Это было довольно близко в распознавании слов «GO DO», но было далеко в попытках расшифровать «ЧТО».

Используя предоставленное поле, я исправил несколько ошибок вручную и велел программе завершить выполнение OCR. Это произошло, и я сохранил полученный документ так же, как и в прошлом тесте.

Этот тест был в значительной степени неудачным, поскольку программа могла действительно распознавать только слова, которые я исправил вручную.

всеобщее оптическое распознавание символов

Я пытался кликать и проверял другие варианты, такие как Изображение с камеры на слово, но без удачи там тоже.

OmniPage Счет: 2

Смартфон Фото в текст

Мне очень нравится пить чай. Итак, для следующего текста я быстро сфотографировал чайную коробку чая в пределах досягаемости моего компьютера.

Давайте посмотрим, будут ли наши инструменты распознавания лучше в этом формате.

Одна запись

Снова используя опцию вставки фотографии, я добавил фотографию на новую страницу OneNote.

Я щелкнул правой кнопкой мыши на изображение и выбрал Копировать текст с картинки.

Затем я щелкнул мышью под изображением и вставил текст, который OneNote сделал с удивительной точностью!

оптическое распознавание символов

OneNote немного изменил некоторые строки текста, но я был приятно удивлен тем, насколько успешным был этот тест.

Текст был полностью редактируемым, и этот тест занял совсем немного времени.

Оценка OneNote: 5

OmniPage

Мои надежды не были высокими для этого теста после серьезного сбоя с загруженным изображением JPG. Тем не менее, OmniPage также проделал действительно точную работу с этим тестом!

Идя в Помощник рабочего процесса Я выбрал Загрузить файлы цифровой камеры вариант и загрузил фото с моего смартфона.

всеобщее оптическое распознавание символов

Программное обеспечение увеличило часть того, что, как я считаю, было логотипом марки на моей чайной коробке. Я просто проигнорировал возможность вносить изменения.

Удивительно, но файл Word, созданный OmniPage, был на 100% точным и редактируемым, с несколькими странными сгустками дополнительного текста.

всеобщее оптическое распознавание символов

OmniPage Оценка: 4

Печатная запись в текст

Для следующего теста я написал короткую заметку и отсканировал ее в облако.

Как вы можете догадаться, у меня дома не лежит сканер. Для сканирования этого изображения я использовал CamScanner, бесплатное приложение, доступное как для iOS, так и для Android, которое позволяет сканировать документы с помощью телефона.

,

Поскольку CamScanner дает вам возможность загружать отсканированные файлы в формате PDF или JPG, я решил попробовать оба варианта.

Одна запись

С обоими форматами файлов у меня все еще была возможность скопировать текст из этого рисунка, когда я вставил его в OneNote.

Однако программное обеспечение не смогло использовать OCR для успешного копирования текста из изображения JPG.

Он смог скопировать немного текста из PDF-версии заметки, но не очень успешно.

оптическое распознавание символов

Оценка OneNote: 1

OmniPage

Что касается изображения в формате JPG для печатного текста, OmniPage не очень хорошо справился с расшифровкой текста.

всеобщее оптическое распознавание символов

Когда я попробовал этот тест с форматом файла PDF, результат был примерно таким же.

OmniPage Счет: 2

Почерк в текст

Так же, как с напечатанной заметкой, я отсканировал свою рукописную заметку

используя CamScanner.

Одна запись

Несмотря на то, что в моей печатной заметке не было возможности обнаружить какие-либо буквы, OneNote смог скопировать какой-либо текст из рукописной заметки. Однако это было крайне неточно.

оптическое распознавание символов

С файлом PDF результат был еще хуже.

Оценка OneNote: 1

OmniPage

Поскольку OmniPage даже не смог распознать мой печатный текст, у меня не было больших надежд на более сложный почерк.

Однако каким-то образом программа смогла импортировать мой почерк. Тем не менее, он не мог сделать его редактируемым, даже когда я пытался импортировать его в виде простого текста. То же самое было верно при загрузке PDF-версии моего почерка.

всеобщее оптическое распознавание символов

Оценка OmniPage: 1

Вы бы заплатили за инструмент OCR после этого?

С невероятно близким счетом от 13 до 14, OmniPage едва выиграл у OneNote. OmniPage мог распознавать больше символов, чем OneNote, но, в конце концов, оба были одинаково полезны (или бесполезны). Тесты рукописного текста, печатного текста и загруженного JPG поставили обе программы в тупик, но каждая из них хорошо работала с PDF для текста и с изображения смартфона для распознавания текста.

Но стоит ли вкладывать деньги в платный инструмент OCR? На мой взгляд, нет. Если OneNote может преуспеть и потерпеть неудачу в тех же областях, что и OmniPage, зачем тратить $ 60?

Если вы не хотите устанавливать какое-либо программное обеспечение, вам следует попробовать один из этих бесплатных онлайн-инструментов OCR

,

Как вы думаете? Есть ли какая-то базовая функция, которую мы упустили в OmniPage? Знаете ли вы какие-либо более платные или бесплатные инструменты OCR? Расскажите нам в разделе комментариев ниже!

Ссылка на основную публикацию
Adblock
detector