Оптическое распознавание символов (OCR) — это процесс преобразования текста, захваченного на изображении, в текстовый документ. Эта процедура редко бывает безупречной, поскольку небольшие неровности изображения, например, сканирование газет, могут привести к ошибкам в программном обеспечении OCR. Следовательно, проверка орфографии является обязательным шагом при выполнении любого задания OCR.
К сожалению, большинство бесплатных сервисов OCR не предоставляют функцию проверки орфографии OCR. В этой статье я собираюсь представить лучшие инструменты проверки орфографии для пост-обработки текстов OCR. Это включает в себя альтернативы для существующих инструментов, которые не обеспечивают внутреннюю проверку орфографии OCR.
Документы Google
Большинство служб OCR позволят вам экспортировать результат в обычный текст. Для дальнейшей обработки вы можете загрузить в Google Documents, который также поставляется с внутренней проверкой орфографии. К сожалению, проверка орфографии очень проста и не позволяет вам выбирать языки или добавлять пропущенные слова.