Краткий обзор Tesseract — бесплатной программы для распознавания текста со сканера

Иногда случается такая необходимость, как перенабрать из уже отпечатанного материала пару сотен страниц текста за вечер. Особенно часто такое занятие застает в период сессии у студентов. В таких случаях на помощь приходят системы OCR (оптического распознавания символов). И если в крупных компаниях для этого используются мощные и дорогие программы, то частным лицам в таком случае приходится пользоваться малоизвестными и простыми решениями. Об одном из таких решений и пойдет далее…