Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Crow Translate
Россия-2 > Информационные технологии > Линукс для всех > Работа в Linux - Прочее
ИВК
Попробовал программу Crow Translate, о которой говорилось вот тут. Переводчик, конечно, серьёзный. А насчёт распознавания текста вроде не очень.
Koi.v2
Распознавание зависит от leptonica и tesseract. leptonica выделяет анализирует и передает результат tesseract тот уже выбирает текст.
Tesseract это движок распознавания текста он состоит из языковой базы, обучающего модуля и самого движка. Я упаковал языковые базы ru\en потому что все что есть заняло бы больше 300 мб. Модули обучения работают в режиме разработки так что тоже не стал паковать тем более они для каждого языка свои. Кроме исходников на их git есть уже собранные языковые файлы если потребуется больше языков можно просто скачать файл и пихнуть его в каталог usr/share/tesseract/tessdata
https://github.com/tesseract-ocr/tessdata_best

Из наблюдений tesseract лучше работает когда включена только 1 база OCR. Например если включить одновременно ru+en для анализа английского текста, то иногда он путает английские буквы с русскими "tаblе".

Вот журнал pdf.



Вполне сносно. wink.gif
ИВК
Вроде всё в порядке, русский текст тоже распознаёт. У меня, получается, русская база OCR вовсе не была включена; включил - заработало smile.gif

И даже пытается прочесть текст, написанный весьма заковыристо :
Нажмите для просмотра прикрепленного файла
Цитата
. rae AUCH ЖИЗНИ

4 ЪИЗНЬ улыбнется тебе

smile.gif
Koi.v2
Попробовал улучшенные базы, верхнюю часть вменяемо не распознаёт. Видимо каллиграфия не конек этой программы. sorry.gif
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Русская версия IP.Board © 2001-2021 IPS, Inc.