| Поделиться |
Здравствуйте, гость ( Вход | Регистрация )
| Поделиться |
1.1.2013, 13:15
Сообщение
#1
|
|
![]() Профессионал ![]() ![]() ![]() ![]() ![]() ![]() ![]() Группа: Глоб. Модератор Сообщений: 10176 Регистрация: 22.6.2009 Вставить ник Цитата Из: Онега Пользователь №: 1352 Страна: Россия Город: Не указан Пол: Муж. Репутация: 30
|
Вот Robinzoid делится своим опытом :
Программа для распознавания текста Программа для распознавания текста-2 Мне это, кстати, вскоре может пригодиться; много чего надо бы оцифровать, мешают недостаток времени и воспоминания о подобных опытах ещё в винде (КПД был как-то не очень А вообще кто пробовал? Насколько эффективно, особенно если качество оригинала хромает? -------------------- Не пью, не курю, не смотрю телевизор, не пользуюсь Windows
|
|
|
|
![]() |
1.1.2013, 20:57
Сообщение
#2
|
|
![]() Профессионал ![]() ![]() ![]() ![]() ![]() ![]() ![]() Группа: Глоб. Модератор Сообщений: 10176 Регистрация: 22.6.2009 Вставить ник Цитата Из: Онега Пользователь №: 1352 Страна: Россия Город: Не указан Пол: Муж. Репутация: 30
|
Вот просто щёлкнутая цифровиком страница книги. Насколько я представляю себе логику работы таких программ, им гораздо удобнее иметь дело всё-таки со сканированным изображением, чем с фоткой.... хотя глубоко не вникал, так что утверждать не берусь. А вообще качество распознавания более-менее на уровне FineReader'а? -------------------- Не пью, не курю, не смотрю телевизор, не пользуюсь Windows
|
|
|
|
2.1.2013, 11:58
Сообщение
#3
|
|
|
Крупный специалист ![]() ![]() ![]() ![]() ![]() Группа: Активный Пользователь Сообщений: 376 Регистрация: 25.8.2010 Вставить ник Цитата Пользователь №: 1910 Страна: Россия Город: Екатеринбург Пол: Муж. Репутация: 1
|
А вообще качество распознавания более-менее на уровне FineReader'а? Отнюдь. Качество распознавания в программах YAGF и OCRFeeder с движками cuneiform и tesseract далеко отстает от FineReader'a. Для опытов отсканирован и распознан паспорт на счетчик воды со сложным форматированием. Сканирование производилось сканером Genius ColorPage Slim 1200 c разрешением 600 dpi. Распознавание проводилось в приложениях FineReader 8, YAGF 0.9.2 и OCRReeder 0.7.9 с движками cuneiform и tesseract из р6. Результаты говорят сами за себя. Лучшим показал себя, естественно, FineReader. Минимум ошибок, распознана таблица. Худшим оказался движок cuneiform в обеих свободных программах. Движок tesseract в OCRFeeder даже попытался соблюсти какое-то форматирование. Сохранение результатов распознавания из OCRFeeder'a производилось копированием и вставкой в Writer с последующим экспортом в формат PDF. Прямой экспорт в ODT дал несколько худшие результаты форматирования, а прямой экспорт в PDF вообще не удался. В итоге для распознавания простого текста можно использовать и YAGF и OCRFeeder. Но я бы всё же рекомендовал движок tesseract.
Прикрепленные файлы
FineReader.pdf ( 59.31 килобайт )
Кол-во скачиваний: 6
Original.pdf ( 112.31 килобайт )
Кол-во скачиваний: 7
yagf_cuneiform.pdf ( 19.47 килобайт )
Кол-во скачиваний: 6
yagf_tesseract.pdf ( 18.91 килобайт )
Кол-во скачиваний: 4
ocrfeeder_cuneiform.pdf ( 24.93 килобайт )
Кол-во скачиваний: 6
ocrfeeder_tesseract.pdf ( 25.48 килобайт )
Кол-во скачиваний: 5 |
|
|
|
IVK Распознавание текста 1.1.2013, 13:15
kostyalamer Цитата(IVK @ 1.1.2013, 13:15) А вообще кт... 1.1.2013, 14:59
robinzoid К сожалению как у "файнридера" в офисных... 1.1.2013, 18:19
Skull Цитата(IVK @ 1.1.2013, 12:15) Вот Robinzo... 1.1.2013, 18:56
robinzoid Цитата(Skull @ 1.1.2013, 18:56) Кто мешал... 1.1.2013, 19:55
Skull Цитата(robinzoid @ 1.1.2013, 18:55) Смысл... 1.1.2013, 23:52
and Кстати я уже лет 6 не был в библиотеке, там разреш... 1.1.2013, 23:13
YYY Цитата(squire @ 2.1.2013, 11:58)
cuneifo... 10.1.2013, 1:51
squire Цитатаcuneiform 1.1.0
Откуда он?
Кодcuneiform 1.... 10.1.2013, 22:24
YYY Цитата(squire @ 10.1.2013, 22:24) Откуда ... 10.1.2013, 23:09
robinzoid Цитата(YYY @ 10.1.2013, 23:09) to robinzo... 21.1.2013, 14:28
IVK Цитата(and @ 1.1.2013, 23:13) Кстати я уж... 1.1.2013, 23:18
IVK Короче, если в Линуксе, то только простой текст с ... 10.1.2013, 10:06
robinzoid Цитата(IVK @ 10.1.2013, 10:06) Короче, ес... 10.1.2013, 22:56
IVK Попробовал распознавать (в yagf + tesseract) текс... 20.1.2013, 19:44![]() ![]() |
|
Текстовая версия | Сейчас: 9.11.2025, 2:53 |