![]() |
Поделиться |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
Поделиться |
![]()
Сообщение
#1
|
|
Мастер ![]() ![]() ![]() ![]() ![]() ![]() Группа: Активный Пользователь Сообщений: 526 Регистрация: 29.1.2014 Вставить ник Цитата Пользователь №: 2504 Страна: Россия Город: Не указан Пол: Муж. Репутация: ![]() ![]() ![]() |
Открываю тему поиском программы корректной конвертации файла.pdf в файл.txt или файл.doc
Дело в том, что все которые мне попадаются в инете программы, предложения текста принудительно переносятся на новую строку, так же, как в исходном pdf-файле. А надо, чтоб предложения ложились естественным образом в одну строку, с переходом на следующую только вначале абзацев. Такая необходимость возникла всвязи с тем, что авторы зачастую присылают на конкурс рассказы в pdf-файлах, а при попытке нормально разместить его содержание на сайте с обломаными предложениями и нелепыми переносами выглядит безобразно. Вынужден ручками редактировать каждую строку перед публикацией. Но сколькож можно!)) Хорошо если тексты небольшие. Но ведь присылают и под сто страниц! Посоветуйте пожалуйста что нибудь не дописывая собственных программ? Может кто то встречал подобную полезную и правильную утилиту конвертации из pdf в txt ? |
|
|
![]() |
![]()
Сообщение
#2
|
|
Специалист ![]() ![]() ![]() ![]() Группа: Активный Пользователь Сообщений: 157 Регистрация: 6.3.2019 Вставить ник Цитата Пользователь №: 3002 Страна: Россия Город: Не указан Пол: Муж. Репутация: ![]() ![]() ![]() |
А надо, чтоб предложения ложились естественным образом в одну строку, с переходом на следующую только вначале абзацев. - заинтересовало (большей частью для 'w3m-копирования') => - беглый поиск --> "источник" : Цитата Код perl -0pe "s/([^\n])\n([^\n])/\1 \2/g;" test.txt > final.txt #насчет 'абзацев' не проверял, но предложения - в одну строку. # на пробу pdf-ку ч/з 'chromium' в txt перекопипастил. |
|
|
![]() ![]() |
![]() |
Текстовая версия | Сейчас: 5.7.2025, 6:47 |