IPB

Здравствуйте, гость ( Вход | Регистрация )

 
Ответить в эту темуОткрыть новую тему
> Ищу программу, Полезные программы
Поделиться
rol
сообщение 8.3.2024, 22:06
Сообщение #1


Мастер
******

Группа: Активный Пользователь
Сообщений: 509
Регистрация: 29.1.2014
Вставить ник
Цитата
Пользователь №: 2504
Страна: Россия
Город: Не указан
Пол: Муж.



Репутация: 3


Открываю тему поиском программы корректной конвертации файла.pdf в файл.txt или файл.doc
Дело в том, что все которые мне попадаются в инете программы, предложения текста принудительно переносятся на новую строку, так же, как в исходном pdf-файле.
А надо, чтоб предложения ложились естественным образом в одну строку, с переходом на следующую только вначале абзацев.

Такая необходимость возникла всвязи с тем, что авторы зачастую присылают на конкурс рассказы в pdf-файлах, а при попытке нормально разместить его содержание на сайте с обломаными предложениями и нелепыми переносами выглядит безобразно.
Вынужден ручками редактировать каждую строку перед публикацией. Но сколькож можно!)) Хорошо если тексты небольшие. Но ведь присылают и под сто страниц!

Посоветуйте пожалуйста что нибудь не дописывая собственных программ? Может кто то встречал подобную полезную и правильную утилиту конвертации из pdf в txt ?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
ИВК
сообщение 8.3.2024, 22:32
Сообщение #2


Профессионал
*******

Группа: Глоб. Модератор
Сообщений: 10058
Регистрация: 22.6.2009
Вставить ник
Цитата
Из: Онега
Пользователь №: 1352
Страна: Россия
Город: Не указан
Пол: Муж.



Репутация: 30


Пожалуй, тему лучше перенести в другой раздел, но ладно, это успеется. А вообще подтверждаю актуальность вопроса. Собственно, речь о рассказах, присылаемых на наш конкурс фантастики. Да, я понимаю, что писать рассказ прямо в pdf — достаточно странное занятие, но факт есть факт: некоторые именно так и делают, а потом начинаются проблемы, о которых тут сказал топикстартер. Сам я с таким не сталкивался и ничего посоветовать не могу. Надеюсь, что кто-то подскажет.


--------------------
Не пью, не курю, не смотрю телевизор, не пользуюсь Windows
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
sfs
сообщение 8.3.2024, 23:25
Сообщение #3


Любитель
***

Группа: Активный Пользователь
Сообщений: 84
Регистрация: 5.3.2024
Вставить ник
Цитата
Пользователь №: 3217
Страна: Россия
Город: Не указан
Пол: Муж.



Репутация: 1


https://code-industry.net/free-pdf-editor/
https://github.com/pdf2htmlEX/pdf2htmlEX
https://www.unixuser.org/~euske/python/pdfminer/
пробовали?
Если надо просто убрать перевод строки в txt:
Код
tr '\n' ' ' < filename

Если более сложное - можно попробовать припахать chatgpt


--------------------
Мой Alt Сизиф репо
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
knn
сообщение 27.3.2024, 13:16
Сообщение #4


Специалист
****

Группа: Активный Пользователь
Сообщений: 157
Регистрация: 6.3.2019
Вставить ник
Цитата
Пользователь №: 3002
Страна: Россия
Город: Не указан
Пол: Муж.



Репутация: 2


Цитата(rol @ 8.3.2024, 22:06) *
А надо, чтоб предложения ложились естественным образом в одну строку, с переходом на следующую только вначале абзацев.

- заинтересовало (большей частью для 'w3m-копирования') =>
- беглый поиск --> "источник" :
Цитата
Код
perl -0pe "s/([^\n])\n([^\n])/\1 \2/g;" test.txt > final.txt

#насчет 'абзацев' не проверял, но предложения - в одну строку.
# на пробу pdf-ку ч/з 'chromium' в txt перекопипастил.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
knn
сообщение 1.5.2024, 8:54
Сообщение #5


Специалист
****

Группа: Активный Пользователь
Сообщений: 157
Регистрация: 6.3.2019
Вставить ник
Цитата
Пользователь №: 3002
Страна: Россия
Город: Не указан
Пол: Муж.



Репутация: 2


если -
Цитата(rol @ 8.3.2024, 22:06) *
... что нибудь не дописывая собственных программ?

- то можно:
из Chromium --> скопипастить в 'MyTetra' ;
MyTetra --> (пр.: ) Leafpad.
# но "абзацев" - нет .
# в 'MyTetra-редактореЗаметок' также можно и "Вставить только текст" - это с 'переносами строк' (пр.: в таком случае для кода из pdf-ки)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения

Ответить в эту темуОткрыть новую тему
( Гостей: 1 )
Пользователей: 0

 



RSS Текстовая версия Сейчас: 23.6.2024, 11:32