Subject: Как убрать дефисы в тексте gen. Возникла проблема:При конвертации из пдф в ворд был получен текст с большим количеством дефисов, так как текст был расположен колонками. Как удалить дефисы из такого текста? Можно, конечно, найти и заменить "пробел дефис пробел" или "пробел дефис" или "дефис пробел" на "пробел", но в любом случае будут удалены нужные дефисы, т.к. вместо тире в самом тексте афтор поставил дефисы. |
При конвертации вроде бы есть опции что на что заменять. Попробуйте ее найти. |
Если в ворде получился текст, где каждая строчка завершается символом абзаца ¶, то нужно выполнить операцию поиск и замена, используя в качестве образца для поиска комбинацию -^p (то есть дефис вставить с клавиатуры, а символ знака абзаца вставить через кнопку Специальный в расширенном диалоговом окне поиска). В поле для замены можно ничего не вставлять, тогда дефисы в конце каждой строки будут удалены. |
alk, к счастью, такого нет. В конце строки строит дефис и пробел в случае переноса слова. |
как это, такого нет? В любом случае в конце каждой строки имеется служебный символ переноса строки. Увидеть это можно, включив показ служебных символов: в панели инструментов ворда есть для этого тот самый значок ¶ Тогда станет видно, как оказались отформатированы вставленные из pdf блоки текста. Если по какой-то причине у Вас после дефиса еще и пробел вставляется (никогда такого не встречал), обычный пробел, не какой-то там специальный, то тогда образец для поиска будет -^w^p - то есть в терминах ворда - искать: дефис затем пустое пространство затем знак абзаца, а заменить его на ничто, вот тогда разбитые переносом строчки начнут сливаться в плавный текст без дефисов. |
во, я только что об этом в другой ветке упоминал. у него там текст в 2 колонки идет. какждая строка заканчивается на [тирепробел] |
AsIs, alk, Честно не понимаю, о чем Вы. Не хочу Вас грузить, но у меня нет значков ¶. На фига мне значки ¶ то в конверте в конце каждой строки? У меня текст в две колонки. В конце колонки или просто пробел (который обычный такой между словами) или дефис, используемый при переносе слова. И усе. Нет никаких ¶ там. Копирую колонку в другой ворд - получаю абзацы (если были бы ¶, то абзацев не было бы...), внутри абзацев в тексте дефисы. Хочу их убить, но не знаю как, так как, если попробую убить, то снесу нужные вместе с ними. P.S. d the company’s charter capital must be redu----- |
Об этом: Солид
|
Допустим, мы хотим использовать winalign. Какой файл к этому готов? Правильно, тот, что распознан ФР |
AsIs, Вы как-то интересно так сказали - правильно, тот, что распознан ФР? Правильно Вы распознали и растащили по двум вордам. Я тоже распознал и растащил по двум вордам. Вы потратили 1 час, а я потратил 0 секунд, просто нажав кнопку. Коммент в соседней ветке. |
я ничего не растаскивал. вы мне не даете уйти. я просто выделил в ФР только английскую область и все. и потом автозаменой убил "мягкий перенос". При поставленной задаче свести в память - этого более чем достаточно. |
а то, что вы получили за 0 секунд, нужно еще 3 часа растаскивать |
Воспользуйтесь PDF Transformer и не будет у вас никаких дефисов |
You need to be logged in to post in the forum |