DictionaryForumContacts

 Andrew052

link 16.08.2012 12:54 
Subject: Как убрать дефисы в тексте gen.
Возникла проблема:

При конвертации из пдф в ворд был получен текст с большим количеством дефисов, так как текст был расположен колонками.

Как удалить дефисы из такого текста?

Можно, конечно, найти и заменить "пробел дефис пробел" или "пробел дефис" или "дефис пробел" на "пробел", но в любом случае будут удалены нужные дефисы, т.к. вместо тире в самом тексте афтор поставил дефисы.

 10-4

link 16.08.2012 13:00 
При конвертации вроде бы есть опции что на что заменять. Попробуйте ее найти.

 alk moderator

link 16.08.2012 14:03 
Если в ворде получился текст, где каждая строчка завершается символом абзаца ¶, то нужно выполнить операцию поиск и замена, используя в качестве образца для поиска комбинацию -^p (то есть дефис вставить с клавиатуры, а символ знака абзаца вставить через кнопку Специальный в расширенном диалоговом окне поиска). В поле для замены можно ничего не вставлять, тогда дефисы в конце каждой строки будут удалены.

 Andrew052

link 16.08.2012 14:27 
alk, к счастью, такого нет. В конце строки строит дефис и пробел в случае переноса слова.

 alk moderator

link 16.08.2012 14:49 
как это, такого нет?
В любом случае в конце каждой строки имеется служебный символ переноса строки. Увидеть это можно, включив показ служебных символов: в панели инструментов ворда есть для этого тот самый значок ¶
Тогда станет видно, как оказались отформатированы вставленные из pdf блоки текста. Если по какой-то причине у Вас после дефиса еще и пробел вставляется (никогда такого не встречал), обычный пробел, не какой-то там специальный, то тогда образец для поиска будет -^w^p - то есть в терминах ворда - искать: дефис затем пустое пространство затем знак абзаца, а заменить его на ничто, вот тогда разбитые переносом строчки начнут сливаться в плавный текст без дефисов.

 AsIs

link 16.08.2012 14:55 
во, я только что об этом в другой ветке упоминал. у него там текст в 2 колонки идет. какждая строка заканчивается на [тирепробел]

 Andrew052

link 16.08.2012 15:16 
AsIs, alk,

Честно не понимаю, о чем Вы.

Не хочу Вас грузить, но у меня нет значков ¶. На фига мне значки ¶ то в конверте в конце каждой строки? У меня текст в две колонки. В конце колонки или просто пробел (который обычный такой между словами) или дефис, используемый при переносе слова. И усе. Нет никаких ¶ там.

Копирую колонку в другой ворд - получаю абзацы (если были бы ¶, то абзацев не было бы...), внутри абзацев в тексте дефисы. Хочу их убить, но не знаю как, так как, если попробую убить, то снесу нужные вместе с ними.

P.S.
Я вот чичас руками подписал рядом с [тирепробел] обычный дефис - попробуйте сами - это ж одно и то же:

d the company’s charter capital must be redu-----

 AsIs

link 16.08.2012 15:27 
Об этом:

Солид


ФР8

 AsIs

link 16.08.2012 15:34 
Допустим, мы хотим использовать winalign. Какой файл к этому готов? Правильно, тот, что распознан ФР

 Andrew052

link 16.08.2012 15:47 
AsIs, Вы как-то интересно так сказали - правильно, тот, что распознан ФР? Правильно Вы распознали и растащили по двум вордам. Я тоже распознал и растащил по двум вордам.

Вы потратили 1 час, а я потратил 0 секунд, просто нажав кнопку. Коммент в соседней ветке.

 AsIs

link 16.08.2012 15:54 
я ничего не растаскивал. вы мне не даете уйти. я просто выделил в ФР только английскую область и все. и потом автозаменой убил "мягкий перенос". При поставленной задаче свести в память - этого более чем достаточно.

 AsIs

link 16.08.2012 15:55 
а то, что вы получили за 0 секунд, нужно еще 3 часа растаскивать

 foreigner

link 17.08.2012 5:29 
Воспользуйтесь PDF Transformer и не будет у вас никаких дефисов

 

You need to be logged in to post in the forum