Subject: Подготовка текста для создания памяти в Традосе gen.
|
Спасибо, что выложили скрины. А как это можно сделать - выложить скрины ворда? т.к. я не знаю, как выложить скрины, я просто скопировал два куска из двух вордовских файлов. Article 4. Company Name and Location 1. A company must have a full name and may have an abbreviated name in Russian. A company may also have a full and/or abbreviated name in the language of the ethnic groups inhabiting the Russian Federation and/or in any foreign language.The full name of a company in Russian must be comprised of its full name itself and the words “с ограниченной ответственностью” [limited liability company]. The company's abbreviated name in Russian must be comprised of its full or abbreviated name itself and the words “с ограниченной ответственностью” [limited liability company] or their abbreviation – “ООО” [LLC]. The names of a company in Russian and in the languages of the ethnic groups inhabiting the Russian Federation may incorporate any borrowings from foreign languages, as transliterated in Russian or in the languages of the ethnic groups inhabiting the Russian Federation, unless such terms and abbreviations represent the company’s corporate form. (as restated by Federal Law No. 231-FZ dated December 18, 2006) Further requirements to a company name are established by the Civil Code of the Russian Federation. (paragraph added by Federal Law No. 231-FZ dated December 18, 2006) 2. The location of a company is determined by the place of its state registration. (as restated by Federal Law No. 31-FZ dated March 21, 2002) 3. Deleted by Federal Law No. 31-FZ dated March 21, 2002. Статья 4. Фирменное наименование общества и его место нахождения 1. Общество должно иметь полное и вправе иметь сокращенное фирменное наименование на русском языке. Общество вправе иметь также полное и (или) сокращенное фирменное наименование на языках народов Российской Федерации и (или) иностранных языках. Полное фирменное наименование общества на русском языке должно содержать полное наименование общества и слова "с ограниченной ответственностью". Сокращенное фирменное наименование общества на русском языке должно содержать полное или сокращенное наименование общества и слова "с ограниченной ответственностью" или аббревиатуру ООО. Фирменное наименование общества на русском языке и на языках народов Российской Федерации может содержать иноязычные заимствования в русской транскрипции или в транскрипциях языков народов Российской Федерации, за исключением терминов и аббревиатур, отражающих организационно-правовую форму общества. (в ред. Федерального закона от 18.12.2006 N 231-ФЗ) Иные требования к фирменному наименованию общества устанавливаются Гражданским кодексом Российской Федерации. (абзац введен Федеральным законом от 18.12.2006 N 231-ФЗ) 2. Место нахождения общества определяется местом его государственной регистрации. (в ред. Федерального закона от 21.03.2002 N 31-ФЗ) 3. Исключен. Федеральный закон от 21.03.2002 N 31-ФЗ. |
например, через этот сайт http://www.radikal.ru/ Обзор - выбрать джипег - Загрузить, скопипровать ссылку под № 1 и вставить ее в сообщение. Ну так это вы приваели один абзац. То есть придется вот так копи-пастить все 100 страниц для каждого языка... |
То есть, 1) конвертируем файл в ворд То есть, файлы же нужны для использования при создании памяти, правильно? Фишка в том, что не нужно ничего делать в процессе конвертации файла из пдф в ворд, а нужно просто потом их растащить по вордам. Если Вы затрачиваете 1 час на подготовку этих двух файлов, то это быссмыленно, т.к. зачем это делать, если можно просто конвертнуть через Солид то? |
к тому же текст разбит там после слова dated знаками абзаца в нескольких местах. Further requirements to a company name are established by the Civil Code of the Russian Fe- deration. (paragraph added by Federal Law No. 231-FZ dated December 18, 2006) А если бы вы выделили область (занимает 2-3 сек на страницу) в Файнридере, этого бы не было |
AsIs, получается, что нужно будет. Ведь без этого никак. Но это ведь крайне несложно. Нужно просто нажав shift+лев мышь... растащить текст по двум файлам. |
**2) растаскиваем англ и рус части по двум вордам** Вот! Что дольше: область в ФР выделить или растаскивать по кускам в 2 файла? Да еще битые строчки потом соединять, удалять дефисы вместо переносов. Ладно, идти пора. Делайте, как привыкли =) |
то есть 1) Выделить, 2) Скопировать, 3) Перейти в "чистовик", 4) Вставить, 5) Вернуться в "грязный файл" (цикл Солида) - это все быстрее, чем 1) Выделить область распознавания? всё, ушел. (но обещал вернуться...) =) |
AsIs, Я конвертну через ФР1. "Выделить область распознавания?" - у Вас занимало около 1 часа. Действия в Солиде немного быстрее. |
Причем, я никак не могу понять, каким образом дефисы то становятся разными в самом тексте и при переносе слов - это же одинаковые символы в оригинале. |
ну так на то он и ФР8, чтобы отличать дефис от переноса. Действия с 50 старницами у меня заняли 11 минут. Грубо я умножил на 2 для 100 страниц, но это не совсем так, ибо большая часть действий - пакетного характера. Что в 10 страницах перносы поменять, что в 1000, разница не стократная, это ведь понтяно. А вы ноль секунд делали то, что часа 2 надо разносить по файлам и потом еще столько же причесывать текст (убирать разрывы, переносы, поля выравнивать и т.д.) Если вам угодно пари, сейчас меня ничто не отвлекает. Вышлите мне еще 50 страниц из другого пдф, и тогда уж точно все будет честно. Посмотрим... |
че пристали))) |
удачный ник, все завидуем ;))) |
а кто спорит про существование as is? етсь же и контексты с as it is |
эти контексты ругательные и прошу их не применять )) |
есть просто все люди разные, у всех свое восприятие, я вот в этом нике красивое имя прочитал ) |
<< я делаю так: 1) find => special => paragraph mark (ставите 2 paragraph marks) ... >> а если ещё записать этот полезную процедуру как макрос (а этому макросу присвоить ещё потом сочетание клавиш), то тогда будет совсем круть )) |
Прогнал текст через ФР11 -- понравилось действительно больше, чем в Солиде (переносы и дефисы разными символами!, а также нет разрывов разделов и страниц). В связи с этим, в паре участвовать не имеет смыслу. )) Кстати, возможно, захотите обновиться с Выводы: 1. Времени ДЕЙСТВИТЕЛЬНО уходит очень много -- на причесывание получившегося ворда (то есть у меня получился ворд в котором идет английская колонка (уже обычным текстом), а за ней соответствующий русский текст. Так вот приходится удалять русский текст, чтобы получился только английский. 1) Списки распознались как списки, а не как просто цифры, следовательно они могут продолжать друг друга и т.д. Никто не знает, как от этого избавиться? Может перед конвертированием как-нибудь? |
И еще один комментарий. Я в Солиде конвертировал текст целиком, то есть без выделения областей по языкам. В ФР11 сделал то же самое - ошибок вроде не видно. Следовательно, к комментариям AsIs выше: возможно, нет смысла делать это самое выделение отдельных областей, а просто прогонять целиком файл. И, возможно, это применимо к ФР11, но не к ФР8. |
попробуйте поюзать регексы. возможно, отпадет необходимость выполнять ряд операций вручную. |
You need to be logged in to post in the forum |