DictionaryForumContacts

 Геннадий1

link 6.05.2006 13:11 
Subject: кто поможет преобразовать 34 стр pdf в Word?
Потратил ночь, но не удалось скачать из сети Акробат 6-ой версии, как того требует pdf2Word v.1.4(1.6), а Solid Convector, о котором тут говорили, оказывается не запускается на Win 98. К сожаленью, времени на дальнейшие экспременты не остается.

Спасибо всем

 Brains

link 6.05.2006 13:13 
Для чего Вам это нужно?

 Геннадий1

link 6.05.2006 13:16 
чтобы переводить было удобно и незнакомые слова искать - копировать их и вставлять

 freelancer_06

link 6.05.2006 13:17 
давайте я попробую
мой e-mail zinger_01@inbox.ru

 vas_dem

link 6.05.2006 13:18 
Иногда, если не запрещено автором, помогает простое копирование. Выделяете как текст и копируете в Уорд. Если есть файнридер, он поможет

 Алвико

link 6.05.2006 13:19 
обычно я пдф файлы ввожу в файн ридер (если это конечно текстовая информация), распознаю, затем только в ворд. что не распозналось, корректирую вручную

 Brains

link 6.05.2006 13:20 
А-а… тогда пускай freelancer_06 пробует.

 Геннадий1

link 6.05.2006 13:20 
Фрилансер, я отправил:))

 Геннадий1

link 6.05.2006 13:23 
нет простое копирование не проходит - информация нетекстовая

 Enote

link 6.05.2006 13:31 
Дык если ПДФ сканированный - только Файн Ридер или другая программа OCR
Геннадий1, Adobe Acrobat professional 6.0 - это то, что вы ищете?

 Геннадий1

link 6.05.2006 13:59 
Да, если это Adobe Acrobat Reader 6.0 , я его искал. Вчера целую ночь, не смог скачать - как только загружал 5-8 Мбайт из 16, появляется досадное сообщение - Сброшено подключение к серверу! Я полусонный , уйму времени и денег потратил на этом деле. Но теперь, Екатерина, выходит и Конвертор тоже бесполезен для отсканированных файлов. Может теперь Файн попробовать скачать, а что такое OCR - не знаю. Спасибо всем за сочувствие:))

 Enote

link 6.05.2006 14:48 
Adobe Acrobat professional 6.0 или 7.0 - это не читатель Reader, а писатель, то есть гораздо лучше. Рекомендую купить пиратский диск
OCR - программа для оптического распознавания символов (текста)
размер папки Abbyy FineReader у меня 180 Мбайт, так что лучше тоже искать у пиратов

 alk moderator

link 6.05.2006 14:52 
OCR - Optical Character Recognition
Finereader будет тупо распознавать ваши страницы так, как если бы вы их распечатали и положили на сканер, чтобы их в Finereader'е распознать.
Adobe выпускает коммерческую программу которая называется Adobe Acrobat, умеющую создавать pdf из любого файла, способного быть распечатанным.
Для чтения получившихся pdf выпускается бесплатный просмотрщик - Adobe Reader, он умеет только смотреть полученные файлы и печатать их. В нем же реализованы некоторые примитивные функции вроде копирования выделенного фрагмента (текст, текст в колонке, изображение) в буфер, но сам исходный документ может иметь органичения на подобные операции, да и много так не скопируешь.
Не знаю, честно говоря, как может помочь Adobe Acrobat professional в деле превращения pdf в текст, потому что никогда им не пользовался.
Для создания pdf использую очень неплохую программу pdfcreator.
Самый простой способ при затруднениях с pdf, когда нужно извлечь из него текст - это действительно наверное распечатать pdf на принтере, а потом отсканировать и распознать в Finereader'е. Ну, через задницу, конечно...

 Enote

link 6.05.2006 15:08 
2 alk
для сканированного PDF никакой Адоб не поможет, там же нет текста. Только через OCR

 Brains

link 6.05.2006 15:09 
Enote, Enote, добрый Вы человек. Да пребудет в Ваших руках побольше бисера. Вы ж видите, аццкир за сутки качалова не удосужился узнать, а что и зачем, сосно, качает. Надо ему ссылочек, ссылочек… :-)

 Brains

link 6.05.2006 15:38 
2 alk
Adobe выпускает коммерческую программу которая называется Adobe Acrobat, умеющую создавать pdf из любого файла, способного быть распечатанным.
Интересно, где Вы этой фантастики начитываетесь? Сам Acrobat вообще ничего не умеет создавать — создаёт его отдельный модуль Distiller (и совсем уж страшный Writer). И, конечно же, не из любого файла, а из последовательности команд Postscript, генерируемых либо драйвером виртуального принтера, либо DLL, поставляемой с программой (когда лицензированной, а когда и сторонней).
Самый простой способ при затруднениях с pdf, когда нужно извлечь из него текст - это действительно наверное распечатать pdf на принтере, а потом отсканировать и распознать в Finereader'е. Ну, через задницу, конечно...
Действительно: печатать и сканировать-то зачем? Почему просто не распознать? Ну, это… традиционным путём? :-)

 alk moderator

link 6.05.2006 15:45 
Я обращал свой вопрос по поводу Acrobat Prof. Мухамедеевой Екатерине.
Про сканированный pdf разговора нет, а несканированный, нормальный что, позволяет себя обратно декомпилировать средствами этого Акробата?
Что-то я сомневаюся, иначе не пытались бы продавать программульки вроде этой
http://www.foxitsoftware.com/pdf/pe_intro.php
За 99 у.е. полный тебе набор удовольствий для редактирования pdf.
Помнится в форуме мы это уже обсуждали, и кто-то даже обещался посмотреть на это чудо, но канул.

Brains - я знаю, как делаются pdf'ы, просто пытался простым языком сформулировать главный принцип того же дистиллера - хочешь получить pdf, отправь файл на печать специальному принтеру.
Про печатать и сканировать - это когда документ pdf весь закрыт для любых действий, кроме печати.

 Enote

link 6.05.2006 15:58 
да, случай запущенный, собственно и вопрос поставлен был неправильно - при чем здесь ПДФ, если файл сканированный. От ПДФ там только 3 буквы и остались.
2 alk
Acrobat 6 позволяет сохранить "правильный" ПДФ в форматах RTF, DOC, HTML, plain txt и еще в каких-то графических. Естественно, исходное форматирование он восстановить не может - всё уже выведено, но что-то похожее изображает. Насчёт всяких сторонних приблуд слышал версию, что Адоб не сам сделал обратное преобразование, а тоже на базе какой-то сторонней приблуды, причем вроде не самой лучшей.

 туманов

link 6.05.2006 19:44 
посетите ссылку:
http://www.abbyy.ua/index.php?m=2:3:1&p=abbyy/fr/fr8-top.html

в вашем случае поможет эта программа.

http://www.abbyy.ua/index.php?m=2:3:1:1&p=abbyy/fr/fr8-pro.html

демо версия тут:
http://www.abbyy.ua/index.php?m=2:3:1:8&p=abbyy/fr/fr8-downloads.html

 alk moderator

link 6.05.2006 20:18 
Самое удивительное, что компания Abbyy ничтоже сумняшеся включила в состав своего FR совершенно сторонний компонент, кстати opensource'овский и бесплатный, который собственно и преобразует pdf'ы в растровые изображения, кои сам FR уже со всеми присущими ему достоинствами распознает.
В этом легко убедится, обнаружив в дебрях каталогов установленного файнридера отдельную папку с названием типа pdf2ps (название точно не помню), где живет кусок некоммерческого ghostscipt'а.

 Геннадий1

link 6.05.2006 20:22 
Да, я поставил неправильно вопрос, потому что плохо разбираюсь в этом!

 Геннадий1

link 6.05.2006 20:31 
Уважаемый Туманов, спасибо вам за ссылки. Если можно, скажите, пожалуйста, позволяет ли демоверсия копировать текст или мне не стоит его скачивать?

 Геннадий1

link 6.05.2006 20:41 
И все-таки! Позволит ли FR распознать отсканированный текст или нет?

 серёга

link 6.05.2006 20:48 
ФР имхо для распознавания отсканированного текста и создавался...

 Геннадий1

link 6.05.2006 21:01 
Серега! Тут высказывают совершенно разные мнения, я уж не знаю, как быть!

 alk moderator

link 6.05.2006 21:25 
Геннадий1 - никаких сомнений, Finereader позволяет распознавать текст внутри pdf-файла. Демоверсия, afaik, имеет 30-дневный период работы. Можете установить ее и попробовать подсунуть FR в качестве входного файла документ pdf. Он будет перекодирован файнридером и распознан также, как он это делает с файлами типа tif, jpg и отсканированными документами. На выходе получите обычный текст, даже с сохранением форматирования, если это требуется, который можно сразу передать в Word.
Недостаток демоверсии (возможно это уже исправлено) - она создает в реестре компьютера скрытые записи, которые и используются для определения времени работы на данной машине. По истечении 30-дневого срока даже при удалении программы с компьютера записи эти остаются и препятствуют полноценной работе даже установленной впоследствии коммерческой, купленной версии. Выдается сообщение, что тестовый период закончен и программа заканчивает работу принудительно. Еще раз повторю, возможно сейчас уже это не так, но раньше с таким приходилось сталкиваться.

 Геннадий1

link 6.05.2006 21:35 
alk - СПАСИБО - я попробую:)) О результатах сообщу..

 Геннадий1

link 6.05.2006 22:03 
Скачал - в конце установки, появилось сообщение = неподдерживаемая версия - все потерялось:((

 Геннадий1

link 6.05.2006 22:04 
ну не везет мне

 Геннадий1

link 6.05.2006 22:14 
почему разработчики не предупреждают об этом до скачивания, все таки 40 МБ для меня значительный

 Brains

link 7.05.2006 0:24 
2 alk
Я обращал свой вопрос по поводу Acrobat Prof. Мухамедеевой Екатерине.
Про сканированный pdf разговора нет, а несканированный, нормальный что, позволяет себя обратно декомпилировать средствами этого Акробата?
Декомпилировать обратно — это в каком смысле? Что-то не пойму. Снова *.ps или *.eps из него отогнать? Дык это и Reader замечательно делает.
Что-то я сомневаюся, иначе не пытались бы продавать программульки вроде этой
http://www.foxitsoftware.com/pdf/pe_intro.php
За 99 у.е. полный тебе набор удовольствий для редактирования pdf.
Помнится в форуме мы это уже обсуждали, и кто-то даже обещался посмотреть на это чудо, но канул.
Странная логика. Вернее, странная она с учётом реалий. Ведь тот факт, что OpenOffice.org 2.0 вообще раздаётся даром, и по сей день не отменил продаж MS Office 2003 Pro за почти 300 долларов. У меня, казла вримьон застоя, этому тоже не находится объяснения, но вот имеет же место быть такая упрямая вещь…
Продаются они, в частности, среди прочего ещё и потому, что нормальный, действительно полнофункциональный редактор PDF — Enfocus Pitstop Professional, навешиваемый на Acrobat в виде модуля расширения — стоит в 10 раз дороже. Правда, он и умеет во столько же раз больше, и делает это, подозреваю, вдвое лучше.
Brains - я знаю, как делаются pdf'ы, просто пытался простым языком сформулировать главный принцип того же дистиллера - хочешь получить pdf, отправь файл на печать специальному принтеру.
Любому пристойному принтеру, alk. Любому; причём не принтеру даже, а его драйверу, поскольку аппаратные генераторы Postscript уже, насколько я знаю, вымерли окончательно. Пристойный в данном контексте означает использующий в качестве языка управления печатью не PCL (и уж, конечно же, не Windows GDI), а всё тот же Postscript. Acrobat Distiller же это всего лишь интерпретатор команд Postscript, каковому интерпретатору существует немало аналогов от сторонних фирм.
Про печатать и сканировать - это когда документ pdf весь закрыт для любых действий, кроме печати.
Так вот я ж про то и спросил: на что удалять гланды автогеном через сфинктер, когда можно просто напечатать его в файл и уже оттуда то ли снова отдистиллить в PDF, то ли напрямую отрастрировать. Когда-то очень давно приходилось заниматься и такими глупостями, но ведь и они из разряда экзотики: те, кто вообще знает о том, что файл следует запереть, по этой самой причине как раз печать в первую очередь и блокируют.

 Brains

link 7.05.2006 0:34 
2 alk
По истечении 30-дневого срока даже при удалении программы с компьютера записи эти остаются и препятствуют полноценной работе даже установленной впоследствии коммерческой, купленной версии. Выдается сообщение, что тестовый период закончен и программа заканчивает работу принудительно.
Ну, это сильно зависит от того, кто и как ставит; у меня такое, например, невозможно в принципе, и у сотен, если не тысяч других тоже.
Но мы тут плохому договорились не учить. ;-)

 Brains

link 7.05.2006 0:42 
2 Геннадий1
Скачал - в конце установки, появилось сообщение = неподдерживаемая версия - все потерялось:((
Это уже становится забавным! Чьё сообщение? Неподдерживаемая версия чего и чем она неподдерживаемая? И что всё и где потерялось?

 Brains

link 7.05.2006 1:02 
2 Enote
да, случай запущенный, …
Помните, я там наверху насчёт сцылочек пошутил? А ведь туманов это всерьёз воспринял. С прежними результатами. Ёжики кололись и плакали, но продолжали есть кактус… ;-)
Естественно, исходное форматирование он восстановить не может - всё уже выведено, но что-то похожее изображает.
Из правильного PDF он как раз форматирование и сохраняет, то есть если он и в том смысле правильный, что даже шрифтовые ресурсы в нём полностью внедрены, да ещё и с неизменёнными наименованиями гарнитур (чего здравомыслящие люди обычно, напротив, избегают). Только прежде именно они должны быть установлены на самой машине…
Что и куда там у Вас выведено? Вот вёрстку, если таковая имела место, он сохранить не может: ну какая, к чёрту, вёрстка в формате текстового редактора? Сами поползновения такие вредны, и природа за них карает, слава тебе, осподи.

 Геннадий1

link 7.05.2006 22:03 
Достал в городе FR 7 версии. То же не помогает с PDF файлами , там же BBYY FineReader 7.0 Professional Edition позволяет редактировать pdf , но не смог копировать без активации. Брейн, то что я вам говорил правда!

 Brains

link 7.05.2006 22:44 
2 Геннадий1
Достал в городе FR 7 версии. То же не помогает с PDF файлами ,…
Информативно…
…там же BBYY FineReader 7.0 Professional Edition позволяет редактировать pdf , но не смог копировать без активации.
Активируйте, если только в этом грабли.
Брейн, то что я вам говорил правда!
Я не высказывал сомнений… как минимум, в Вашей искренности.

 Геннадий1

link 7.05.2006 22:46 
А как активировать?

 Brains

link 7.05.2006 23:17 
Обычно это делают тремя путями: посредством прямого взлома защиты программы от незаконного использования; путём ручной правки реестра Windows с той же целью; самым неочевидным способом — легального приобретения программного продукта и ввода регистрационных кодов.

 

You need to be logged in to post in the forum