DictionaryForumContacts

 naiva

1 2 all

link 15.04.2014 3:46 
Subject: OFF: PDF to WORD converter gen.
Вдруг кому пригодится - только что успешно конвертировала (онлайн) файл PDF с таблицами - идеальный Word на выходе.

http://pdfburger.com/pdf-to-word

 Andrei Titov

link 15.04.2014 4:09 
Главное - побольше конфиденциальных материалов скармливать этому конвертеру.

 gni153

link 15.04.2014 4:10 
naiva, Супер!!!

 naiva

link 15.04.2014 5:38 
Вы правы, Андрей, применять следует с осторожностью)

 Aiduza

link 15.04.2014 5:51 
по указанному адресу филиал Викиликс находится, несомненно! :)

 naiva

link 15.04.2014 5:58 
у нас так, Aiduza - кругом враги и они не дремлют)))

 mikhailS

link 15.04.2014 6:10 
кругом "засланцы"! )) Я теперь без гранаты никуда.. (с)

 вася1191

link 15.04.2014 6:28 
2Andrei Titov и остальным а почему вы не верите в их честность?

 вася1191

link 15.04.2014 6:35 
Я вот например пользуюсь https://www.pdftoword.com/
Имхо даже лучше представленного топикстартером сайта.

 AsIs

link 15.04.2014 7:02 
Многое видел, но такое... Не ожидал. Спасибо, naiva!
вася1191, а ваш сервис шестеренками покрутил и сказал: "Something went wrong... file.pdf could not be converted"

 jenny&co

link 15.04.2014 7:06 
AsIs, возможно в вашем файле есть буквы кириллицы, проверьте! Многие тулы на этом спотыкаются. У нас в конторе помнится даже принтер бумагу зажевывал на таких.

 AsIs

link 15.04.2014 7:12 
ни одной. все на английском.
Первый сервис (от naiva) распознал идеально. Правильно расставленные табуляторы, все шрифты, все оттенки заливки сохранены. При этом структура текста довольно сложная. Файнридер бы так не смог.
Второй сервис пытаюсь прогнать трети раз. Ужи и имя файла укоротил до 123.pdf. Итог все тот же - обломанные зубья шестеренок.

 jenny&co

link 15.04.2014 7:14 
простите, но ваше сообщение похоже на рекламу ((

 AsIs

link 15.04.2014 7:17 
Прощаю. Я никогда не пользовался онлайновыми распознавалками и всегда относился к подобным затеям со скепсисом. Но тут реально офигел (ибо не первый день занимаюсь распознаванием и имею жесткие требования к результату распознавания)

 AsIs

link 15.04.2014 7:21 
Сравни:

VS

 jenny&co

link 15.04.2014 7:30 
Ну что ж, если бы не такие мелкие буквы как на первой картинке, было бы очень красноречиво!

 Ma_linka

link 15.04.2014 7:33 
jenny&co, а зачем AsIs'у рекламировать-то? :-) Он же наглядно показал результат.

Спасибо за ссылки!

 AsIs

link 15.04.2014 7:38 
jenny&co, для опытного переводчика, который не понаслышке знает, что такое распознавание и причесывание распознанного текста, этих мелких букв вполне достаточно. Если бы я рядом еще поместил оригинальный пдф, вы бы не смогли сказать, где оригинал, а где результат прогона.
Ma_linka, спасибо за поддержку =) Эти новенькие форумчане такие порой наивные...

 bobe

link 15.04.2014 7:41 
Вполне ... плюсую :)

 Dimking

link 15.04.2014 8:01 
Прожевал пдф на 0,5 мегазнаков, со стилями очень аккуратно (лучше файнридера), но не распознает сноски (а их там 700+ штук).
Файнридер уродует стили, но сноски вставляет правильно.

 glomurka

link 15.04.2014 8:08 
>>Прожевал пдф на 0,5 мегазнаков, со стилями очень аккуратно
в 10-страничном пдф (~14 тыс. знаков, таблицы, графики) насчитал 437 стилей

 Erdferkel

link 15.04.2014 8:30 
Здорово! взяла в закладки! всё воспроизведено идеально!

 Dimking

link 15.04.2014 8:30 
glomurka
насчитал 437 стилей
это у него после моего дока отрыжка

 Tante B

link 15.04.2014 8:42 
заслала таможенную декларацЫю
35 минут, полёт нормальный. ждём-с...

 Val61

link 15.04.2014 8:51 
Действительно, сохраняет исходный формат весьма корректно.

Повторяю вопрос: кто-нибудь уже попробовал ФР12?

 Val61

link 15.04.2014 8:52 
Старинный русский анекдот в тему.

Пилят мужики лес двуручными пилами. Прислали им в помощь японскую
бензопилу. Ну мужики решили ее проверить. Подошли они к то-о-оненькому
деревцу:
- В-вжик,- сказала пили.
- О-о-о! - сказали мужики и решили проверить бензопилу на сосне:
- В-вжик,- сказала пили.
- О-о-о! - сказали мужики и решили проверить бензопилу на то-о-олстенном
дубе:
- В-вжик,- сказала пили.
- О-о-о! - сказали мужики и решили принести железный лом:
- Трх-тх-тхтх... , - сказала пила.
- А-а-а-а! - сказали мужики и пошли пилить лес двуручными пилами...

 Aiduza

link 15.04.2014 8:55 
"сказала пили" - это как? :)

 Сергеич

link 15.04.2014 8:55 
это по Фрейду))

 Val61

link 15.04.2014 8:58 
Нет такого онлайн конвертера, который не смог бы сломать опытный переводчик. О-о-о! - застонал конвертер и все такое. По Фрейду, трх-тх-тхтх.

 Aiduza

link 15.04.2014 8:58 
Вал, я 12-ю версию не пробовал, у меня вроде бы 11-я версия сейчас. А ФР в целом меня устраивает, только вот со сложным форматированием он плохо справляется, ставит кучу текст-боксов, колонок, а можно ведь наверняка это сделать проще. Даже при распознавании "шапки" письма, где адрес отправителя и получателя, начинает мудрить. Но типовые договоры, таблицы переваривает легко, это да.

 Dimking

link 15.04.2014 9:02 
Aiduza
Сервис - опции - вкладка "сохранить" - оформление - форматированный текст

 Aiduza

link 15.04.2014 9:07 
Dimking, это и ежу понятно. Не помогает.

 Val61

link 15.04.2014 9:14 
Где в Файнридере задать, чтобы он повернутый вправо-влево на 90 градусов текст поворачивал бы сам корректно? Каждый повернутый текст-бокс - поворот приходится задавать вручную, т.к. косячит. ФР11.

А вообще я уже наловчился сохранять из ФР не в Ворд, а в пдф (редактируемый) и потом работать в Инфиксе. Понятно, что не всегда и не со всеми файлами такое проканает (каждый пдф - та еще вещь в себе), но с теми, что идут ко мне, работает ОК.

 Dimking

link 15.04.2014 9:26 
Aiduza
ну в этом случае хотя бы боксы не появляются (в колонтитулах разве что).
разрывы колонок, разделов, быстро устраняется автозаменой.

 Aiduza

link 15.04.2014 9:31 
постобработка утомляет - от искусственного интеллекта ожидал большего! :)

 Dimking

link 15.04.2014 9:33 
Айдын, если искусственный интеллект сможет больше, мы останемся без работы :)

 Dmitry G

link 15.04.2014 9:57 
Обязательно.
Гугол уже всерьёз работает над грядущим вживлением себя, любимого, в мозг пользователей. Голос распознаётся, гуглопереводчик совершенствуется...
Не нужны станут не только письменные, но и устные толмачи.
Выход один: копить денги на свечной заводик. В Крыму. )

 Tante B

link 15.04.2014 9:58 
у меня-таки оказался лом...
после часа (примерно) с четвертью мне это наскучило, и я их отрубила

 ttimakina

link 15.04.2014 10:31 
На 80 страницах не очень сложного файла обнаружено несколько нестрашных косяков в таблицах. Остальное порадовало. Спасибо!

 Supa Traslata

link 15.04.2014 12:11 
AsIs ,
RE >>Файнридер бы так не смог.>>
Акробат решает.

 naiva

link 15.04.2014 14:09 
очень рада, что кому-то показалось полезным :)

а то я так обрадовалась результату, что сразу же здесь запостила, а потом испугалась, что вылезет какой-нить подвох...

 kondorsky

link 15.04.2014 17:08 
Настолько, насколько вообще в принципе может быть хорош такой конвертер, мне нравится abby PDF transformer 2.0 (с настройкой "в одну колонку" и без картинок). Следующая версия 3.0 мне понравилась меньше

 Val61

link 15.04.2014 17:32 
Кстати, если ФР11 справляется плохо, я включаю старый добрый ФР8 и иногда бывает так, что он справляется существенно лучше. ПДФ Трансформер пробовал, мне не по руке (не по задачам). Это всего лишь ФР с частично обрезанным функционалом.

 kondorsky

link 15.04.2014 17:41 
Валер, но он почему-то конвертирует качественнее... Не знаю почему. А если мне надо собрать ПДФ из всяких джипегов, тифов и прочих бе-эм-пе, я использую (не поверите!) старый Open Office еще до его передачи Апаче. При всех его багах, с этой конкретной задачей он справляется отлично!

 Rossinka

link 15.04.2014 18:48 
Обрадовалась этому топику: нужно распознать один мануал в пдф.
ФР10 распознал, но Традос его не вопринимает (Традос7), то есть, не создает файл-таргет (break error). Я всегда проверяю, прежде чем начать перевод.

Зря обрадовалась.
К сожалению, этот pdfburger мой файл не съел!
Выдал файл с кракозябрами, а текст-то на английском был!
Впервые вижу такой ужас.

Так что кому-то повезло, а мне нет.

 Val61

link 15.04.2014 22:03 
Соорудил тут ролик про перевод файлов pdf в CAT-программе с помощью Infix PDF Editor, пытался выложить на ютюб, но что-то только в низком разрешении загружается, ничего не видно. Какие-то настройки где-то сбились.

Кинул пока на яндекс, до поиска и устранения проблем. 27 минут, весит под 800 мегабайт. Скачивайте, смотрите, вдруг кому-то полезно будет. Отзывы и вопросы приветствуются.

http://yadi.sk/d/e9nyhwWRMXQzv

 Val61

link 15.04.2014 23:13 
Вот, добавилось наконец-то нормально

https://www.youtube.com/watch?v=_Js_KXCuQKA

 Ronny

link 25.04.2014 16:12 
PFD в виде набора картинок (сканированные страницы) не взял. Вернее, выдал rtf размером в 52 мб, в котором на каждой странице вставлена картинка :)

 Erdferkel

link 25.04.2014 16:16 
так сканированные и выдаются как графика, я тоже уже попробовала :-)

 Enote

link 25.04.2014 17:14 
Спасибо за ссылку
ПДФ с текстовым слоем в Ворд переводит криво, для работы не годится, хотя выглядит красиво.
А вот из Ворда в ПДФ меня пару раз выручил - вывел чистый ПДФ из кривых макетов, которые у меня бились на куски листов

 amateur-1

link 25.04.2014 19:35 
А мой документ не перевелся в ворд((((

 amateur-1

link 25.04.2014 19:47 
наверное потому, что там и рисунки были.

 Val61

link 25.04.2014 20:57 
Если у вас файл pdf содержит как редактируемый текст, так и картинки (особенно - картинки с текстом, который нужно переводить), то вам необходимо:

1. Загрузить этот файл в Файнридер.
2. В ФР разметить каждую страницу как картинку. Целиком. Полностью.
3. Внутри получившейся картинки инструментом "Текст" разметить (повыделять текст-боксами) тот текст, который требует редактирования/перевода.
4. Распознать все.
5. (Внимание!) Сохранить получившееся как pdf!
6. У вас получится полностью редактируемый pdf с сохранением оригинала макета.
7. Можно загружать в Инфикс.
8. Не забыть в Инфиксе поменять несистемные шрифты на системные, удалить разрывы строк, перекомпоновать текст-боксы.
9. Можно экспортировать xml в кошку.

 naiva

link 26.04.2014 6:01 
Спасибо, Val61!

 Rami88

link 2.06.2014 10:03 
Внесу и я свою лепту.
Не знаю насчёт больших пдф, но маленькие файлики на 2-3 страницы (но с кучей картинок, полей и прочей ерунды) распарсил просто на ура. Очень доволен. naiva, спасибо большое за ссылку.

 awoman

link 2.06.2014 12:52 
Кто-нибудь пробовал Able2Extract pdf convertor?

http://www.investintech.com/prod_a2e.htm

 Val61

link 2.06.2014 13:55 
Удивляет, почему один и тот же текст на разных страницах одного и того же документа (например, в колонтитулах) Файнридер иногда распознает правильно, а иногда с ошибкой, причем, частью с одной и той же ошибкой, а частью - с разными.

 Inquisitive Interpreter

link 22.02.2016 12:37 
Здесь неплохой онлайн конвертер

http://go4convert.com/ToDoc_Ru

 wise crocodile

link 22.02.2016 12:59 
Конвертеров много, проблема одна :-))

 Энигма

link 22.02.2016 15:00 
Зачем вообще конвертер, когда есть Infix editor?

 Val61

link 22.02.2016 17:01 
Зачем вообще конвертер, когда есть Infix editor?

Сам по себе Инфикс не может решить всех проблем с обработкой PDF. Плюс, недавно я узнал, что некоторые заказчики, направляя в перевод документы в формате PDF, желают получать переводы в формате MSOffice (Ворд и т.д.).

 redseasnorkel

link 22.02.2016 17:05 
чем же так нравится Infix editor?

 wise crocodile

link 22.02.2016 18:00 
Инфикс годится только для ПДФ с текстовым слоем и только если реально всунуть перевод в отведенное место. Работа в программе неудобна, много непроизводительных затрат времени

 Энигма

link 22.02.2016 20:24 
А мне все удобно и получается красиво с сохранением верстки. Раньше хорошо было в Мемсорс закидывать pdf. А теперь Мемсорс почему-то больше не поддерживает pdf. То есть, переводить-то можно, только выгружается перевод в txt. А раньше один в один формат pdf сохранялся.
>>Инфикс годится только для ПДФ с текстовым слоем и только если реально всунуть перевод в отведенное место. Работа в программе неудобна, много непроизводительных затрат времени

Уж всяко удобнее и меньше времени занимает, чем конвертация в Ворд с последующими мучениями.

Get short URL | Pages 1 2 all