Subject: OFF: PDF to WORD converter gen. Вдруг кому пригодится - только что успешно конвертировала (онлайн) файл PDF с таблицами - идеальный Word на выходе. |
|
link 15.04.2014 4:09 |
Главное - побольше конфиденциальных материалов скармливать этому конвертеру. |
naiva, Супер!!! |
Вы правы, Андрей, применять следует с осторожностью) |
по указанному адресу филиал Викиликс находится, несомненно! :) |
у нас так, Aiduza - кругом враги и они не дремлют))) |
кругом "засланцы"! )) Я теперь без гранаты никуда.. (с) |
2Andrei Titov и остальным а почему вы не верите в их честность? |
Я вот например пользуюсь https://www.pdftoword.com/ Имхо даже лучше представленного топикстартером сайта. |
Многое видел, но такое... Не ожидал. Спасибо, naiva! вася1191, а ваш сервис шестеренками покрутил и сказал: "Something went wrong... file.pdf could not be converted" |
AsIs, возможно в вашем файле есть буквы кириллицы, проверьте! Многие тулы на этом спотыкаются. У нас в конторе помнится даже принтер бумагу зажевывал на таких. |
ни одной. все на английском. Первый сервис (от naiva) распознал идеально. Правильно расставленные табуляторы, все шрифты, все оттенки заливки сохранены. При этом структура текста довольно сложная. Файнридер бы так не смог. Второй сервис пытаюсь прогнать трети раз. Ужи и имя файла укоротил до 123.pdf. Итог все тот же - обломанные зубья шестеренок. |
простите, но ваше сообщение похоже на рекламу (( |
Прощаю. Я никогда не пользовался онлайновыми распознавалками и всегда относился к подобным затеям со скепсисом. Но тут реально офигел (ибо не первый день занимаюсь распознаванием и имею жесткие требования к результату распознавания) |
Ну что ж, если бы не такие мелкие буквы как на первой картинке, было бы очень красноречиво! |
jenny&co, а зачем AsIs'у рекламировать-то? :-) Он же наглядно показал результат. Спасибо за ссылки! |
jenny&co, для опытного переводчика, который не понаслышке знает, что такое распознавание и причесывание распознанного текста, этих мелких букв вполне достаточно. Если бы я рядом еще поместил оригинальный пдф, вы бы не смогли сказать, где оригинал, а где результат прогона. Ma_linka, спасибо за поддержку =) Эти новенькие форумчане такие порой наивные... |
Вполне ... плюсую :) |
Прожевал пдф на 0,5 мегазнаков, со стилями очень аккуратно (лучше файнридера), но не распознает сноски (а их там 700+ штук). Файнридер уродует стили, но сноски вставляет правильно. |
>>Прожевал пдф на 0,5 мегазнаков, со стилями очень аккуратно в 10-страничном пдф (~14 тыс. знаков, таблицы, графики) насчитал 437 стилей |
Здорово! взяла в закладки! всё воспроизведено идеально! |
glomurka насчитал 437 стилей это у него после моего дока отрыжка |
заслала таможенную декларацЫю 35 минут, полёт нормальный. ждём-с... |
Действительно, сохраняет исходный формат весьма корректно. Повторяю вопрос: кто-нибудь уже попробовал ФР12? |
Старинный русский анекдот в тему. Пилят мужики лес двуручными пилами. Прислали им в помощь японскую |
"сказала пили" - это как? :) |
это по Фрейду)) |
Нет такого онлайн конвертера, который не смог бы сломать опытный переводчик. О-о-о! - застонал конвертер и все такое. По Фрейду, трх-тх-тхтх. |
Вал, я 12-ю версию не пробовал, у меня вроде бы 11-я версия сейчас. А ФР в целом меня устраивает, только вот со сложным форматированием он плохо справляется, ставит кучу текст-боксов, колонок, а можно ведь наверняка это сделать проще. Даже при распознавании "шапки" письма, где адрес отправителя и получателя, начинает мудрить. Но типовые договоры, таблицы переваривает легко, это да. |
Aiduza Сервис - опции - вкладка "сохранить" - оформление - форматированный текст |
Dimking, это и ежу понятно. Не помогает. |
Где в Файнридере задать, чтобы он повернутый вправо-влево на 90 градусов текст поворачивал бы сам корректно? Каждый повернутый текст-бокс - поворот приходится задавать вручную, т.к. косячит. ФР11. А вообще я уже наловчился сохранять из ФР не в Ворд, а в пдф (редактируемый) и потом работать в Инфиксе. Понятно, что не всегда и не со всеми файлами такое проканает (каждый пдф - та еще вещь в себе), но с теми, что идут ко мне, работает ОК. |
Aiduza ну в этом случае хотя бы боксы не появляются (в колонтитулах разве что). разрывы колонок, разделов, быстро устраняется автозаменой. |
постобработка утомляет - от искусственного интеллекта ожидал большего! :) |
Айдын, если искусственный интеллект сможет больше, мы останемся без работы :) |
Обязательно. Гугол уже всерьёз работает над грядущим вживлением себя, любимого, в мозг пользователей. Голос распознаётся, гуглопереводчик совершенствуется... Не нужны станут не только письменные, но и устные толмачи. Выход один: копить денги на свечной заводик. В Крыму. ) |
у меня-таки оказался лом... после часа (примерно) с четвертью мне это наскучило, и я их отрубила |
На 80 страницах не очень сложного файла обнаружено несколько нестрашных косяков в таблицах. Остальное порадовало. Спасибо! |
|
link 15.04.2014 12:11 |
AsIs , RE >>Файнридер бы так не смог.>> Акробат решает. |
очень рада, что кому-то показалось полезным :) а то я так обрадовалась результату, что сразу же здесь запостила, а потом испугалась, что вылезет какой-нить подвох... |
Настолько, насколько вообще в принципе может быть хорош такой конвертер, мне нравится abby PDF transformer 2.0 (с настройкой "в одну колонку" и без картинок). Следующая версия 3.0 мне понравилась меньше |
Кстати, если ФР11 справляется плохо, я включаю старый добрый ФР8 и иногда бывает так, что он справляется существенно лучше. ПДФ Трансформер пробовал, мне не по руке (не по задачам). Это всего лишь ФР с частично обрезанным функционалом. |
Валер, но он почему-то конвертирует качественнее... Не знаю почему. А если мне надо собрать ПДФ из всяких джипегов, тифов и прочих бе-эм-пе, я использую (не поверите!) старый Open Office еще до его передачи Апаче. При всех его багах, с этой конкретной задачей он справляется отлично! |
Обрадовалась этому топику: нужно распознать один мануал в пдф. ФР10 распознал, но Традос его не вопринимает (Традос7), то есть, не создает файл-таргет (break error). Я всегда проверяю, прежде чем начать перевод. Зря обрадовалась. Так что кому-то повезло, а мне нет. |
Соорудил тут ролик про перевод файлов pdf в CAT-программе с помощью Infix PDF Editor, пытался выложить на ютюб, но что-то только в низком разрешении загружается, ничего не видно. Какие-то настройки где-то сбились. Кинул пока на яндекс, до поиска и устранения проблем. 27 минут, весит под 800 мегабайт. Скачивайте, смотрите, вдруг кому-то полезно будет. Отзывы и вопросы приветствуются. |
PFD в виде набора картинок (сканированные страницы) не взял. Вернее, выдал rtf размером в 52 мб, в котором на каждой странице вставлена картинка :) |
так сканированные и выдаются как графика, я тоже уже попробовала :-) |
Спасибо за ссылку ПДФ с текстовым слоем в Ворд переводит криво, для работы не годится, хотя выглядит красиво. А вот из Ворда в ПДФ меня пару раз выручил - вывел чистый ПДФ из кривых макетов, которые у меня бились на куски листов |
А мой документ не перевелся в ворд(((( |
наверное потому, что там и рисунки были. |
Если у вас файл pdf содержит как редактируемый текст, так и картинки (особенно - картинки с текстом, который нужно переводить), то вам необходимо: 1. Загрузить этот файл в Файнридер. |
Спасибо, Val61! |
Внесу и я свою лепту. Не знаю насчёт больших пдф, но маленькие файлики на 2-3 страницы (но с кучей картинок, полей и прочей ерунды) распарсил просто на ура. Очень доволен. naiva, спасибо большое за ссылку. |
Удивляет, почему один и тот же текст на разных страницах одного и того же документа (например, в колонтитулах) Файнридер иногда распознает правильно, а иногда с ошибкой, причем, частью с одной и той же ошибкой, а частью - с разными. |
|
link 22.02.2016 12:37 |
|
link 22.02.2016 12:59 |
Конвертеров много, проблема одна :-)) |
Зачем вообще конвертер, когда есть Infix editor? |
Зачем вообще конвертер, когда есть Infix editor? Сам по себе Инфикс не может решить всех проблем с обработкой PDF. Плюс, недавно я узнал, что некоторые заказчики, направляя в перевод документы в формате PDF, желают получать переводы в формате MSOffice (Ворд и т.д.). |
|
link 22.02.2016 17:05 |
чем же так нравится Infix editor? |
|
link 22.02.2016 18:00 |
Инфикс годится только для ПДФ с текстовым слоем и только если реально всунуть перевод в отведенное место. Работа в программе неудобна, много непроизводительных затрат времени |
А мне все удобно и получается красиво с сохранением верстки. Раньше хорошо было в Мемсорс закидывать pdf. А теперь Мемсорс почему-то больше не поддерживает pdf. То есть, переводить-то можно, только выгружается перевод в txt. А раньше один в один формат pdf сохранялся. >>Инфикс годится только для ПДФ с текстовым слоем и только если реально всунуть перевод в отведенное место. Работа в программе неудобна, много непроизводительных затрат времени Уж всяко удобнее и меньше времени занимает, чем конвертация в Ворд с последующими мучениями. |