DictionaryForumContacts

 ttimakina

link 20.11.2012 15:25 
Subject: OFF: системы автоматического перевода gen.
Коллеги, вышел спор, переходящий в рукопашную :) Пожалуйста, помогите разрешить. Для этого ответьте на вопрос - используете ли вы системы автоматического перевода и какой прмерно процент работы вы в них выполняете (допустим, в среднем за год).
Мне кажется, что больше всего такие программы полезны для "юристов". Это так?

 edasi

link 20.11.2012 15:53 
не существует машинного перевода
машинный перевод невозможен в принципе
машинный перевод это оксюморон

 ttimakina

link 20.11.2012 15:58 
edasi, тут даже спорить не о чем :) вопрос не в этом

 ttimakina

link 20.11.2012 15:59 
Я имела в виду TRADOS и прочие из этого семейства.

 алешаBG

link 20.11.2012 16:02 
Q. Это так?
A. Нет
машинный перевод - это оксюморон, конечно, so far....

TRADOS - НЕ машинный перевод, и вообще - НЕ перевод))

 alk moderator

link 20.11.2012 16:10 
машинный перевод существует, но пока работает недостаточно хорошо.
Trados - это система, использующая память переводов, базу, где хранятся пары уже переведенных терминов.
Видно, что несмотря на то, что это разные вещи - машинный автоматический перевод и перевод с использованием памяти переводов, постепенно и все более активно первые берут на вооружение технологии вторых и таким образом развиваются.
Меня тоже очень интересует опыт форумчан по использованию различных систем работы с памятью переводов. Было бы интересно услышать об их достоинствах и недостатках от реальных пользователей.

 Val61

link 20.11.2012 16:15 
Работаю только в CAT программе (MemoQ, есличо). Т.е. 100% переводов делаю в ней. Гугль-транслейтом пользуюсь при переводах с только русского на английский разной юридическо-контрактно-аудиторской шняги типа актов проверок налоговой, экономит от 10 (как правило) до 25% (редко) времени. С английского на русский Гугль, увы, переводит вообще никак. Не обучен, видать.

Несколько лет назад убил немало времени на то, чтобы обучить Промт. Пихал ему свои словари, все ракое. Не осилил. Сдался.

Из интернет-переводчиков перепробовал все, всем им до Гугль-транслейта - как до Марса пешком.

Насчет того, что путать CAT с машинным переводом это все равно что путать зубного техника с гинекологом, уже написали.

 Enote

link 20.11.2012 16:23 
Лично я уже много лет все переводы делаю только с помощью САТ (спасибо одной заказчице, которая просто насильно посадила меня на Вордфаст).
Сейчас подсел на MemoQ.
Кстати, вчера с удивлением узнал, что к лицензии прилагается годовое обновление - тут же обновил свою 5.0.67 до 6.0.65

 ttimakina

link 20.11.2012 16:23 
Я сперва написала "кошки", но решила обойтись без сленга. Повелась на формулировку из http://ru.wikipedia.org/wiki/Trados ))

 Bramble

link 20.11.2012 16:24 
Wordfast Pro и Trados+Multiterm - использую регулярно. К обоим подключается Google MT. Также есть возможность подключения Microsoft MT, Wordlingo.
Если раньше использовала еще memoQ, то сейчас в этом смысла нет: всё взаимно конвертируется, translation memories и termbases переводятся в любой формат из любого формата.
ttimakina, Trados (DejaVu, Wordfast, memoQ, Transit, Across) - это CAT-tools ("кошки"); системы машинного перевода - названные мной плюс Promt, babelfish (if any).
Использование CAT+MT повышает производительность и экономит время. Не для всех тематик! Для художественной литературы и маркетинговых текстов - нет смысла. Для юридических, бухгалтерских, медицины - хорошо, т.к. можно запомнить термины и использовать во всём тексте однообразно.
Что еще? Традос был первым, использовала его с 2005 г., потом появились остальные. Сейчас непринципиально, чем пользоваться, хотя множество агентств по-прежнему требуют Традос.
Недостатки: не всегда находит 80%-100% совпадения (т.е., ты точно помнишь, что это уже переводил, но кошка его не видит - приходится вручную искать); раньше было такое что Традос мог слететь в любой момент, отказаться вычистить или запортить документ (у Mox много на эту тему приколов:), сейчас не знаю, вроде все стабильно, тьфу-тьфу; при переводе на русский (укр.) надо следить за спряжением падежей, т.к. в termbase обычно забивают 1 падеж (чаще родительный).
Кто еще может назвать недостатки - добавляйте.
Да, ещё горячие кнопки у всех разные, при переходе с одной кошки на другую приходится некоторое время переключаться.

 Bramble

link 20.11.2012 16:26 
Да, Wordfast Pro купила 2 года назад, он окупил себя уже за первый месяц работы (была специальная цена для СНГ - что, ИМХО, следует сделать и другим производителям). Перевожу 80% в Вордфасте, 20% в Традосе. Без них - только редактирование или внесение изменений в уже переведенный текст.

 marina007

link 20.11.2012 16:36 
Если не о КОШКАХ, то автоматический/машинный перевод существует уже давно. Есть область искусственого интеллекта, которая забавно "Natural language", это для любителей, но интересно, много узнаешь о языке.
ПРОМТ хорошо работает в узко-специализированных областях, где подключены нужные словари и ручками забиты/поправлены нужные сочетания. Видела результаты в биржевых сводках - более, чем приемлемо. Сама прогоняла русские тексты на английский для специалистов по геологии почв - были счастливы, поскольку могли в 300-500 страничном тексте понять, о чем речь, выбрать нужные страницы и начать дискуссию. Даже не хотели "ручного" перевода. Но опять же, предварительная работа была необходима.
Хотя сама машинный перевод не люблю - много предварительной работы и результат не шибко красивый.
А пользование "кнопочным" переводом типа Гугла и пр. - кажется мне странным.

 ttimakina

link 20.11.2012 16:40 
Bramble, я пользовалась только OmegaT, ибо сижу на MacOS. Не могу сказать, что в восторге. Возможно, сама программа слабовата/кривовата. Есть какие-то онлайновые средства, вот из-за них весь сыр-бор у нас с мужем и разгорелся.

 Bramble

link 20.11.2012 16:45 
Из онлайновых знаю wordfast anywhere - попробуйте, может, понравится. Мне нравится офлайновый вариант:) Worth paying for, но для начала попробуйте поюзать демонстрационную версию.

 Bramble

link 20.11.2012 16:50 
ttimakina, а из-за чего, собственно, сыр-бор? Хуже кошка не сделает, и медленнее процесс перевода не пойдёт (нужно только некоторое время потратить на освоение), а вот если в тексте 20% повторов или тексты однообразные (договора, судебные документы), то очень даже может ускорить скорость работы. И устраняет известный баг, когда, к примеру, lease переводят в одном и том же документе и как договор аренды, и как соглашение об аренде и просто как аренду:)

 Aiduza

link 20.11.2012 16:52 
На предыдущем проекте я активно пользовался Традосом где-то около двух лет, потом делал переводы на дому с его использованием, всё устраивало, программа очень полезна при переводе однотипных документов (напр. технических условий, опросных листов), только вот служба поддержки в Британии какая-то непутёвая. На новом проекте Традос не используется вообще, но здесь и однотипных документов почти нет, мы в основном переводим текущую переписку и небольшие обновления проектных документов. На данный момент я не пользуюсь Традосом уже 2 с лишним года. Надеюсь, что вспомню, как в нем работать, если понадобится (по аналогии с умением ездить на велосипеде ;-) ). Другие системы не пробовал, как-то установил пробную версию OmegaT, но при наличии Традоса не увидел смысла тратить время на ее изучение.

 Sjoe! moderator

link 20.11.2012 16:52 
Невеththuха по жисти. В которой видел я тока один некосноязыкий исходник (Executive Order by US President G.W. Bush Jr of all people), достойный занесения в "сегменты" САТ.

Но я перевел его Промтом. :))

 alk moderator

link 20.11.2012 16:59 
Bramble - поясните, пожалуйста, что есть окончание MT в перечисленных Вами приложениях. Каким образом разные Cats обмениваются базами TM? Потому что есть открытый стандарт, которому они следуют, или у каждого есть свой конвертер в открытый стандарт и обратно?
Насколько эффективно работает fuzzy match у разных Cats?
Хорошо ли они годятся для перевода технической документации, всяких спецификаций к оборудованию и тому подобной "сухой" литературы?
Как обстоит дело с сетевой/многопользовательской работой, чтобы несколько человек могли использовать/дополнять глоссарии и TM в процессе работы.

 ttimakina

link 20.11.2012 17:13 
Bramble, я сильно опасаюсь за "мусор" и порчу исходного форматирования текста. Я отлично умею это самое форматирование делать, но у заказчиков обычно всё сделано как бог на душу положит и тратить время на восстановление "как было" дико жалко времени :(
OmegaT сильно вроде бы не портила, но меня ещё очень раздражает большое количество "постороннего" и "лишнего" перед глазами. Так что для меня дискомфорт оказался больше пользы.

 lesdn

link 20.11.2012 17:23 
alk, не Bramble, но немного отвечу:
DeJa Vu и Trados могут обмениваться базами (я несколько раз экспортировал-импортировал). Насчет других, не знаю, ибо не пробовал.
Сетевая версия есть у Традоса (Trados Server) по сути с одной базой работает несколько пользователей.
Лично меня в Традосе (и других кошках) прельщает функция Concordance (поиск по базе перевода на наличие соответствий), очень сильно помогает для соблюдения единства терминологии.
В сетевой версии Традоса Concordance работает, позволяя всем подключенным пользователям писать один и тот же бред (а не его синонимы), конечно, если с помощью слова и паяльника заставить их выверять всю терминологию.

 Bultimdin

link 20.11.2012 17:33 
Trados как-то изучал, и не понравился совсем. Правда, было это давно.
Есть нормальные программы, более удобные и гораздо более простые в освоении.
Что касается промта и гугля - они нормально могут работать, если изначальный текст составлен грамотно и без ошибок, и предложения не ацки длинные. Если времени в обрез, и успеть перевести даже традосами невозможно в принципе, можно и промтом. Потом пару часов на исправления, и дело сделано. :) Но, опять же, это крайний случай.

 Enote

link 20.11.2012 17:48 
2 alk
Все известные мне программы САТ могут импортировать/экспортировать ТМ в формате ТМХ (который как раз для этого и создан).
Сетевых/многопользовательских версий полно, но они у компаний, а не у фрилансера
Эффективность работы fuzzy match зависит только от степени соответствия ТМ данному документу.
Разница между разными программи САТ одного поколения - чисто интерфейсные и идеологические моменты, они все умеют выполнять примерно те же самые функции.

 azu

link 20.11.2012 18:04 
Пользуюсь Вордфаст больше 5 лет. Удобно даже тогда, когда заранее знаешь, что совпадений не будет. Очень удобен сам механизм сегментирования. Ничего не пропустишь и удалять вручную ничего не надо. После этого с листа вообще переводить долго. С Excel тоже пользуюсь им, а вот сложно распознаваемые pdf и презентации делаю вручную, а то править форматирование потом дольше получается.

to timakina: "но меня ещё очень раздражает большое количество "постороннего" и "лишнего" перед глазами" - а это к чему относится? к delimeters? Так некоторые и непечатаемые символы отключают, вот отсюда у заказчиков и ужасное форматирование пробелами бывает.

 ttimakina

link 20.11.2012 18:39 
azu, не знаю как в других программах, в OmegaT показывается несколько фреймов, очень рассеивается внимание. Теги меня раздражают ))
Форматирование пробелами - мелочи! Есть очень много людей, которые добиваются "красоты" и "правильности" форматирования текста совершенно извращенными способами. Представления о стилях у людей нет совсем. Когда говоришь, что оглавление, список рисунков и таблиц собираются автоматически, кричат "шайтан!" и не верят ))
Самый патологический случай был - одна ученая дама главы в отчёт писала в Excel'е! Шириной текста заведовала граница столбца, каждая строка таблицы - строка текста. Страница текста = лист таблицы.

 Bramble

link 20.11.2012 18:40 
alk, MT означает программы машинного перевода (напр., google translate) - он подключается к кошкам с помощью плагина.
Базы конвертируются с помощью таких программ как Okapi в любой формат, приемлемый для кошек (tmx - самый распространенный). Есть еще termbases (не путать с TMs), они тоже конвертируются, например, из excel в txt, и подключаются к кошкам. TM содержат сегменты текста, termbases - термины (слова и словосочетания). Глоссарии, присланные заказчиком, можно конвертировать в termbases.
Крупные компании имеют сетевые ТМ, к которым подключаются переводчики и редакторы. Для этого им высылается адресная строка и пароль. Также эти компании имеют сетевые глоссарии (termbase), к которым подключаются переводчики.
Насчет техники не знаю, не беру её принципиально.
Насчет сравнения fuzzy - не знаю, все они глючные, хотя вроде мемокью понадежнее (шведы все-таки разрабатывали).

 Bramble

link 20.11.2012 18:42 
ttimakina, общее требование, как правило, тэги сохранять на своих местах. Однако если видишь в одном абзаце 28 тэгов - конечно, надо подключать здравый смысл, и загонять всех в конец строки одним щелчком мыши:)
Форматирование - это вообще не проблема переводчика, о чём неоднократно упоминал уважаемый tumanov.

 Bramble

link 20.11.2012 18:47 
И последнее (но не худшее): последние версии кошек позволяют работать с pdf-файлами напрямую, без предварительной конвертации и обратной конвертации. Это как бы решает проблему форматирования, но есть нюансы...

 KML*

link 20.11.2012 19:17 
процентов 90 работы выполняю в традосе, приходилось в свое время работать с транзитом (жутко не понравился, благо, в последнее время его никто не требует), раньше много работал с ворд фастом, ничаво так. хочу сейчас попробовать memoQ, много положительных отзывов.

 Val61

link 20.11.2012 20:12 
вроде мемокью понадежнее (шведы все-таки разрабатывали)

Венгры, однако. Но все равно, ничё так получилось. Не без косяков, конечно, но кто у нас без косяков-то.

 Евгений Тамарченко moderator

link 20.11.2012 20:42 
Выполняю в Традосе 95% работы. Считаю настолько важным, удобным и проч., что конвертирую в электронный текст иногда даже самые ужасные оригиналы, для меня это имеет смысл и в разных смыслах окупается.

Очень нравится MemoQ, думал уже пересесть, но есть как минимум одно не устраивающее меня обстоятельство.

 Mast_r

link 20.11.2012 21:22 
Странно, почему про DejaVu не особо вспоминают, удобная штука. Почему-то, лично мне, она понравилась больше MemoQ. Может Trados просто больше востребован заказчиками...

 SirReal moderator

link 20.11.2012 21:40 
Работаю и в Trados, и в MemoQ, и в других. У всех свои недостатки и достоинства. Разумеется, чем более технический текст, тем такие программы полезнее. Машинным же переводом не буду пользоваться ни за какие коврижки.

 vinni_puh

link 21.11.2012 2:23 
работаю в MemoQ, когда-то раньше пробовала Традос, но как небо и земля по сравнению. Тьфу на него и на ихнюю "службу поддержки". MemoQ хоть и дороговата, и каждый год приплачивать приходится, но работает с моей точки зрения просто и идеально. Полет уже 3 года, прога давно себя окупила.

машинным переводом пользовалась как-то раз - клиент попросил перевести огромный список словарных слов для какого-то проекта. Слов этак 20,000, начиная с 'апельсина' и кончая 'рубашкой'. Гугль-плагин очень помог, хотя вычитывать все таки пришлось - компьютер дура, часто загнал в перевод неправильные значения. Помогло то, что это был реально словарный список, одно слово на сегмент. А в нормальных переводах не пользуюсь, себе же мороки меньше))

Алк,
открытый стандарт - это TMX (для памяти) и TTX (для файлов). Мне часто присылают файлы из Традоса, проблем с этими форматами пока не было. Единственно что - Традос сегментирует файлы немножко по другому, но агенства обычно это знают и выгружают с правильными настройками.

Для технической документации кошки - самое ТО, ведь полезны не только старые переводы, но и concordance, т.е. база переводов работает как индивидуальный словарь/глоссарий. У меня есть отдельная память для постоянного клиента, например, там 5+ лет переводов - для меня это чистое золото. Иногда же бывает что бьешься полдня над переводом одного слова, а тут все уже есть.

Или же можно загрузить в память большой глоссарий из Экселя, например с названиями организаций, навороченными сокращениями и прочей фигни, в которой нельзя ошибиться, а в гугле копаться каждые 5 минут злит и отвлекает. А в кошке все предлагается автоматом, на тарелочке с голубой каемочкой.

fuzzy match в MemoQ работает отлично, настраивается на любое значение, от 1го до 101% совпадений, при этом настраивается не на слова, а на символы присутствующие в сегменте, так что проблема падежей отпадает (я пользуюсь 4мя режимами fuzzy match - 101%, +95%, +75% и +30% совпадений, по необходимости).

В сети MemoQ работает отлично, в текущем режиме - т.е. подключаешься прямо к серверу клиента и вперед. Переводы загружаются прямо на сервер и немедленно отображаются у других переводчиков. Не знаю только как агенства чистят 100%ые совпадения, сама не пробовала.

 SirReal moderator

link 21.11.2012 4:23 
"так что проблема падежей отпадает"
Если Вы переводите НА английский, то конечно...

 AsIs

link 21.11.2012 6:54 
Ну и я внесу свои пять форинтов: постоянно пользуюсь memoQ. Не устраивает лишь конкорданс (не выдает результат при частом упоминании уже хотя бы одного слова из искомой фразы, не находит длинные фразы). Остальное - нарадоваться не могу.
Иногда пользуюсь Традосом 2011. В палне конкорданса он безусловно лучше мемокью, но сам по себе более громоздкий, требуется нажимать больше кнопок для аналогичных операций. Это про ТМ. В части МТ пользуюсь утилитой QTranslate. По сути это аналог гугловского плагина для "кошек" и текстовых редакторов.

 laya shkoda

link 21.11.2012 8:23 
Ответ на вопрос зависит от того, для каких текстов используются эти системы. Традос (и др.) полезен при переводе схожих текстов - руководств, например. Поэтому технические переводчики не могут им не пользоваться. А почему бы и не пользоваться, если время так хорошо экономит?

 vinni_puh

link 21.11.2012 11:10 
SirReal,
ну почему же, НА английский как раз труднее. Падежи мешают найти точные совпадениям, приходится искать по первой половине слова... а вот английские термины прекрасно находятся.

 тетка

link 21.11.2012 11:58 
а годков так 10-15 назад - перелистывали (в буквальном смысле) словари, и переводы были - ах... зачитаешься.

 court.jester

link 21.11.2012 12:00 
переводы были - ах... запереводишься!

 irip

link 21.11.2012 12:06 
а у толмачей рука уставала перо держать :)

 nephew

link 21.11.2012 12:14 
2тетка: скорее 15-20

 alk moderator

link 30.11.2012 7:55 
В один клик: пять бесплатных программ для быстрого перевода текстов
http://www.3dnews.ru/software/638535/print

 AsIs

link 30.11.2012 11:38 
вдогонку к 30.11.2012 10:55
про Qtranslate не все написали. При переключении в режим перевода "на лету" (зеленый значок в трее) перестают срабатывать некоторые горячие клавиши (типа Ctrl+C/V). Чтобы отключить этот режим (который и не нужен), необходимо просто ткнуть 1 раз по значку утилиты в трее, чтобы он сменил цвет с мутно-зеленого на свой стандартный серый. Горячие клавиши восстановятся.
И вовсе не обязательно там по значку тыкать или копировать в буфер, как в статье написано (<<скопируйте текст в буфер обмена, и рядом с курсором появится значок QTranslate. Щелчок по нему выведет всплывающее окно с готовым переводом>>). Достаточно выделить текст и нажать одновременно две кнопки.

 bobe

link 30.11.2012 12:26 

 pavel7777

link 19.12.2021 8:23 
Доброго времени суток, судя по тому, что обсуждение этой темы закончилось около 10 лет назад, то хотел бы спросить: кто-нибудь до сих пор пользуется обсужденными выше программами ( MemoQ DejaVu Trados итд.) ? Я до сих пор в них вообще не разбираюсь настолько, что не понимаю: указанные мною программы это САТ? Спасибо

 niccolo

link 19.12.2021 9:14 
Сейчас почти любой письменный переводчик обязан уметь пользоваться системами автоматизированного перевода (computer-aided translation [CAT] - systems).Каждая из них имеет свои преимущества и недостатки.

В последнее время благодаря «заботе» БП, в переводческую среду всё больше продавливаются онлайн-САТ типа Memsource, Smartcat etc....

По функционалу для переводчика они слабее обычных CAT, они требуют от переводчика быть постоянно на проводной или беспроводной привязи, которая нередко добавляет свои неприятные особенности, но благодаря удобствам, в первую очередь учёту, предоставляемым менеджерам БП, и обычно бесплатности для исполнителей, они насаждаются/продвигаются с каким-то яростным рвением...

 pavel7777

link 19.12.2021 13:28 
Подскажите, пожалуйста, а есть ли такая программа, в которую можно за две секунды методом копировать - вставить т.е просто добавить, ничего не форматируя, дву, трехязычные файлы разных форматов (ворд, эксель, пдф, чертежи всякие итд), и чтобы она работала как глоссарий этих вставленных файлов (т.е чтобы выдавались переводы слов как в мультитране (можно с контекстами или без). И чтобы она переводила предложениями, абзацами как гугл и яндекс переводчики? Спасибо

 Aiduza

link 19.12.2021 14:23 
In your dreams, pavel7777! :)

 AsIs

link 19.12.2021 14:24 
Трольбас какой-то

 niccolo

link 19.12.2021 17:54 
Подскажите, пожалуйста, а есть ли такая программа, в которую можно за две секунды методом копировать - вставить т.е просто добавить, ничего не форматируя, дву, трехязычные файлы разных форматов (ворд, эксель, пдф, чертежи всякие итд), и чтобы она работала как глоссарий этих вставленных файлов (т.е чтобы выдавались переводы слов как в мультитране (можно с контекстами или без).

Есть. Любые сопоставители (aligners) - как встроенные в CAT, так и отдельные (abbyy, LF). Проблема только в том, чтобы в документах оригинала и перевода единицы, на которые вы будете разбивать текст (слова, предложения, абзацы), находились на одинаковых местах и однозначно идентифицировались... А с этим обычно проблемы, и большие.

А переводить потом по сопоставленным текстам может любая CAT.

 Aiduza

link 19.12.2021 18:42 
Multiterm в составе SDL Trados Studio можете попробовать. Туда можно загнать глоссарий в формате Excel и получить на выходе базу терминов.

 Aiduza

link 19.12.2021 18:44 

 Bogdan_Demeshko

link 24.12.2021 4:31 
все онлайновые cat - это зло (и костыли) в части непосредственно редактора, где текст натыкивается с клавиатуры (хотя на стороне управления проектами наверно там все очень удобно. потому что там думать не надо. интерфейсик сделать и циферки сложить и поделить это мы все молодцы, а хороший concordance поиск и другие, невидимые глазу алгоритмы реализовать - тут надо голову напрягать. и не только голову).

хотя есть прекрасная замена этих онлайн костылей, серверные версии традоса, мемоку итд, с хорошим, а не кастрированным, как в онлайновых cat, инструментарием. мультитранчик вот всего 2 дня в коме побыл, а сколько случаев предынфарктных состояний добавил к средней статистике. хорошо, что есть таки неонлайновая версия тоже ) за это время пришлось выяснить, что есть и другие хорошие словари, и даже гораздо более хорошие.

ну а так, по теме, 90% делается у меня в традосе Гуглом. какчество на выходе, днищерасценки за работу, кол-во потраченного времени на единицу полученных денег суммарно всех устраивает. все довольны и счастливы.

в очередной раз, стабильно и не нарушая десятилетних традиций, инфляция откусит очередной кусок от днищерасценок, и доля Гугла достигнет 100% )

 masenda

link 24.12.2021 5:52 
Ответ на самый первый вопрос: да, использую - 99% в году.memoQ.Редактор и постредактор машинного перевода.

Для тех, кто хотел бы научиться пользоваться удобными инструментами CAT, в Медконсалте выпустили 4 обучающих видео https://www.youtube.com/channel/UC81gGGhNMS6v9d0ThGJJuxw. Буду надеяться, что кому-то будут полезны.

 

You need to be logged in to post in the forum