Из статьи в журнале Компьютерра, автор - Сергей Рыбкин, http://www.computerra.ru/focus/269291/ Использование систем переводческой памяти для автоматизации процесса перевода. Возможности коллективного доступа к базам переводов для обработки больших объемов многоязычной документации По разным причинам технологии переводческой памяти (Translation Memory) стали одновременно незаменимыми и популярными. Они внесли серьёзные качественные изменения на переводческий рынок. Переводчики больше не ограничены бумажными словарями и глоссариями, теперь они могут обращаться к сетевым и электронным эквивалентам. Как способ сохранения времени, денег и качества, компьютеризированные технологии, в том числе и технологии переводческой памяти (Translation Memory), получили широкое распространение среди переводчиков, бюро переводов и клиентов. Следует заметить, что между тем как у переводческой памяти (Translation Memory) существуют свои достоинства и недостатки с точки зрения переводчика и бюро переводов, для клиента её использование выгодно и не представляет практически никаких неудобств. Во-первых, для переводчика огромное преимущество переводческой памяти (Translation Memory) состоит в качестве выполняемых переводов. Программа сохраняет пары терминов или строк текста и воспроизводит их, когда идентичный термин или строка встречается в любой другой части переводимого документа. Таким образом, переводческая память (Translation Memory) помогает переводчику быть всегда последовательным, используя один и тот же эквивалент для всех одинаковых терминов и строк. Другими словами, перевод становится более рациональным и состоятельным. Последовательность гарантирует лучшее качество, что в свою очередь значит, что клиент будет доволен переводом и скорее всего будет иметь переводчика в виду для последующих заказов. Кроме этого, переводчик может всегда использовать ту же переводческую память (Translation Memory) для последующих переводов того же клиента, что обеспечивает адекватность терминологии и стиля. Во-вторых, переводческая память (Translation Memory)экономит время переводчика, избавляя его от необходимости неоднократно искать термины или слова, повторяющиеся в данном тексте, особенно когда речь идёт об объёмных документах, а так же в других переводах того же клиента или той же области специализации. Специалист переведёт термин или строку только один раз, а программа «переведёт» их в случаях их последующих появлений, сохраняя время. Переводческая память (Translation Memory) также избавляет переводчика от необходимости напрягать свою память, с целью вспомнить как им ранее был переведён конкретный термин или строка, или от необходимости возвращаться к уже переведённой части документа в их поиске. С другой стороны, когда в памяти накапливаются переводы, её владельцу останется просто выбрать ранее использованный эквивалент, без надобности оценки уместности существующих эквивалентов в каждом конкретном случае, особенно там, где возможен синонимизм. В-третьих, сокращая временные затраты переводчика, переводческая память (Translation Memory) увеличивает его продуктивность, что может повысить его доход. Также следует учесть, что всё больше клиентов современного рынка хорошо осведомлены о работе с программами переводческой памяти (Translation Memory), использование которых нередко становится обязательным условием выполнения заказа. Таким образом, использование переводческой памяти (Translation Memory) делает переводчика более конкурентоспособным на фоне других специалистов, не работающих с данной технологией. Наконец, переводческая память (Translation Memory) достаточно мобильна. Переводчик может, в прямом смысле, носить с собой все свои «переводческие средства» на диске или карте памяти. Однако, у переводческой памяти (Translation Memory) есть свои недостатки для переводчика. Прежде всего, ему придётся вложить значительную сумму, чтобы приобрести программу и потратить определённое время и усилия на её изучение. Далее, особенно первое время, переводчик будет вынужден постоянно обращаться к инструкции или опытным коллегам при возникновении технических сложностей, что означает потерю драгоценного времени. Большинство программ, использующих переводческую память (Translation Memory), позволяют переводчику видеть на экране только несколько предложений, строк или отдельный параграф. Этот факт ограничивает процесс перевода до уровня данного предложения, строки или, в лучшем случае, параграфа, оставляя переводчика вне контекста. В результате, может появиться необходимость вносить изменения в уже законченный перевод, что вновь означает дополнительные временные затраты в зависимости от количества исправлений. Также существует риск навязчивых повторений. Переводческая память (Translation Memory) может отрицательно повлиять на поиск переводчиком других, возможно лучших синонимов и ограничить его использованием одного и того же термина во всём документе даже при наличии более адекватной альтернативы. Кроме этого, если переводчик предоставляет программу клиенту вместе с переведённым текстом, он делает последнего менее зависимым от себя в дальнейшем, так как в этом случае клиент всегда может передать новому переводчику вместе с работой память полученную в результате предыдущих переводов. Иными словами, давая переводчику шанс быть более востребованным, переводческая память не обходится в этом отношении без определённого риска. Системы автоматизированного перевода, по аналогии с Computer-Assisted Design (CAD) называются Computer-Assisted Translation (CAT). Технологии машинного перевода, по-английски machine translation, сводятся к грамматическому анализу, то есть переводу частей речи. Если нужно не ознакомиться с оригиналом, а опубликовать его перевод, сэкономить время не удастся. "Белковый" переводчик затратит меньше времени на перевод оригинального документа, чем на переделку творения машинного "переводчика", даже если речь идет о больших объемах технической документации с высокой степенью рекуррентности. Для подобного рода работ в переводческой отрасли прижилась другая технология автоматизации процесса. Правда, прижилась в основном за границей, о чем можно судить даже по разнобою в переводах названия технологии translation memory. Кроме лобовой "переводческой памяти" встречается "накопительный перевод", "автоматизированный перевод" и даже "пул переводов". Подробная статья на эту тему со множеством ссылок есть в Wikipedia. В общих чертах технология сводится к следующим процедурам. Вы загружаете исходный текст в программу переводческой памяти. Программа сегментирует текст, извлекает из своей базы ранее переведенных текстов совпадающие сегменты и выдает частично переведенный текст. Главное отличие от машинного перевода состоит в том, что базу переводческой памяти составляют сегменты из текстов, переведенных человеком. В качестве же сегмента или элемента переводческой памяти чаще всего берется предложение. Отсюда и концепция translation memory, которая основана на том, что предложения в предыдущих переводах можно использовать повторно. Очевидный выигрыш во времени частично нивелируется увеличением затрат на проверку качества перевода. И не только из-за того, что незамеченная ошибка может бесконечно повторяться, но и потому, что переводчик должен передать идею, мысль (словом, message) текста, а не переводить отдельные элементы в виде предложений. Тем не менее по мере ускорения процессов глобализации спрос на программы переводческой памяти растет. Цены на полные версии многих программ translation memory колеблются от 500 до 2500 долларов и обусловлены не столько технологией, сколько многообразием поддерживаемых форматов переводимой документации. В качестве примеров можно упомянуть STAR Transit и Deja Vu. Если же перед переводчиком не стоит задача переводить во всех мыслимых форматах, он может выбрать относительно дешевую программу WordFast, которая, в отличие от вышеупомянутых пакетов, не имеет собственной оболочки, а встраивается в Word. Мало-помалу отношение к этой технологии меняется и в России. Например, компания Promt включила в свою последнюю версию машинного "переводчика" функцию translation memory. По мере обострения конкурентной борьбы меняется и идеология переводческой деятельности. Все чаще говорят не столько о переводе документации на язык страны назначения, сколько о локализации продукта на десятки языков. Став крупнейшим игроком на рынке средств локализации, компания SDL заговорила уже о стратегии управления глобальными данными (Global Information Management). Где же место переводчика в процессе локализации? Начнем с того, что наше занятие еще долго будет оставаться очень трудоемким. В то же время перевод занимает в среднем лишь 40% общих расходов на локализацию, а остальное приходится на долю таких операций, как обработка файлов, форматирование, управление базами данных терминов и переводческой памяти, управление проектом, утверждение готового материала в стране целевого языка. Переводчику на этом конвейере обычно достается файл в формате программы переводческой памяти, где уже учтены предыдущие переводы по этому и подобным проектам и встроена терминологическая база. Некоторые особо продвинутые агентства разделяют работу до конца и не заставляют переводчика овладевать несвойственными ему навыками. В этом случае обработка документа в translation memory выполняется в агентстве, а переводчик получает в файлах Word сегментированный текст, не требующий форматирования и размеченный по степени совпадения с предыдущими переводами, а также глоссарий терминов по данному проекту. Результат работы переводчика снова вставляется в ту же программу для обновления баз данных переводческой памяти и терминологии. Таким образом, круг замыкается, и переводчик возвращается к идеальному варианту работы в текстовом редакторе, имея возможность целиком и полностью сосредоточиться на лингвистических задачах. Но программы автоматизации перевода действуют. И компьютер может ускорить труд переводчика в несколько раз. Поможет его оптимизировать, улучшить качество перевода. Но программы переводческой памяти сами не переводят, это лишь пустая оболочка. Ее наполняют и организовывают “под себя” переводчики. Когда над крупными проектами работает целый переводческий коллектив, программы переводческой памяти позволяют оперативно просматривать работу всех переводчиков проекта и, таким образом, получать от программ «подсказки» в виде уже переведенных сегментов. Обмен памятью осуществляется через менеджера проекта. Программа поддерживает любые языки (первый в списке - африкаанс). Если нет готовой переводческой памяти по данной тематике (ее может предоставить заказчик), то переводчики начинают работать с «пустой» памятью, однако каждое переведенное предложение в памяти фиксируется и, таким образом, пополняет ее. Предположим, что каждый из десяти переводчиков перевел за два дня 10 страниц. Менеджер проекта редактирует эти переводы и соединяет их в единую переводческую память. Таким образом, через два дня работы проекта каждый переводчик получит память в 100 страниц текста и сможет оперативно пользоваться результатами работы других переводчиков. Например, если я хочу узнать, как до меня перевели тот или иной термин, я могу это сделать, не просматривая все сто (тысячу, десять тысяч) страниц, программа сама отберет нужный мне материал. Так происходит из-за того, что в специальных текстах всегда встречаются сходные фрагменты. Например, в договорах или инструкциях встречаются стандартные формулировки - типа “стороны заключили договор”, и такие сегменты могут совпадать на 50%, 70%, а то и на все 90%. Раньше, без программы, надо было пойти по тексту - найти повторы -скопировать - вставить - отредактировать. Программа переводческой памяти предлагает похожие сегменты сама и показывает цветом, в каких именно частях сегменты различаются. Кроме того, менеджер проекта и сами переводчики в процессе работы над проектом создают общую терминологическую базу, которая также доступна для общего пользования в специальном окошке. В итоге, что очень важно для коллективной работы, все переводчики унифицированно переводят термины, хотя ни разу не общались напрямую! А по мере необходимости менеджер рассылает им обновление памяти и терминологической базы. В программе TRADOS есть приложение для извлечения терминологии MultiTerm Extract. Оно отмечает, сколько раз встречается тот или иной термин, фраза в тексте: 20, 57 или 3 раза. По этой статистике менеджер отбирает терминологические кандидаты и переводит их. Если существует готовая переводческая память, то программа извлекает терминологию с ее возможными переводами. Аналогичный терминологический менеджер есть и у программы PROMT, которая переводит извлеченную терминологию автоматически. В зависимости от терминологической насыщенности текста программы извлекают разное количество терминов. И теперь переводчик может не искать их в словарях, не искать их в Интернете, они есть в общей терминологической базе. Если встречается сложный термин - например, “плавающая головка для нанесения краски на бумагу”, то этот термин приходится искать в специальных корпоративных глоссариях, в текстах сходного содержания, которые можно получить от заказчика или найти в Интернете. Если термин еще не переводился – явление нередкое, если речь идет, например, о новой технологии, новом узле механизма и так далее – то приходится «изобретать» его перевод по аналогии с существующей терминологией и консультируясь со специалистами в данной области. Но раз «найденный» и занесенный в базу перевод используется всеми переводчиками проекта и избавляет их от необходимости проделывать аналогичную работу. Компьютерная программа позволяет сделать перевод терминологически единообразным. Раньше в подобной ситуации переводчикам предлагались терминологические листы в распечатанном или стандартном электронном текстовом формате. Но переводчик может полениться посмотреть этот список, может забыть про него или пропустить слово. А тут все просто: в окошке терминологической базы перевод терминов появляется автоматически, и не надо о них помнить. Такая стратегия эффективно применяется при работе с текстами, имеющими высокую степень повторяемости сегментов. Западные заказчики, кстати, не платят дважды за повторяющиеся сегменты (это, как правило, предложение до точки). Если фрагменты совпадают почти полностью и отличаются только несколькими словами, то заплатят лишь за перевод этих слов. Первый шаг подобной работы – терминологический анализ материала, создание первичной терминологической базы (в основном это «общий» терминологический фон, наиболее часто встречающаяся терминология). Желательно включить в терминологическую базу наиболее ходовую терминологию по данной тематике и создать переводческую память на основе параллельных текстов, которые можно получить от заказчика, найти в Интернете или купить (например, документы Международной организации по стандартизации – ISO, документы ГОСТ). Из созданной таким образом памяти удобно извлекать терминологию, программа позволяет сделать это за несколько минут, редактирование результатов, конечно, занимает больше времени. Кроме того, полезно создать и моноязычный корпус текстов – можно, после предварительного отбора, закачать целые сайты по данной тематике и проиндексировать их, что позволит переводчикам оперативно просматривать контексты, проверять правильность своих вариантов словоупотребления. Это особенно важно, если перевод осуществляется на неродной язык. Кроме того, предварительная работа предполагает поиск в Интернете глоссариев и словарей по данной тематике. Эти словари также полезно закачать целиком и проиндексировать, что позволит переводчику осуществлять поиск сразу во всех словарях. Описанные процедуры предпереводческой работы - не дело переводчика. Это работа менеджера проекта, и она ускоряет работу коллектива, как показывает опыт, раза в два-три. В итоге сроки и качество перевода выше, а цена - ниже, налицо удешевление и ускорение работы. Программа переводческой памяти может работать не только с текстовыми форматами (DOC, RTF, TXT), но и со многими другими (HTML, HTM, JSP, ASP, PHP, XML и другими) Для этого у SDL-TRADOS есть специальный инструмент, приложение TagEditor. Мы видим HTML-файл в виде доступного для редактирования текста, тэги представлены в виде геометрических фигурок (здесь нет привычных картинок и гиперссылок). Теперь перевод этого HTML-файла происходит по тому же сценарию, что и перевод обычного текстового документа. В итоге мы получим ту же страничку, но с русским текстом. Кроме того, программа может переводить меры длины, веса, объема.
|