Subject: Вопрос по Традосу Нужно создать терминологическую базу для Традос (перевод с немецкого на русский), но не могу сохранить диакретические значки (умлауты) в формате ANSI. Другой формат Традос не поддерживает. Как быть?Если ставлю аннглийскую версию WinXP, то ANSI поддерживает немецкие символы, но не отображает русские. Может быть кто-то сталкивался с этой проблемой..? Спасибо! |
Формата ANSI не существует, так что не удивительно, что в нём не удаётся сохранить символы с диакритическими знаками. А вообще-то при восьмибитном кодировании текста невозможно в одном файле сохранить сразу два набора символов upper ASCII, или, говоря языком Майкрософт, две разных кодовых страницы — CP 1251 и CP 1252. Особенно при кириллическом локальном языке системы. Похоже, что единственный выход — не пользоваться накопителем, развитие которого остановилось в Ледниковом периоде. На прошлой неделе я ещё не верил, что в 2006 году такая дичь возможна где-либо в переводческом инструментарии, кроме Мультитрана, однако ж выяснилось, что то же самое отличает и Trados. |
По дороге на работу вспомнил, что в принципе задача разрешима и при 8-битном кодировании (было же это сделано в Windows 98 / ME и в старых версиях Dx00E9;jx00E0; Vu). Я немного неточно выразился: на самом деле при таком способе вообще отсутствует какое-либо явное указание на определённый глиф (отсюда и все Ваши беды), а просто указывается позиция символа в пространстве из 256 адресов. Какой набор символов (character repertoire, как говорят специалисты, или character set, как принято в быту) на него наложите, такие символы / глифы на кодах 128-255 получите. Главное, чтобы имелось явное указание на нужную кодовую страницу Windows, а программа была в состоянии его считать и понять. Не поддерживать 8-битное кодирование даже Trados не может. Отсюда вывод: в его терминологической базе должна существовать отсылка к соответствующей кодовой странице — надо понимать, в поле заголовка столбца. То есть создать базу не проблема, это наверняка подробно описано в документации. Другое дело, как Trados будет её интерпретировать с учётом локального языка системы… но об этом я уже писал: не пользуйтесь им, и всё тут. Однако самому созданию терминологической базы это не мешает. ;-) |
ИМХО 8-битовая кодировка в обычной Винде поддерживает 2 языка - англ + любой другой. Если хотите получить немецкий и русский, то по моим понятиям надо ставить чисто немецкую Винду, чтобы основная кодовая страница была немецкой |
Вряд ли всё аж настолько плохо, Enote. Сейчас это страшное время припоминаю смутно, однако мне как-то удавалось получать многоязычные документы даже по Windows 98 SE PE. Помните, там для этого ещё в win.ini был такой раздел с указанием „сдвига“ character repertoire для кодов 128-255 по карте электронной шрифтовой гарнитуры? При этом если использовалась нормальная гарнитура, рассчитанная на Юникод (целая пачка обычно бралась из CorelDraw!), можно было печатать на любом языке. Кодировка октетами где угодно поддерживает 256 символов, то есть любого другого языка всё равно никак не получится (CJK никак в 8 бит не лезут). Получатся ASCII (коды 0-127) + так называемый lower ASCII (коды 128–256). Все нормальные версии Windows (которые на ядре NT), поддерживают Юникод, то есть как 16-, так и 32-битное кодирование текста. Локальный язык системы сохранён ради совместимости с пещерными текстовыми приложениями вроде Мультитрана, которые и по сей день ничего свыше 8 бит не разумеют (ну да, ещё чудищ типа Big / Little Endian и иже с ними). То есть в принципе ничто не мешает отображать позиции 128–256 на любую часть символьного набора гарнитуры — главное, чтобы там что-то было. Что в гарнитуре есть (какие глифы / символы), такие и будут отображаться. Во всяком случае, подобным образом работал древний Dx00E9;jx00E0; Vu 3.x, и так же должен работать Trados. Другого способа доставать правой рукой левое ухо, насколько я знаю, не придумали и вряд ли станут. Проще программировать по-людски. |
You need to be logged in to post in the forum |