Subject: ОФФ. Мусор в словаре jarg. Вот до чего докатились:http://www.multitran.ru/c/m.exe?t=4786312_1_2 http://www.multitran.ru/c/m.exe?t=4786300_1_2 Не пора ли ввести модерацию добавляемых терминов? |
Алекс Одейчук, Юрий Гомон, alk... и прочие stakeholders... Ау! |
Alexander Oshis ✉ moderator |
|
link 11.01.2010 14:16 |
Надо, наконец, установить некие лексикографические нормы. Потому что мне, например, кажется неправильным и тот способ пополнения словаря, которым пользуется наш многоуважаемый коллега: http://www.multitran.ru/c/m.exe?a=116&UserName=MichaelBurov И Вы правы, надо начать чистить словарь от совсем уж плохих статей. |
|
link 11.01.2010 20:35 |
SirReal, теперь лучше? или стоит совсем эти термины удалить? Alexander Oshis, Пока нет средств автоматизации, бороться с количественным максимализмом в ручном режиме довольно трудно. К тому же, не каждое групповое добавление терминов говорит о количественном максимализме. Некоторые пользователи стремятся тщательно подбирать переводы и добавляют в словарь иногда и до десятка вариантов перевода. Однако, они затем проверяют их на частоту встречаемости по g-sort и удаляют лишние статьи в течение дня сами. В крайнем случае, оставляют два, изредка - три перевода, снабжая их комментариями со ссылками на авторитетные источники. Такой подход можно только приветствовать. Просьба ко всем небезразличным пользователям: Алексей. |
|
link 12.01.2010 2:44 |
Алексей, я не совсем с Вами согласен по поводу удаления малочастотных вариантов. Я в свое время как раз начинал вводить слова в МТ с таких терминов, на которые когда-то (при переводе) потратил по 2-3 часа (на одно слово) именно из-за их малочастотности. Просто не хотелось, чтобы потом другой коллега потратил бы столько же времени на поиск перевода этого же слова. Есть же и объективные причины малочастотности. Например, только что разработанная методика. Авторы придумали термин для ее названия. Он и на английском-то встречается пока 2-3 раза всего, а мне надо на русский как-то перевести. Предположим, я это сделал. И что, мне нужно лет 5 подождать, пока эти слова станут более распространенными, прежде чем заносить в МТ? Критерий частотности полезен, но нельзя его доводить до крайности. Так можно будет сказать, что надо ограничиться словарем Мюллера, поскольку в нем собраны все самые распространенные английские слова. (словарь Мюллера - просто для примера, ничего против него не имею) Для себя я в какой-то момент решил заносить в МТ все слова, которые встречаю, по принципу - раз оно мне встретилось, значит, может встретиться и еще кому-нибудь. Или, может быть, то, что Вы писали, просто не относится к такой высокоспециализированной лексике? (типа молекулярной биологии и прочих моих тематик) А что Вы имели в виду под "g-sort"? Сортировка в Гугле? Есть какой-то вариант автоматической (полуавтоматической) проверки частотности? |
|
link 12.01.2010 5:52 |
Игорь_2006, g-sort - ссылка на сайте МТ для проверки частоты встречаемости в Гугле терминов, внесенных в словарь. Против узкоспециализированной лексики с объективно малой частотой встречаемости я не выступаю. Я имел в виду ситуацию, когда вводятся несколько переводов только для количества, часто в тематику, не имеющую никакого отношения к этим словам, с орфографическими ошибками (у таких "переводов" и частота встречаемости ниже :-), причем в ситуациях, когда в словаре есть грамотные переводы в соответствующих тематиках с нормальной частотой встречаемости. Например, вызывает только удивление, зачем понадобилось в качестве переводов "second-hand car" вносить в тематику "банк." такие словосочетания, как: "б/у легковая машина", "поддержанный автомобиль", "поддержанная легковая машина", когда в тематике "тех." изначально был внесен "подержанный легковой автомобиль": |
почитал первые шесть страниц про котел с псевдоожиженным слоем... проникся. :) 12 добавленных терминов в минуту! MichaelBurov - это бот! :) Если переписать то же самое капсом - рейтинг удвоится. н-да... |
И что, мне нужно лет 5 подождать, пока эти слова станут более распространенными, прежде чем заносить в МТ?* Именно, а Вы как думали словари составляют? То, что вы за два-три часа придумали в качестве перевода годно только для Вашего конкретного перевода и для сдачи оного Вашему конкретному заказчику. Занесение таких терминов в словарь - это превращение словаря в помойку. Для того, чтобы узнать |
Игорь_2006 +100 Люди!! пожалуйста!!! заносите в словарь варианты, которые Вы нашли, невзирая на их малочастотность. Лично мне такие мультитрановские переводы много раз очень помогали. +Огромное спасибо тем, кто тратит на это свое время!! |
Alex_Odeychuk, реально подДержанный?? [без шуток] |
Поддерживаю мнение Игоря_2006. Дело в том, что есть такие области техники, как биотехнология, мол. биология и т.п. Они развиваются стремительно, и переводов по этим тематикам будет всё больше. Потому что вся разработка лекарств, диагностических тестов уже сейчас сводится к биотехнологическим методам. Новые термины там появляются каждый год. Неспециалисту в генетике, действительно, приходится выискивать и разбираться ЧАСАМИ с переводом 1 фразы. Лично мне очень помогли термины, внесенные Игорем_2006. |
Больше беды, когда в МТ заносят очень высокочастотные слова. |
Коллеги, вот некоторые из моих соображений по этим, бесспорно, актуальным вопросам: 1. Цензура, которая, безусловно, необходима. Вопросы: кто конкретно будет этим заниматься? Кто конкретно будет назначать тех, кто будет конкретно этим заниматься? А также кто конкретно будет контролировать работу "модераторов словаря" и по каким критериям? Более того, на каких началах будут работать вышеозначенные лица? На общественых? Просьба делиться идеями, предложениями, мнениями. 2. Узкоконтекстуальные и узкоспециальные термины 3. Дубликация терминов (на примере second-hand car, Alex_Odeychuk, 12.01.2010 8:52) PS но тут же возникают вопросы из п.1 )))) |
может ограничить количество вводимых в день терминов, а кому хочется быстро и много, пусть высылают глоссарий, есть ведь ссылка, чтобы прислать глоссарий, а там уже на первой странице видно будет собирается ли человек массово вводить такие "термины" или делом занимается. |
Малочастотные слова тоже нужны, пользователей много, соответственно, и области перевода тоже самые разные. Этой своей "универсальностью" МТ-словарь и отличается выгодным образом от других, что можно в результате многое найти, чего нет в других источниках. Другой вопрос, что надо хорошо выверять значения, прежде чем вносить в словарь. Согласна здесь с Сержем 85-ым насчет пометок "узк.-...". Чем больше будет слов и вариантов их перевода, тем меньше люди будут тратить время на дискуссии и тем быстрее находить ответы на свои вопросы. |
По п.2 - проблема в том, что термин, пришедший в голову первому переводчику, совсем не обязательно правильный. Можете сделать поиск по форуму на "секьюритизацию" - и посмотреть, какие дискуссии тут были. Так что не стоит каждое свое озарение пихать в словарь... |
Алекс, спасибо за вмешательство. Однако слов rtard и r-tard в действительности не существует. Это лишь неофициальные варианты написания слова retard, не более чем сетевой/чатовский сленг: http://www.urbandictionary.com/define.php?term=r tard Если на то пошло, с тем же успехом можно добавить l33t, pwn, l8rz и несколько тысяч вариантов написания обычных слов, которые используются в чате и играх. Это во многом эквивалент албанского. Надеюсь, кросавчега и преведа в словаре ждать не стоит?! Или я ошибаюсь? Кто что думает? |
SirReal +1 эдак весь SMS езыг надо в МТ выкладывать, типа l8, nd, soz, tomoz, skl etc :-) |
Лингоцеллюлозы тоже в действительности не существует http://www.multitran.ru/c/m.exe?a=108&block=368&UserName=MichaelBurov&l1=1&l2=2 |
"проблема в том, что термин, пришедший в голову первому переводчику, совсем не обязательно правильный" Вот именно. Поэтому и нужен словарь со специализированной лексикой, чтобы поменьше было таких "озарений". Невозможно знать всё, но нужно знать где об этом прочитать. По п.2 и владения лексикой. Проблема в том, что знать ВСЕ термины и ньюансы их употребления в области биохимических, медицинских, генетических и т.п. методов исследования практически невозможно. Да, наверное, есть такие спецы, которые знают одновременно все технические детали ИФА, MOLDI, ВЭЖХ , ПЦР и тп. и тд, и к этому еще умеют работать со специальными программами типа BLAST. Но на практике исследователи обычно просто связываются с коллегами и спрашивают что как делать. У переводчиков для этого есть интернет и мультитран. |
Люди! Што такое l33t??? |
Йа фсю голаву сламал. |
Надеюсь, кросавчега и преведа в словаре ждать не стоит?! поздно :) |
да, поздно |
Электрисити? Элтёрнативити? :)) |
Круть. А чего такое литспик? |