DictionaryForumContacts

 Natasha_777

1 2 3 4 5 6 7 8 9 all

link 30.03.2006 7:05 
Subject: off: а кто-нибудь вообще модерирует Мультитран?...

 SH2

link 30.03.2006 16:51 
Brains
Да, всё так. Просто «тоже» людей, увы, слишком много, и я (да, старый и сдавшийся) не могу представить без них мир. Поэтому приходится как-то жить и с ними. Когда окончательно поборю всякие моральные барьеры — буду такие объекты эксплуатировать нещадно и с того строить себе высокий замок.

Потому я и не очень люблю судить о человечестве — оно состоит из очень разных существ.

Да, здесь проблема, я её толком не решил. То использую слово «человечество» в значении «безликая масса», то напротив, как нечто противопоставляемое неживому и неразумному миру.. Надо обдумать вопрос.

Или это я такой гений, что обычным смертным эта банальнейшая мысль не может прийти в голову?

Ух, эта фраза достойна занесения в базу!
Пользуясь случаем, смиренно прошу Вас поделиться ссылкой на описание продукта, который можно использовать в качестве хранителя (и извлекателя) умных мыслей, высказанных другими людьми (далее База). Понимаю, что упоминание конкретного продукта (возможно, неоднократно) уже находится в архивах форума, но к стыду своему должен признать, что не в состоянии найти там упоминание заслуживающей внимания системы..
Просто после очередного (но внепланового) весеннего перерождения мне крайне неудобно шарить в белковой памяти, постоянно думая о том, что я мог бы делать это чуть более удобно и надёжно с помощью кремниевых друзей (гы, в очередной раз вспомнил про Силиконовую долину)..

А его судьбина будет другим наукой.

Не верю :-( В том и ужас. Не будет наукой. Даже если децимацию провести, не поможет.

Корысть, стесняюсь спросить, состоит в посильном увеличении потока тех самых продуктов жизнедеятельности, которые Вам приходится править

Скорее в фильтрации и (как это в горном деле?) обогащении ;-))
То есть на стол всё равно поставить стыдно, но время на обработку сокращается некоторым образом. Так работает весь современный мир: используют китайцев и сортируют их на тех, после которых для требовательных клиентов переделывать надо полностью, и на тех, от творчества которых можно оставлять избранные кусочки..

Franky
Не смогу объяснить, уж извиняйте. Я не пытаюсь уйти от вопроса, я просто понимаю, что никак не смогу выразить словами то, как я верю (а тем более — как НЕ верю) в человечество. Я не знаком ни с философией, ни с риторикой так, чтобы рассуждать об этом, «не рискуя сломать себе шею».

 Brains

link 30.03.2006 17:14 
2 SH2
Пользуясь случаем, смиренно прошу Вас поделиться ссылкой на описание продукта, который можно использовать в качестве хранителя (и извлекателя) умных мыслей, высказанных другими людьми (далее База). Понимаю, что упоминание конкретного продукта (возможно, неоднократно) уже находится в архивах форума, но к стыду своему должен признать, что не в состоянии найти там упоминание заслуживающей внимания системы..
Упоминания там нет и не было по причинам, которые мы с Вами длинно мусолим. Скоро уже год тому, как я прошерстил всю доступную мне Сеть в поисках достойной базы знаний, пригодной для употребления частными лицами. Таковой, смею уверить, не существует в природе. Ситуация ещё хуже, чем со словарями для русских переводчиков.
Но могу Вам прислать (в частном порядке for your eyes only, strictly confidential, incinerate before usage etc.) черновик обзора существующих решений. Два из них, если плотно пообщаться с разработчиками, обещают быть пригодными. Маякните, если всерьёз намерены взяться за это.

 SH2

link 30.03.2006 17:19 
Да, я заинтересовался, похоже, по настоящему. Адрес электронной почты у меня прежний, буду рад.

 pom moderator

link 30.03.2006 18:25 
To Natasha_777:
Если перевод слова bar "единица давления" оказался в сельском хозяйстве, это значит, что впервые именно такой перевод встретился в словаре по сельскому хозяйству. Ведь и в сельском хозяйстве не одна ботва, может попасться что-то техническое.
Другой вопрос, почему "единица давления" до этого не встретилась в технике или физике.
Мультитран развивается по нарастающей. То есть термин, попавший в словарь, в большинстве случаев остаётся там навсегда, если только это не явная ошибка.
В своё время клиентам предлагалась перспектива чистки базы вместо дальнейшего наращивания объёмов (потому что в единицу времени можно делать либо одно, либо другое). Такая мысль была единодушно отвергнута. Лучше 100.000 новых статей, чем исправление 100 опечаток.
Это в каком-то смысле тоже глас народа.

To Brains:
Да, юникода нет, и пока не предвидится.
Впрочем, пользователи немецко-русского и прочих словарей этого не замечают, потому что умляуты сделаны другими средствами.
Но в английском словаре, например, вставить умляут не удастся.
Muller будет недоволен, но много ли таких слов?
Кстати, я удивлён, что английский форум каким-то образом показывает умляуты, хотя вроде этого никто не предусматривал...

To Yanick:
Обратно перейти из переводов в список слов можно кнопкой табуляции (если я правильно понял вопрос)

 Анатолий Д

link 30.03.2006 18:32 
"Лучше 100.000 новых статей, чем исправление 100 опечаток"

странная постановка вопроса -- так 100 000 всегда побьют 100.

а исправление 100 ошибок не лучше 100 новых статей? (из которых ХХ окажутся к тому же повторениями)

чего-то я не понимаю

 Brains

link 30.03.2006 19:19 
2 Андрей Поминов (Мультитран)
Muller будет недоволен, но много ли таких слов?
Говорылы-балакалы, силы та й заплакалы…
Вам персонально я уже это говорил, но чтобы не быть голословным, приведу несколько первых попавших под руку примеров для публики:
x03B2;x002D;x043D;x0430;x0444;x0442;x0430;x043D;x043E;x0432;x0430;x044F;x0020;x043F;x0440;x043E;x0431;x0430; (медицина)
x0394;x0044;x002E;x0020;x0031;x002E;x0020;x2013;x0020;x0441;x0440;x043E;x043A;x0020;x0444;x0430;x043A;x0442;x0438;x0447;x0435;x0441;x043A;x043E;x0433;x043E;x0020;x043E;x0431;x0440;x0430;x0449;x0435;x043D;x0438;x044F;x0020;x0432;x0435;x043A;x0441;x0435;x043B;x044F;x0020;x0432;x0020;x0434;x043D;x044F;x0445;x003B;x0020;x0032;x002E;x0020;x2013;x0020;x043A;x043E;x043B;x0438;x0447;x0435;x0441;x0442;x0432;x043E;x0020;x043A;x0430;x043B;x0435;x043D;x0434;x0430;x0440;x043D;x044B;x0445;x0020;x0434;x043D;x0435;x0439;x0020;x043C;x0435;x0436;x0434;x0443;x0020;x043F;x0440;x044F;x043C;x043E;x0439;x0020;x0438;x0020;x043E;x0431;x0440;x0430;x0442;x043D;x043E;x0439;x0020;x0441;x0434;x0435;x043B;x043A;x0430;x043C;x0438;x2026;x000D;x000A; (банковское дело)
x0394;x0044;x0020;x0438;x0020;x0394;x0055;x0020;x2014;x0020;x043C;x0435;x0440;x044B;x0020;x043E;x0442;x043A;x043B;x043E;x043D;x0435;x043D;x0438;x044F;x0020;x0044;x0020;x0438;x0020;x0055;x0020;x043E;x0442;x0020;x0438;x0441;x0442;x0438;x043D;x043D;x044B;x0445;x0020;x0437;x043D;x0430;x0447;x0435;x043D;x0438;x0439; (логика, высшая математика)
x0394;x0044;x0020;x002D;x0020;x043F;x043E;x0433;x0440;x0435;x0448;x043D;x043E;x0441;x0442;x044C;x0020;x0438;x0437;x043C;x0435;x0440;x0435;x043D;x0438;x044F;x0020;x043E;x043F;x0442;x0438;x0447;x0435;x0441;x043A;x043E;x0439;x0020;x043F;x043B;x043E;x0442;x043D;x043E;x0441;x0442;x0438;x003B;x002E;x0020;x0394;x03B1;x0020;x002D;x0020;x043F;x043E;x0433;x0440;x0435;x0448;x043D;x043E;x0441;x0442;x044C;x0020;x0438;x0437;x043C;x0435;x0440;x0435;x043D;x0438;x044F;x0020;x043A;x043E;x044D;x0444;x0444;x0438;x0446;x0438;x0435;x043D;x0442;x0430;x0020;x0441;x0432;x0435;x0442;x043E;x043F;x0440;x043E;x043F;x0443;x0441;x043A;x0430;x043D;x0438;x044F;x002E;x0020;x0020;x000D;x000A;(допечатная подготовка изданий, фотодело).
«Мультитран» не в состоянии поддерживать не только умляуты в английском словаре, он, насколько могу понять, в принципе не в состоянии поддерживать больше двух алфавитных языков за раз. Как реализована в нём поддержка японского языка, я даже боюсь представлять…
И ладно бы это был словарь не для переводчиков, а для школьников младших классов! Потому что даже в средних уже попадаются греческие символы и операторы в математике, а в старших к ним добавляются физика, иногда те же умляуты — и всё, как на грех, с кириллицей перепутано!
Про переводчиков надо по энному разу рассказывать, нет? Не про тех, что слепых через дорогу переводят, а про живых? Которым переводят не только тексты из I Can Read a Book и I Can Type a Word?
Хотя конечно, многое зависит от того, на кого словарь ориентировать, правда? Есть ведь и такая аудитория:
Для нас ответом на вопрос
«Быть или не быть?»
Cтанет: «ОвипЛокос»!!!

А чё, в натуре, именно от них ведь и следует ожидать денег. И умляуты им никакие нафик не надь. И с деньгами не надь.
Вы такими нас видите?

 alk moderator

link 30.03.2006 20:39 
Я немного прокомментирую про юникод. Я понимаю как оказались на форуме умлеауты. При формировании вопроса юзер вставил символы в форму, и браузер его честно отработал, заместив амперсандными конструкциями. Им так положено делать по спецификациям. То есть пусть кодировка страницы Windows-1251, но это не значит, что на ней не могут встречаться символы из других наборов коли юзеру понадобилось такой символ ввести, просто они будут представлены не слишком удобными конструкциями.
Это надо четко себе представлять. Так хорошо продуман веб.
На самом деле Мультитран тоже продуман в определенном (и похожем) направлении. Его идея - неважно как символы хранятся в базе, сколькими они байтами представлены, важно, что когда они понадобятся, программа их возьмет и заменит на то, что должно быть в соответствии с выбранным языком. Отсутствует только случай, когда вдруг надо выдавать сразу несколько вместе, хотя и это подчиняется контролю. Достаточно смотреть откуда (из какой базы) символ приходит, а не только в каком языке надо выдавать результат.
Юникод - это очень непростая штука. Тот юникод, который используется на уровне операционной системы в том же Windows2000/XP/2003 это не тот юникод, который используется в кодировках веб-страниц и электронной почты. Последний называется UTF-8 и является неким суррогатом, упрощенным вариантом большого UTF-16 юникода, на котором разговаривают программы вроде Винворда и Таблицы символов. Упростили его, чтобы меньше информации передавать по сети. Слишком получалось много гнать нужно было тем главным юникодом. Компромисс. Отклонение для удобства.
Но даже и тот укороченный юникод очень тяжеловесен. Посмотрите как дико длинно выглядят ссылки в русской википедии, потому что они все закодированы UTF-8. Русские страницы передаются в нем. Гугл тоже использует UTF-8, но в UTF-8 латиница передается однобайтово, так что гигантизм английским страницам не грозит, в отличие от тормозных русских.
К чему я все это говорю. Стандарты вещь хорошая, но почему-то их норовят пересматривать и переделывать так, чтобы было удобно.
Совершенно не обязательно хранить базу словаря в юникоде, если даже сама программа или скрипт написаны в новой версии Visual Studio, где есть его поддержка, того самого, UTF-16. Для веб-сайта, как видите, это вообще неактуально, можно выгонять на страницу любой символ, который поддерживается W3C. Важно только, чтобы код символа был правильно подан в html из скрипта. Здесь уже за браузер не спрячешься. Страница будет продолжать оставаться в кодировке 1251.
Слова в базах могут храниться в каком угодно формате, как удобно, но для баз новых языков будет все сложнее придумывать комбинированные схемы извлечения.
Надеюсь, я смог хоть что-то объяснить.

 Анатолий Д

link 30.03.2006 20:48 
"могут встречаться символы из других наборов"
если бы было сказано "ВСЕ символы", то и спорить не о чем.
А так почему-то буква о с умляутом воспроизводится, а буква а с им же переходит в д -- пустяк, а неприятно.
öд

 SH2

link 30.03.2006 20:58 
Ну так ещё не хватало, чтобы HTML entities как-то некорректно отображались ;-))
Вопрос в том, что их повсюду лепить не всем и не очень удобно..

 pom moderator

link 30.03.2006 21:20 
Ну 100 и 100.000 - конечно, некоторое преувеличение.
Смысл в том, что добавить несколько тысяч новых статей можно быстрее, чем найти и исправить несколько опечаток.

Кстати, символ beta и ряд других словарём отображается в статьях, хотя искать по ним нельзя. Даже ГРАДУС отображается ! :)
Предлагаю продолжить в Золотой Вобле.

 alk moderator

link 30.03.2006 21:30 
Все зависит от того, какие Вы символы вставляете.
Второй умлеаут превращается в русскую букву, потому для кодировки 1251 уже появляется русский символ на ее месте. Для первой буквы такого символа не нашлось, и браузер, обнаружив изъян вставил спец. конструкцию (пробелы вставлены для демонстрации) & # 246; - она и отвечает за передачу умлеаута.
Нетудно подсмотреть в спецификации, как вставить другие символы
http://en.wikipedia.org/wiki/Unicode_and_HTML
http://ascii.cl/htmlcodes.htm

÷ ø ù ĉ č
àáâãдåæçèéêёìíîï

Видим, что браузер не обмануть, как бы не писали 228 символ, он превратится в русскую букву д, поскольку страница преподносится в Windows-1251. Здесь выручит UTF-8, который переварит такое разночтение.
Получается, что только для таких случаев он и нужен. Скрипт может обнаружить противоречие и специально для этого случая сформировать страницу в UTF-8.

 Анатолий Д

link 30.03.2006 21:41 
это я все понимаю, не детально, но в принципе -- что на все есть свои причины и что если символ не появляется как надо, то значит он преобразуется, и т.п.
Практически-то что делать, чтобы его вывести? как сформировать страницу UTF-8, если дело в ней? от пользователя что зависит? если совсем невозможно, значит Brains прав и нужно выбирать кодировку, в которой все символы обеспечены.

Get short URL | Pages 1 2 3 4 5 6 7 8 9 all