DictionaryForumContacts

 Буквоедица

link 21.06.2001 23:42 
Subject: Странные слова 'пшют' и 'Липшютц' в морфологии Мультитрана
Задала для поиска слов, содержащих указанные буквы, слово "пшют". Получила ответ: пшют и Липшютц. В связи с этим вопрос: какие имена собственные допущены в словарь? Имя "Липшютц" явно придуманное, видимо из какого-то литературного произведения либо из прессы (там любят переиначивать имена политиков). Какие тексты послужили источниками для словаря?

 webmaster

link 21.06.2001 23:55 
webmaster: Я бы сказал, что это ошибки в базе. У словаря более 100 источников, поэтому известно лишь, что "пшют" датируется примерно 1995 г., а "Липшютц" - 1993 г. Довольно смутное время... Морфологический словарь является побочным продуктом разработки переводного словаря. Морфология пополнялась из двуязычных словарных источников. Материалы на русском языке (газеты и пр.) не использовались. Попадание собственных имен в морфологический словарь определяется только их наличием в соответствующих двуязычных словарях. Основной критерий надежности слова - наличие перевода. Если перевод имеется, то слово с большой вероятностью правильное.

 webmaster

link 21.06.2001 23:56 
Следует заметить, что наличие ошибочных слов в морфологии не влияет на работу переводного словаря - если подобные слова и встретятся в тексте, то для них все равно не найдется переводов. Морфолоческая база, безусловно, нуждается в чистке. В принципе можно сразу удалить все слова без переводов - для переводного словаря они не нужны. Однако, могут быть удалены и некоторые правильные слова. Поэтому эта работа будет производиться постепенно. Сообщайте нам о подозрительных словах, и мы примем меры.

 Буквоедица

link 22.06.2001 17:08 
Не надо удалять слово "пшют". Проверьте хоть по Яндексу - это слово существует, встречается в различных литературных произведениях от Северянина до Б.Акунина, а также в переводе из Голсуорси. Возможно, в ваш словарь оно попало именно оттуда, раз вы пользовались только английскими текстами и их переводами. Насчёт имён собственных мне всё-таки непонятно. Я думаю, их надо выделить в отдельный словарь, точнее именной указатель. как делают в монографиях. Только вместо ссылок на страницы, делать ссылки энциклопедического характера (даты рождения и смерти(if), род деятельности). В конце концов тексты, в которых нет прописных букв, встречаются редко, пусть уж лучше с ними буд%

 webmaster

link 22.06.2001 18:11 
Раз есть такое слово, значит, оставим. Что оно, кстати, значит? С именами собственными ситуация такая: одно дело морфология, где они во всех формах распознаются. Другое - переводной или, скажем, энциклопедический словарь, где они потом будут искаться. Вещи эти независимые. Над энциклопедией стоит подумать. Может, проще дать ссылку на энциклопедии, уже существующие в сети.

 Буквоедица

link 25.06.2001 13:31 
, вроде Хлестакова. Я думаю, что Вам не удастся отделить морфологию от значений. Это видно на примере омонимов, которые могут различаться в каком-то падеже или по разному выглядеть с некоторыми предлогами (см. "бор"). Будет логичнее считать омонимы разными словами(ну, и что же что формы совпадают), а различать их по основному значению. Именно так устроены хорошие словари, например, словарь Мюллера.

 webmaster

link 25.06.2001 15:56 
Если у слов одинаковый набор словоформ, то в Мультитране эти слова исторически относятся к одному классу. То есть морфология не отличает з'амка от замк'а (по крайней мере до того, как будет сделана база ударений). В переводном словаре существует возможность разделения омонимов на разные группы, что в случае совпадения форм делается вручную.

 webmaster

link 22.06.2001 18:12 
Будем чинить

 

You need to be logged in to post in the forum

Get short URL | Photo