DictionaryForumContacts

 Libert

link 7.04.2019 2:11 
Subject: Большой корпус параллельных текстов художественной литературы lit.
Давно пользуюсь Реверсо Контекст, но там параллельные тексты субтитров фильмов. Субтитры - это все-таки субтитры, а вот художественная литература - это художественная литература.
Есть ли достаточно большой корпус параллельных текстов художественной литературы, только не пара книг, а действительно большой корпус?
Корпусы официальных документов не интересуют, потому что язык там слишком официальный.
Заранее спасибо.

 Wlastas

link 7.04.2019 4:48 
Ну для начала можно проработать довольно большую подборку отсюда:
http://www.multitran.ru/c/m.exe?l1=1&l2=2&a=66

Параллельность конечно же не на 100%, но в целом довольно приличная и после некоторой обработки (нужен спец редактор) получается вполне информативно и познавательно.

 Rus_Land

link 7.04.2019 5:54 
Wlastas,
что Вы имеете в виду под "спец. редактор"?

 Alex_Odeychuk

link 7.04.2019 8:33 
Libert, посмотрите сайт
Национальный корпус русского языка
(Институт русского языка им. В.В.Виноградова РАН)
www.ruscorpora.ru

На этом сайте помещен корпус современного русского языка общим объемом более 600 млн слов. Корпус представляет собой информационно-справочную систему, основанную на собрании русских текстов в электронной форме, снабженных морфологической и грамматической разметкой.

На сайте есть возможность поиска в параллельных корпусах: русско-английском ( http://ruscorpora.ru/search-para-en.html ), русско-немецком, корпусе русской классики в немецких переводах, русско-французском корпусе, русско-испанском, русско-итальянском, русско-китайском, русско-армянском, русско-белорусском, русско-украинском, русско-болгарском, русско-бурятском, русско-латышском, русско-литовском, русско-эстонском, русско-польском, русско-шведском.

 Wlastas

link 7.04.2019 9:05 
2 Rus_Land
Ну если в двух словах, то местная подборка текстов в автоматическом режиме легко превращается в полноценную базу параллельных предложений со всеми удобствами типа поиска collocation. Однако, если при работе с базой в выдачу попадёт неправильный перевод, необходим механизм "перемотки" для поиска соответствий. Для этого и нужен редактор, который знает, какое предложение идёт за каким как в оригинале так и в переводе.

 Rus_Land

link 7.04.2019 9:39 
Wlastas, я уж было подумал, что Вы назовёте все пароли и явки, но, похоже, это только теория...

 Libert

link 7.04.2019 22:53 
Про Национальный корпус русского языка знал. Поискал слово "конфитюр" в русском-английском корпусе и не нашел, имхо, если такого слова нет, то и корпус маловат.
Про параллельные тексты худ. лит-ры в МТ знал. Посмотрел, я не нашел поиск сразу по всем текстам, возможно, не так искал, если такой поиск есть, подскажите, пжл.

 

You need to be logged in to post in the forum