DictionaryForumContacts

 Redni

1 2 3 all

link 7.01.2007 7:07 
Subject: ОФФ: Открытая Русская Электронная Библиотека
Думаю, не все знают, что в настоящее время Российская государственная библиотека (бывшая им. Ленина) продолжает проект по созданию базы русскоязычных документов. Ее главное преимущество - возможность работы с электронными версиями документов, которые хранятся в библиотеке, не выходя из дома. Сейчас уже собраны
8189 книги
1692 диссертации
78 карты
3 коллекции
7 проектов
7 документов
- по самым разным областям знаний. Здесь и художественные произведения и исследования, и справочно-библиографические материалы. В том числе и по переводоведению. В общем, думаю, всем будет интересно там покопаться. (Может, кто свое что-нибудь предложит.)

Такая вот социальная реклама :)))))

http://orel.rsl.ru/

 denghu

link 7.01.2007 11:42 
Спасибо за ссылку, Редни!

 Brains

link 7.01.2007 15:09 
Покопался. Фундаментальная потёмкинская деревня.
Не имея какой-то конкретной цели, решил по старой привычке просто забраться в глубины каталога и на пробу взглянуть на первую же книгу, которая привлечёт внимание.
Из подраздела Культура. Наука. Просвещение. раздела Общественные и гуманитарные науки скачиваю источник, обозначенный как Классификация библиографии [Электрон. текстовые данные] / Б.С. Боднарский ; Открытая русская электронная библиотека. Смотрю.
Крайне небрежно отсканированная отлично настроенным сканером книга зачем-то записана в формат DjVu, единственное достоинство которого — очень неплохое качество при наименьшем размере файла среди всех существующих форматов электронных книг. Ни один из имеющихся у меня вьюеров, специально под этот формат заточенных, в принципе не предусматривает просмотра чего бы то ни было, кроме результата сканирования (похоже, что и сам формат не предусматривает фиксации каких-либо метаданных, так что библиографическую запись можно и не искать). При этом начинается файл не с обложки и даже не с титульного листа, а с 26 страницы.
Дальше больше. И рубрика, которая отчего-то дала название источнику, и фамилия автора указаны в каталоге сайта неверно, поскольку в оригинале используется дореформенная орфография: Боднарскій, Б. С. Классификація библіографіи. Такое не удивило бы, имей я дело с персональным любительским сайтом наколенной сборки, но — РГБ (в девичестве Ленинка)?..
Книга ни разу не распознана, так что просто надёргать оттуда цитат не получится. Дареному коню, конечно, в зубы не смотрят, и, достав свой бубен и весло, после сеанса гребли с пляской текст я оттуда вытащу. Но возникает простой вопрос: за каким лешим одной из основных российских книжных сокровищниц потребовалось делать электронную книгу в формате, которого не признаёт половина распознавалок с FineReader во главе? Хотя что там распознавалки: сама Концепция электронной библиотеки Российской государственной библиотеки его не признаёт:
Для представления полных текстов в ЭБ используются:
* формат PDF в качестве основного формата;
* форматы DOC, TXT;
* форматы для изображений TIFF, JPEG;
* гипертекстовый язык разметки HTML;
* в дальнейшем также расширенный язык разметки текста XML; при этом для всех типов документов, включаемых в ЭБ, определяются стандартные или специфические DTD в качестве грамматик, описывающих комплекс меток XML и их взаимосвязей.

Выше я назвал книгу небрежно отсканированной хорошо настроенным сканером. С самого начала казалось странным это сочетание идеальной чистоты скана (марашки можно пересчитать по пальцам!) с полосами набора, которые перекошены на одних страницах и лежат чуть не в обрез на других. Я присмотрелся повнимательнее и всё понял.
Передо мной был образчик того, что на языке ГУЛАГа именуется туфтой. Поясню для непосвящённых.
Оцифровка книг — занятие крайне муторное и многотрудное, а, главное, медленное. Что очень плохо сочетается с такими штуками как отчётность и показатели. Ставить во главу угла интересы сохранения культурного наследия для будущих поколений означает проявлять вопиющее непонимание требований момента. Для отчётности требуется имитация кипучей деятельности, валовые показатели, а реальный результат — дело десятое.
При этом в каждой серьёзной научной библиотеке имеется огромный архив микрофильмов (а иногда и микрофишей), на которые примерно с начала 70-х годов прошлого века переснимались источники из фондов. Делалось это обычно по заказам иногородних читателей и организаций, иногда — чтобы не посылать по МБА оригинал редкой книги. Для считывания этих аналоговых носителей требовалась громоздкая неудобная аппаратура, так что с наступлением электронной эры о них надолго забыли.
Что делает некое рачительное ответственное лицо, близкое к Совету директоров РГБ? Для нужд группы сканирования в рамках Отдела поддержки ЭБ (ОПЭБ) приобретается так называемый бюджетный (то есть урезанный по самое некуда) вариант библиотечного пленочного сканера. В таком виде он, в принципе, способен качественно сканировать нерезанные рулонные пленки, но прилагаемое ПО, во-первых, работает ровно на уплаченную сумму, а во-вторых, записывает результат сканирования в бюджетный же формат — DjVu. Последний, правда, не предусмотрен нормативными документами самой РГБ, да кто будет вдаваться в такие дебри? Зато даже такая машинка избавляет от возни с бумажными оригиналами, что ускоряет работу раз в 10! А то и в 15, поскольку стабильное и близкое к идеальному качество изображения на микрофильмах и стандартный формат кадра позволяет сканировать практически без перенастройки. Именно в таком режиме можно получить характерные огрехи, описанные выше.
Становится понятным и то, что документ начинается с 26 страницы: заказывая микрофильм на свои деньги, иногородний читатель нередко указывал диапазон страниц, которые нужно отснять. Естественно, что на копии, которая оставалась в фондах библиотеки, присутствовали только они. Правда, Концепция электронной библиотеки Российской государственной библиотеки предполагает, будто
На каждый многостраничный документ, включаемый в ЭБ, формируется новый титульный лист. Только это ведь требовало бы уже дополнительных поисков в бумажных каталогах (с такой книгой на общий ЭК РГБ надежды мало) — кому оно надо, пока за руку не схватят? Издаля-то всё красиво: Открытая русская электронная библиотека сегодня насчитывает 8189 книги (так и написано)…
Всё остальное проистекает из уже описанного подхода. Для создателей ресурса — подчёркиваю: типа профессиональных библиографов и культуроведов! — вполне естественно (как, впрочем, и для Redni), что алфавитный поиск возможен исключительно по буквам русского послереформенного алфавита. (У составителей Концепции хватило ума не заявить на весь мир о принципиальном пан(сов)русизме своего детища).
Ни к чему не приводит попытка выяснить, когда же, кем издана и как называлась на самом деле скачанная мною книга поиском по каталогам РГБ: фамилия, указанная нормально (Боднарскій) даёт 0 результатов, а написанная в интерпретации библиографов сайта (Боднарский) выводит на всё тот же кастрированный электронный документ со школярской имитацией библиографической записи. Наша песня хороша, начинай сначала.
Учёные, мля… Мудрые и бескорыстные служители Знания…

 Redni

link 7.01.2007 15:26 
Brains, мое почтение! Хотя Вы и весьма нелестно вписываете меня в рамки ценителей данной библиотеки. Однако делаете это, надо отдать Вам должное, очень интересно. Поэтому большое спасибо за исчерпывающий комментарий. Даже больше: с некоторыми претензиями я полностью согласен.
Кроме того, могу ли позволить себе переслать Ваш комментарий руководству библиотеки? Или, может быть, Вы могли бы взять на себя такой труд?
Также хочу порекомендовать Вам воспользоваться поиском, например по слову "перевод*" (в поиске указывать без кавычек). Уверен, что в разделе диссертации Вы найдете несколько по крайней мере любопытных примеров в формате PDF.

 Brains

link 7.01.2007 16:25 
2 Redni
Brains, мое почтение! Хотя Вы и весьма нелестно вписываете меня в рамки ценителей данной библиотеки. Однако делаете это, надо отдать Вам должное, очень интересно.
Нет уж, давайте по-честному: чиста объективности для позволил себе съехидничать только по поводу Ваших слов о базе русскоязычных документов. Просто лыко в строку красиво ложилось: на это сайт взглянешь, так именно такое впечатление создаётся. А ни про каких ценителей речи не было. ;-))))
Кроме того, могу ли позволить себе переслать Ваш комментарий руководству библиотеки?
Бога ради! Глядишь, какая общественная полезность из этого получится.
Или, может быть, Вы могли бы взять на себя такой труд?
Да мелькнула у меня поначалу такая мысль, оттого и накатал целую монографию… А потом подумал, что это запросто могут воспринять как необъективное и пристрастное частное мнение (или примут за подковёрные происки кого-то из обиженных сотрудников).
Так что если будет не влом, сделайте это Вы. По крайней мере, будет уже два сходных мнения.
Уверен, что в разделе диссертации Вы найдете несколько по крайней мере любопытных примеров в формате PDF.
Так они сразу пишут, что и PDF тоже имеется, кто спорит. Я ведь просто описал, что получается с первого захода… И вообще использование формата DjVu для какой-либо научной деятельности представляется по меньшей мере нелепостью. Ламерство ведь чистой воды.

 tumanov

link 7.01.2007 17:09 
вопрос: а что за формат mrc и чем его читать?

натолкнулся на "деревянный сердечник для трансформатора" и хочу узнать, это ошибка автора книги или каталогизаторов. А книга в интересном формате:
......
20. Штехер, М.С. Топлива и рабочие тела для электродвигателей [Электрон. текстовые данные] / Штехер М.С.; Библиотека "Колхоз"

Штехер М.С. Топлива и рабочие тела для электродвигателей М.: Машиностроение, 1976

Открытая Русская электронная библиотека Электронный ресурс
...

 Brains

link 7.01.2007 17:29 

 tumanov

link 7.01.2007 17:46 
не получилось
это что-то отсюда

http://filext.com/detaillist.php?extdetail=.mrc&Search=Search

 Brains

link 7.01.2007 18:08 
Постойте, tumanov, но если это формат MARC, то Вы-то как вознамерились его прочесть и, главное, зачем? Я-то по наивности Вам поверил, что они документ в таком формате записали. Но ведь во всей документации к формату ясно говорится: The MARC formats are standards for the representation and communication of bibliographic and related information in machine-readable form! Вы его не прочтёте, пока не станете компьютером: это же просто машиночитаемый формат библиографического описания. А оно у Вас и так есть в человекочитаемом виде. :-)))

 tumanov

link 7.01.2007 18:55 
так где же оно? я щелкаю на ссылке электронный ресурс, он не открывается. Сбоку три варианта: сигла. загрузить. в корзину

про топливо для электродвигателей - не открывается
как устроены вертолеты - не открывается

куда ни ткни - не открывается
может я какие секретные книги хочу почитать??

Photobucket - Video and Image Hosting

Get short URL | Pages 1 2 3 all