Библиографическая обработка документов в АБИС. Назначение и общая характеристика коммуникативных (обменных) форматов)
⇐ ПредыдущаяСтр 2 из 2 Каждая запись в электронном каталоге библиотеки состоит из набора характеризующих документ элементов (библиографическое описание и др.). Способом отображения этих элементов является формат, предназначенный для кодирования элементов библиографических записей. В любой компьютерной программе, работающей с библиографическими записями, может использоваться свой внутренний формат, особенно это касается СУБД, например, многие первые СУБД имели по умолчанию формат «dbf», а в MS Access используется формат «mdb», о чѐм свидетельствуют типы файлов (расширения) с БД в этих СУБД. А, например, в отечественной СУБД АИБС «МАРК» использовался собственный внутренний формат «ldb». Формат может иметь формализованную (как правило, табличную) и неформализованную структуру. Названные выше форматы «dbf» и «mdb» относятся к формализованным, а формат «ldb» − к неформализованным структурам. Использование каждой из них имеет свои достоинства и недостатки. Так, например, в формализованных структурах используется фиксированная длина любого поля электронной библиографической записи. В этом случае, как правило, такая БД обладает значительной избыточностью, то есть еѐ объѐм больше чем фактическое количество хранящихся в БД данных. Например, для формирования поля фамилии автора необходимо установить его длину, соответствующую максимально возможной фамилии. Пусть длина такого поля выбрана равная 25 символам. Большинство отечественных (славянских) и особенно азиатских фамилий имеют гораздо меньшую длину (от двух до 8 символов). В этих случаях остальные символы в данном поле будут учитываться и восприниматься как пробелы. В мире проблемами автоматизации библиотечных процессов занимаются достаточно давно. Известно, что в 1965 году Библиотекой конгресса США разработан формат представления в ЭВМ разделѐнных на записи библиографических данных. Формат получил называние MARC (англ. «Machine Reading Catalog» или «Machine Readable Cataloging»), что означает машиночитаемый каталог или машиночитаемая каталогизация.
Каждая запись в нѐм соответствует описанию библиографического документа и содержит набор элементов, обеспечивающих осуществление поиска. Структура формата обеспечивает описание различных видов информации (книги, сериальные, периодические и многотомные и здания, рукописи, карты, ноты и др.), имеет 999 полей с подполями. Причѐм поле может содержать до 15 подполей, а сам формат является неформализованной структурой. Это означает, что все записи БД представляют собой как бы непрерывную строку, в которой поля, подполя библиографических записей и сами записи разделяются специальными символами. В начале каждой записи в данном формате указывается тип и количество символов в ней, затем идут цифровые коды описанных полей, а за ними − собственно содержание полей с указанием буквенных кодов подполей. Формат является основой формирования электронных каталогов библиотек и библиографических БД. К концу 1970-х годов в США, Великобритания, Франция, Канада и Япония сформирована концепция внедрения компьютеров в практику библиотечной работы. В этих странах создавались собственные MARC-подобные форматы. Ныне аналогичные форматы широко используются в большинстве библиотечных систем в Европе. Очевидно, что даже MARC-подобные форматы в различных странах (зачастую и внутри одной страны) будут несколько отличаться друг от друга, поскольку содержат некоторые традиционные для этих стран представления и технологии формирования библиографических описаний. Различия между внутрибиблиотечными форматами обусловлены следующими факторами:
разной практикой каталогизации, различиями в технологии обработки поступлений, различием в выходных формах (картотеки, каталоги, внутренние документы и т.д.), используемым программным обеспечением. Для решения данной проблемы в 1980 году создаѐтся универсальный формат обмена данными между разными автоматизированными библиотечными системами, имеющимися в различных странах планеты − UNIMARC (Международный формат представления библиографических данных для автоматизированной обработки). Он является коммуникативныМ форматом вешнего представления обмениваемых данных. В данный формат конвертируются любые MARC-подобные форматы. (В данном случае речь идѐт о преобразовании данных из одного формата в другойс максимально точным переносом данных из полей одной БД в соответствующие поля другой БД.) Чем ближе внутренний формат к формату обмена, тем легче осуществлять однозначную конвертацию (конвертирование) данных. На американском континенте и в ряде других частей света в качестве внутрисистемного и коммуникативного формата одновременно используется USMARC, который после доработки получил название MARC21. Хотя данное положение целесообразно учитывать при проектировании АБИС, это не означает, что внутренний формат должен фактически являться (полностью соответствовать) обменным форматом, что в отдельных случаях имеет место в нашей стране, например, АИБС «Академия» СПбУКИ базируется на обменном формате UNIMARC. Большинство стран Европы ориентируются на UNIMARC как на коммуникативный формат обмена библиографической информацией. Основной целью создания формата UNIMARC является содействие международному обмену данными в машиночитаемой форме между национальными библиографическими службами. Коммуникативный формат MARC должен обеспечивать: возможность его применения для всех видов библиотечных документов; достаточную гибкость для решения разнообразных задач в дополнение к каталогизации; удобство применения в различных автоматизированных системах. Таким образом, к концу прошлого столетия в мире для АБИС наибольшее распространение получили два формата, фактически выполняющих роль международных стандартов: USМАRC и UNIМАRC. Существует ряд программ-конверторов, как правило, поставляемых вместе с программными средствами, или встроенных в технологии приѐма/передачи информации в корпоративных АБИС. В этой связи целесообразно использовать, например, универсальный конвертор UNIMARC-USMARC.
В России октябре 1995 года было принято решение создать РоссийскийНациональный формат, получивший название RUSMARC. Национальный коммуникативный стандарт RUSМАRC создавался на основе формата UNIMARC в редакции 1994 года и ныне активно применяется. MARC-формат прежде всего стандарт структуры данных, а не стандарт содержания. Содержание записи регламентируются правилами каталогизации, системой предметизации и т. д. Пример записей в MARC-формате. 00934nam 22002297 0004000664-RU/IS/BASE/122547147-20040204005324.7- a5-98032-292-2c20-00- aУхтинский государственный технический университетe19.11.2003- a67-c67.405e156977;156978;156979;156980;156981fчзЛ;чзВ;абВxТ 78- a67.405- -b12.11.03- bbiblio4- aнаучная- aТрудовой кодекс Российской ФедерацииbС изм. и доп. на 15 сент. 2003 г.- aМ.bПроф. юрид. системы "Кодекс": Проспектc2003- a192 с.- aТекст кодекса подготовлен с использованием профессиональной юридической системы "Кодекс", сверен с официальным источником и приводится по состоянию на 15 сентября 2003 года.- -aШирокая публика- aЮридические науки- aТрудовой кодекс; Российская Федерация; Юриспруденция- b5d12.11.03e5f12.11.03j5t16аv5- Вводимая в АБИС библиографическая информация в формате MARC представлена на Рис. 58а. Рис. 58а. MARC-записи, накопленные за время использования формата, представляют собой огромный массив стандартизированных данных. Задача библиотечных систем – максимально использовать это стандартизированное, структурированное содержание, которое признается не только библиотечным сообществом. Поисковые службы Интернета предпринимают усилия к интеграции традиционного библиотечного содержания и служб в своих поисковых машинах. В качестве примеров можно назвать два проекта Google: 1. Google LibraryThing – веб-приложение для создания каталогов библиотек любого уровня, хранения и обмена библиографическими записями. Основная функция LibraryThing – это импорт данных от книготорговых организаций и библиотек, при этом библиотеки поставляют записи в MARC-формате и DC. 2. Google BookSearch – проект, направленный на создание всеобъемлющего виртуального каталога для поиска всех книг на всех языках при участии издательств и библиотек. В мае 2008 года подписано соглашение между Google и OCLC, в соответствии с которым, в частности, библиотеки-партнеры OCLC передают в BookSearch свои MARC-записи, расширяя возможности доступа к библиотечным коллекциям через веб.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|