Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Форматы машиночитаемых данных: история, назначение и структура




ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА

(специалиста)

 

Машиночитаемые форматы представления данных (MARC): история и современное состояние

 

Выполнил студент Блинова Софья Владимировна
группы БИФ/21663 __________________________________ (подпись, дата)
Специальность 071201 «Библиотечно-информационная деятельность»
Специализация Технологии создания электронных документов и баз данных
Форма обучения Заочная
Научный руководитель Жабко Елена Викторовна
  __________________________________ (подпись, дата)
Рецензент  
  __________________________________ (подпись, дата)

 

Санкт-Петербург

 

Оглавление

 

ВВЕДЕНИЕ.. 4

ГЛАВА 1. Возникновение MARC-форматов: опыт зарубежной каталогизации 6

1.1. Форматы машиночитаемых данных: история, назначение и структура. 6

1.2. Виды MARC-форматов. 23

1.3. Формат для представления библиографических данных. 33

1.4. Формат для представления авторитетных данных………………………. 37

1.5. Формат для представления классификационных данных……………… 44

Выводы по первой главе. 45

ГЛАВА 2. Развитие машиночитаемой каталогизации в библиотеках России…... 46

2.1. Программа ЛИБНЕТ: роль в развитии машиночитаемой каталогизации в России 46

2.2. Создание формата RUSMARC: его виды и использование в россиийских библиотеках 49

2.3. Национальный информационно-библиотечный центр ЛИБНЕТ как центр организации корпоративной каталогизации в России. 50

2.4. Технология формирования машиночитаемых записей в формате RUSMARC для Сводного каталога библиотек России (СКБР)……………….

2.5. Поиск информации в Сводном каталоге библиотек России

Выводы ко второй главе………………………………………………………...66

Заключение. 69

Список использованной литературы.. 73

Приложение 1. Структура MARC- записи……………………………………..

 

Приложение 2. Примеры записей на однотомные, многотомные, сериальные издания в формате RUSMARC…………………………………………………

Приложение 3. Примеры записей на специальные виды документов……..

Приложение 4. Примеры авторитетных записей………………………….

Приложение 5. Схема сети ЛИБНЕТ……………………………………….

Приложение 6. Записи, составленные библиотеками-участницами СКБР в январе 2014 года……………………………………………………………

Приложение 7. Поисковые формы в СКБР. Ключи поиска…………….

Приложение 8. Форматы вывода результатов поиска в СКБР………….

Приложение 9. Поиск информации по адресным запросам……………

 

ВВЕДЕНИЕ

 

 

Актуальность темы. Внедрение в библиотеки электронной формы каталога и появившаяся возможность использования телекоммуникаций для создания и обмена БЗ привели к переменам, заставившим пересмотреть основополагающие принципы каталогизации. Качество и эффективность электронного каталога обусловлены комплексом методов и средств, определяющих технологию его создания и использования. Работа по внедрению формализованных и унифицированных записей в формате MARC в электронные каталоги библиотек продолжается до сих пор.

Цель работы – обобщение опыта создания и использования MARC форматов для разработки рекомендаций по совершенствованию лингвистических средств поиска в электронном каталоге.

Задачи исследования:

1. Представить историю создания машиночитаемого формата MARC, раскрыть его назначение и структуру.

2. Рассмотреть виды MARC- формата.

3. Отобразить историю развития машиночитаемой каталогизации России. Рассмотреть положения программы ЛИБНЕТ.

4. Представить систему форматов RUSMARC.

5. Рассмотреть работу НИБЦ ЛИБНЕТ как центр организации корпоративной каталогизации в России.

6. Отобразить технологию формирования машиночитаемых записей в формате RUSMARC.

7. Провести исследование в Сводном каталоге библиотек России по поиску документов с применением полей формата RUSMARC.

Объект исследования – машиночитаемые форматы представления данных MARC.

Предмет исследования – технология формирования записей и поиска информации в электронном каталоге с использованием формата RUSMARC.

Методы исследования: анализ и обобщение информации, представленной в литературе по рассматриваемой тематике, исследование на базе Сводного каталога библиотек России.

Структура работы. Работа состоит из введения, двух глав основной части, выводов (заключения), списка литературы и приложений.

Практическая направленность работы заключается в разработке рекомендаций по совершенствованию лингвистических средств электронного каталога и технологии поиска документов в СКБР для пользователей.

Во введении рассмотрена актуальность выбора темы, определена цель, предмет, объект и соответствующие задачи, приведены методы исследования, показана практическая значимость.

В первой главе рассматривается возникновение MARC- формата, его назначение, виды, структура и опыт использования в зарубежной каталогизации.

Во второй главе рассматривается развитие машиночитаемой каталогизации в России: развитие и роль программы ЛИБНЕТ, история и причины создания формата RUSMARC, значение работы центра ЛИБНЕТ в корпоративной каталогизации в России. Создается технология создания машиночитаемых записей в формате RUSMARC, а так же проводится анализ поисковых возможностей Сводного каталога библиотек России.

 

ГЛАВА 1. ВОЗНИКНОВЕНИЕ MARC-ФОРМАТОВ: ОПЫТ ЗАРУБЕЖНОЙ КАТАЛОГИЗАЦИИ

ФОРМАТЫ МАШИНОЧИТАЕМЫХ ДАННЫХ: ИСТОРИЯ, НАЗНАЧЕНИЕ И СТРУКТУРА

 

Формат MARC обеспечивает удобный способ хранения библиографических данных и обмена ими. При этом он характеризуется возможностью применения его для всех видов библиотечных документов, гибкостью для решения разнообразных задач в дополнение к основной и удобством применения в различных автоматизированных системах. MARC- это акроним названия Machine-Readable Catalogue or Cataloging (машиночитаемый каталог или каталогизация). [40, с. 44].

Библиотека Конгресса в 1965 – 1966 гг. разработала проект, получивший название MARC I. Целью его являлось исследование возможности получения библиографического описания в машиночитаемой форме. Участниками проекта стали 16 крупнейших библиотек США, Канады, а также Библиотека Британского музея. Аналогичная работа проводилась и в Великобритании. Совет по Британской национальной библиографии подготовил проект BNB MARC, в котором ставилась задача использования машиночитаемых данных при подготовке и выпуске печатного издания Британской национальной библиографии. В 1968 г. формат MARC был утвержден, и начала свою деятельность. Служа по распространению машиночитаемой информации в формате MARC. Потребовалось некоторое время для того, чтобы магнитные ленты MARC распространились в библиотечном деле США и стали достойной альтернативой печатным каталожным карточкам [36, C. 30]. Эти параллельные исследования двух стран послужили началом англоамериканского сотрудничества по созданию проекта MARC II, ориентированного на использование формата MARC в качестве коммуникативного.

Принципы, заложенные в MARC II, оставались неизменными на протяжении многих лет: ориентация формата на все виды документов, решение разнообразных информационно-библиотечных задач, включая каталогизацию и возможность применения его в различных автоматизированных системах.

Несмотря на сотрудничество стран в области создания машиночитаемой каталогизации, вскоре появилось несколько версий формата MARC. Это UKMARC (Великобритания), USMARC (США), INTER-MARC – формат для франкоговорящих стран (Франции, Бельгии и соответствующей части Швейцарии). С начала 1970-х семейство MARC увеличилось более чем на 20 форматов. Среди них CANMARC (Канада), FINMARC (Финляндия), OCLC (Онлайновый компьютерный библиотечный центр) и др. Базовым форматом для них послужил USMARC. Адаптация формата USMARC для описания визуальных материалов была предпринята в 1980 годах, этот вариант формата получил название MARC VM (MARC формат для описания визуальных материалов), но широкого распространения не получил, использовался в экспериментальных целях в ряде библиотек США (12 библиотек) [32, С. 277]. Появление такого количества форматов объяснялось расхождениями в национальных правилах каталогизации. В результате оказалось невозможно осуществлять обмен информацией между системами, использующими различные форматы. Для преодоления несовместимости MARC-форматов в 1977 году на уровне ИФЛА (Международная федерация библиотечных ассоциаций и учреждений) было принято решение о разработке формата-посредника, который получил название UNIMARC, то есть «Универсальный MARC». Его целью провозглашено «...содействие международному обмену данными в машиночитаемой форме между национальными библиографическими службами». Он был ориентирован на обработку только книг и сериальных изданий, но в нем были определены предварительные поля для различных некнижных материалов, таких как музыкальные произведения, кинофильмы, аудиодиски и т.д. Второе издание формата UNIMARC, вышедшее в 1980 г., было дополнено полями, позволяющими обрабатывать картографические материалы. Кроме того, были актуализированы некоторые поля, относящиеся к продолжающимся ресурсам и монографиям. Следующее издание опубликовано в 1983 г. уже под иным названием - UNIMARC Handbook. Это было расширенное издание, содержащее подробные комментарии. В 1987 г. формат вышел под новым названием - UNIMARC Manual. В формате был изменен предварительный статус полей, относящихся к звукозаписям, музыкально-проекционным материалам, видеозаписям, кинофильмам, графике, нотным изданиям и микроформам. Поля для электронных ресурсов были определены как предварительные. В 1994 г. выходит второе издание формата UNIMARC Manual и имеет уже конкретное название - UNIMARC Manual Bibliographic Format.

Одним из критериев новизны формата как отмечает Лобанова Э.Ш., следует считать разработку новых полей. Изменения и дополнения №1 содержат одиннадцать новых полей, №2 – три поля, №3 – четыре поля, №4 и №5 – по семь полей. Характер изменений достаточно разнообразный – это новые поля, изменение названий, и функций некоторых полей, изменение нагрузки индикаторов и дополнительный ввод индикаторов в отдельные поля [15, С. 68-69]

Для реализации процесса обмена каждой национальной службе достаточно было составить два конвертора: один для конвертирования в UNIMARC, другой – из UNIMARC – вместо специальных программ конвертирования в каждый из форматов MARC. Для этого создан европейский проект, получивший название UseMARCON (User Controlled Generic Converter). Координатором проекта является Королевская библиотека Голландии. Участники проекта – Национальная библиотека Португалии, Британская библиотека, Немецкая библиотека. Ответственной за программное обеспечение является YAUVE (Франция).

Программа-конвертор состояла из 3 блоков: в первом блоке программа-конвертор считывает те данные из файла, которые необходимо конвертировать; второй блок является основным и самым сложным (в нём, собственно, и происходит конвертирование данных, происходит перестраивание маркера, конвертирование справочника, перевод всех меток полей, подполей и индикаторов, которые не совпадают); в третьем блоке новая запись записывается в новый файл, который и будет отображать форму записи нового формата. [5,.С. 122].

В 1990-е гг. отмечается дальнейший рост числа MARC – форматов. Их насчитывается уже свыше 50, особенно таких, исходной базой которых явился UNIMARC. Несмотря на то, что основным назначением UNIMARC является обеспечение международного обмена библиографическими данными, он может использоваться и как модель для создания новых машиночитаемых форматов. К числу самых новых, разработанных на базе UNIMARC, можно отнести RUSMARC (Россия), BELMARC (Республика Беларусь), UKRMARC (Украина). В двух словах можно определить весь алгоритм разработки национальных форматов и в качестве базового берется USMARC или UNIMARC, затем осуществляется его привязка к национальным правилам каталогизации [42, С. 30]. Реальный шаг в интеграции форматов был сделан США и Канадой. Результатом взаимодействия было согласование форматов USMARC и CANMARC и создание на их базе единого, который получил символическое название MARC 21. Привлекателен формат MARC 21 тем, что имеет более существенную поддержку, чем UNIMARC, во-вторых, подавляющее большинство машиночитаемых описаний в мире существует в формате USMARC, и есть понятный соблазн работать в том же формате, чтобы без труда обмениваться библиографической информацией. В-третьих, большинство фирм производящих автоматизированные библиотечные системы, ориентированы на MARC 21 [40, С. 46.]. В настоящее время формат MARC 21 для описания архивных документов используется в библиографирующих учреждениях при наличии в фондах книжных и архивных документов. В электронный каталог включается библиографическая запись в формате MARC 21 на фонд в целом, для просмотра полноценного иерархического архивного описания организуется ссылка на машиночитаемое представление описания архивных материалов в формате EAD (DTD) (Encoding Archival Description Document Type Definition, формат метаданных для описания архивных материалов). На конференции ИФЛА в Глазго Секция информационной технологии организовала рабочий семинар по метаданным. На этом семинаре была представлена модель MARC XML. В этом докладе освящается разработка схемы XML для MARC 21 и инструментарий для преобразований MARC XML. Описывается тесная связь между MARC XML и работой Международной организации по стандартизации (ISO) над стандартами, посвященной применению XML для MARC. Разработка XML – версии формата MARC 21 была насущной необходимостью. Приверженность элементам данных формата MARC 21, обусловленная экономическими факторами, распространение схем описания вне зоны контроля библиотечного сообщества и быстрое развитие программной среды поддержки XML диктовали необходимость эволюции MARC 21 в XML. В Библиотеке Конгресса США было решено воспользоваться достоинствами XML: сначала разработать запись стандарта MARC 21 на языке XML, потом создать ее упрощенный вариант- Схему описания объекта с помощью метаданных (Metadata Object Description Schema- MODS)- совместимый с MARC 21, а затем- подготовить набор совместимых средств преобразования записей. В результате такой деятельности появляются гибкие возможности преобразования записей в будущем, что позволит избежать появления множества различных вариантов XML- схем для MARC 21. В ряде случаев в формате MARC формируются записи на отдельные единицы хранения архивных документов, к примеру, фотографии [32, С. 276] На основе экспериментов с шаблонами DTD (Data Type Definition – Определение типа данных) на языке SGML (Standard Generalized Markup language – стандартный обобщенный язык разметки (стандарт описания офисных документов, утвержденный ИСО) Библиотека Конгресса в начале 2000-х гг. создала XML- схему для MARC 21. Ключевой характеристикой MARC XML является то, что она вырабатывает точный эквивалент записей MARC 21 (2709) таким образом, что при конвертировании информации туда и обратно не происходит потерь. Эта схема получила широкое распространение и легла в основу международного стандарта для XML – версии структуры MARC. Для примера приведем некоторые характеристики MARC XML- схемы. [21, С. 33-34]

1. Элементы высшего уровня - < collection> (коллекция) и < record> (запись) позволяют объединять группу записей в пакет и четко определять единичную запись.

2. Теги полей и индикаторы MARC 21 интерпретируются как атрибуты. Это позволило радикально сократить количество элементов первого уровня в MARC XML. Нужны только три базовых элемента, относящихся к формату: < leader> (заголовок),

< controlfield> (контрольное поле) и < datafield> (поле данных).

< datafield> имеет один дочерний элемент, < subfield> (подполе), который повторяется для каждого подполя, а < subfield> имеет атрибут для определения кода подполя.

Пример: < datafield tag = “082” ind1= “0” ind2= “0”>

< subfield code = “a”> 796.6/4/0943</subfield>

< subfield = “2”>20</subfield>

<datafield>

3. Содержимое каждого < controlfield> теги MARC 001-009 рассматривается как строка. Это значит, что для MARC 008, для которого кодированные элементы определяются по рапсположению символа, все 40 байтов из 008 трансформируются в XML, включая пробелы. XML имеет простую спецификацию схемы, которая не допускает сжатия пробелов или какого-либо иного их искажения, что необходимо для работы с некоторыми контрольными полями, как и со строками.

Пример: < cjntrolfield = “008”>931129s1994 wauab 001 0 eng</ controlfield>

4. < leader> (заголовок) также рассматривается как строка. Поскольку некоторая информация заголовка существенна только для записи ISO2709, то она просто переносится в тех случаях, когда при дальнейших трансформациях легко ее учитывать.

Пример: < leader>00637 cam 2200193 a 4500 </leader>. Вместо этого сопутствующие механизмы вызывают средства проверки правильности данных вне схемы в тех приложениях, где такая проверка необходима [21, С. 31-32].

Основные согласованные между собой форматы MARC являются широко распространёнными в мире стандартами для представления и обмена библиографическими, классификационными, авторитетными и холдинговыми данными в машиночитаемой форме.

Структура МАRС-записи определяет физическое представление и расположение данных в записи в форме цепочек символов, которые называются поля; структура записи полностью соответствует положениям международного стандарта ISO 2709.

Запись MARC состоит из трех элементов: структуры записи, определения содержания и содержания данных записи.

Структура записи предназначена для контроля над представлением данных при хранении их в форме символьных строк, называемых полями. Все данные в записи должны храниться с использованием одного или более наборов символов. Поскольку компьютеры могут хранить и обрабатывать только цифровую информацию, каждому символу (например, алфавитному) присваивается цифровое значение в соответствии с правилами определённого набора символов. Структура записи, установленная в формате MARC, является реализацией международного стандарта Format for bibliographic information interchange on magnetic tape (ISO 2709).

Определение содержания – коды и условные обозначения, установленные специально для идентификации и последующей характеристики элементов данных в записи, а также для манипулирования этими данными. Элементы данных, обеспечивающие поиск по автору, заглавию и тематике, при необходимости могут сопровождаться дополнительными характеристиками, что обеспечивает множество точек доступа к данным при поиске, исключает при необходимости отдельные элементы записи.

В основном, MARC обеспечивает определение содержания лишь для тех данных, которые относятся ко всем видам копий определенной работы. Однако информация, относящаяся к отдельным или даже одному виду копий, может представлять интерес не только для организации-хранителя. В таких случаях в формате MARC принимаются специальные поля для приведения более детальной информации.

Содержание данных записи. Под содержанием понимаются данные, которые хранятся в полях записи. Данные могут быть кодированными или библиографическими:

- Кодированные данные используются для представления таких элементов, как контрольные номера, тип публикации и основной язык текста, а также для представления характеристик специальных видов документов таких, например, как нотные издания.

- Библиографические данные определяются правилами Международного стандартного библиографического описания для конкретных видов документов. Кроме того, каждая запись может содержать индекс классификации и предметные рубрики. [1, с. 62].

Содержание элементов данных, которые составляют запись MARC, обычно устанавливается в соответствии со следующими правилами и стандартами: International Standard Bibliographic Description (ISBD) (Международный стандарт на библиографическое описание), Anglo-American Cataloguing Rules, 2-nd ed.(AACR2) (Англо-американские правила каталогизации, 2-е изд.) или другими регламентирующими документами, которые используются организацией, составляющей запись. [15, с. 73].

Запись MARC содержит такие указатели данных: Поле, Метка, Индикатор, Подполе, Код подполя и Определитель содержания.

Поле – основная структурная единица записи, соответствующая одной области библиографического описания, одной предметной рубрике, одному шифру хранения и т.д. Каждая область данных в БЗ в MARC-записи записывается в отдельном поле.

Эти поля подразделяются на одно или несколько «подполей». Текстовые наименования полей слишком длинные, чтобы их приводить в каждой записи MARC. Вместо этого поля представляются 3-х цифровыми метками.

Метка: Каждое поле ассоциируется с трёхцифровым числом, которое называется меткой. Метка идентифицирует поле (тип данных), которое следует после неё. Даже если на экране дисплея сразу после метки выведены ещё и индикаторы (таким образом, может появиться число из 4 или 5 цифр), метка всегда представляет собой первые три цифры.

Большинство полей дополнительно определяются индикаторами. Индикато р – это цифровой или буквенный символ, связанный с полем, представляющий дополнительную информацию о содержании поля, взаимосвязи между данным полем и другими полями в записи, или о том, каким образом система должна использовать данные поля.

В МАRС-формате установлены две позиции индикаторов. Они располагаются непосредственно после метки поля. Индикаторы могут иметь цифровое значение, либо знак пробела, если значение индикатора в формате не установлено [10, с. 39].

Каждое поле состоит из Маркера и Справочника:

Маркер – элементы данных, обеспечивающие информацию, необходимую для обработки записи. Элементы данных содержат цифры или кодированные значения и идентифицируются соответствующими позициями символов. Маркер имеет фиксированную длину 24 позиции символов и является первым полем записи MARC.

Коды в маркере определяют статус записи, тип записи, библиографический уровень документа, положение в иерархии уровней, степень полноты информации в записи, использование правил ISBD. Значение символа в маркере определяется позицией символа. [10, с. 40].

Справочник – ряд статей, содержащих метку, длину и начальную позицию каждого переменного поля внутри записи. Следует за маркером и определяет наличие и порядок полей в записи. Статья справочника имеет длину 12 символов и включает три характеристики поля: метка поля – 3 символа, длина поля – 4 символа, позиция начального символа (т.е. с какой позиции начинается поле) – 5 символов.

Поля переменной длины. Данные записи в формате MARC распределены по полям переменной длины, каждое из которых идентифицировано меткой поля, состоящей из трёх цифр и хранящейся в статье Справочника для этого поля. Каждое поле заканчивается символом конца поля. Последнее переменное поле заканчивается символами как конца поля, так и конца записи. Существует два типа полей переменной длины:

• Контрольные поля переменной длины – это поля группы 00Х. Эти поля идентифицируются меткой поля в справочнике записи, но не имеют ни индикаторов, ни подполей. Контрольные поля переменной длины структурно отличаются от полей данных переменной длины. В них содержится или один элемент данных, или набор позиционно определяемых элементов данных фиксированной длины.

• Поля данных переменной длины – это поля 0ХХ-9ХХ. Кроме метки поля в справочнике записи они содержат две позиции индикатора в начале каждого поля и двухсимвольный код подполя перед каждым элементом данных внутри поля. [1, с. 64].

Содержательная часть записи MARC была условно разделена на две группы полей: поля каталогизационной информации; поля дополнительной (преимущественно, кодированной) информации.

Первую из названных групп в MARC составляют поля, которые сгруппированы в так называемые блоки описательной информации, примечаний, взаимосвязанных заглавий, определения тематики и интеллектуальной ответственности. Вторую группу представляют блоки кодированной информации и международного использования. Некоторые блоки UNIMARC содержат поля как каталогизационной, так и дополнительной информации (блоки идентификации и связи описаний) [15, с. 74].

Большинство полей состоят из одного или нескольких подполей. Подполе – минимальная структурная единица поля. Если поле соответствует области БО, то подполе можно соотнести с элементом библиографического описания. Такое дробное представление информации в поле позволяет более точно выделить данные для компьютерной обработки, например, для организации поиска по отдельным элементам.

В начале каждого подполя указывается его кодовое обозначение – идентификатор подполя. Идентификатор подполя всегда состоит из двух символов. Первый символ – разделитель, он указывает, что далее следует новый фрагмент информации. Различные программы математического обеспечения для представления разделителя на экране или в распечатке используют различные символы. Примерами могут служить двойной кинжал (Ø), знак «эт» (@), знак доллара ($), линия подчёркивания (_) и другие. Второй символ идентификатора – код подполя, буквенный или (реже) цифровой символ, определяющий тип информации в подполе.

Коды подполей предназначены для идентификации элементов данных, а не для их упорядочения. Порядок следования подполей обычно определяется применяемыми стандартами, такими как правила каталогизации. [15, с. 76].

При выводе записи на экран для пользователей ЭК, как правило, отражается не вся информация, которая содержится в МАRС-записи, а лишь та, что может представлять наибольший интерес для пользователей. Вообще говоря, МАRС-запись обеспечивает возможность гибкого и динамичного управления выводом записи на экран – любой полноты, в любом формате, с учетом потребностей пользователя. [10, с. 41].

Машиночитаемая запись, помимо традиционной библиографической информации (собственно библиографическое описание, точки доступа на имена лиц и наименования организаций, предметные рубрики и ключевые слова, индексы классификационных систем и т.д.), содержит и другие данные, обеспечивающие автоматическую обработку записи и более полный и точный поиск – в частности, поля связи, поля кодированных данных и т.д. [43, с. 132]

Каждый элемент данных в формате MARC идентифицируется для выполнения информационного поиска. Используя компьютерное программное обеспечение, можно вести поиск по большинству полей и подполей записи MARC.

Например: ключевые слова; предметные заголовки (рубрики); автор; имя/наименование, наименование темы, географическое название в качестве предметной рубрики; заглавие и заглавие серий; стандартные номера (ISBN, ISSN и т.п.) и номера, присвоенные специальными службами (службой национальной библиографии, правительственной службой печати и т.п.); индексы классификации; издатель; дата и тип издания; акронимы, составленные из слов имени/наименования и заглавия; кодированные данные.

Поскольку каждая запись MARC является самостоятельной единицей, каталог, содержащий множество таких записей, представляет собой усовершенствованную базу данных, соответствующую широким поисковым стратегиям. Разнообразие поисковых вариантов зависит от применяемого программного обеспечения. [36, с. 31].

Информация в МARС-записях организована в соответствии с каждым форматом формирования записи – функциональные блоки. Первая цифра метки полей блока обозначает информацию, которая содержится в полях данного блока. Поля данных MARC создают 10 блоков:

0 – блок идентификации содержит международные стандартные номера. Поле 001 – индикатор записи – является обязательным.

1 – блок кодированной информации содержит коды документа (например, вид, характер, язык и т.п.). Поле 100 – данные общей обработки – является обязательным.

2 – блок описательной информации содержит важнейшие поля, описывающие документ, в том числе 200 – заглавие и сведения об ответственности (обязательное поле, особенно подполе «a»), 205 – сведения об издании, 210 – выходные данные, 215 – физические характеристики, 225 – серия.

3 – блок примечаний, приводимых в свободной форме, в том числе 300 – общие примечания, 320 – примечания о наличии библиографии и (или) вспомогательных указателей, 327 – примечания о содержании.

4 – блок связей записи позволяет связать два документа горизонтальными или вертикальными отношениями.

5 – блок связанных заглавий позволяет установить отношения между различными формами заглавия. Наиболее часто используемые поля: 510 – параллельное заглавие, 517 – разночтение заглавий; 541 – перевод заглавия.

6 – блок анализа содержания (блок определения тематики) направлен на раскрытие содержания документа – персоналии (600), предметные рубрики (606), ключевые слова (610), классификационные индексы (621 – ББК) и т.д.

7 – блок ответственности содержит имена лиц и названия организаций, принимавших участие в создании документа и несущих ответственность за него. Данные, введённые в это поле, являются точкой доступа. Различают первичную и альтернативную ответственность для авторов (первичная – у первого автора, альтернативная – у второго и третьего) и вторичную – для редакторов, оформителей, художников и т.д.

8 – блок международного использования содержит поля, прошедшие согласование и предназначенные для международного обмена записями. Среди полей обязательными являются 801 – источник составления записи и 856 – местонахождение электронного ресурса и доступ к нему. Последнее поле позволяет при нахождении библиографической записи нужного источника оценить возможность получения его полнотекстовой копии. В поле предусмотрены следующие варианты доступа: через электронную почту, по протоколу передачи данных (ftp), по протоколу гипертекстовой разметки (http), удалённый доступ (telnet), телефонный канал.

9 – блок локального использования.

Следует учитывать различие между коммуникативным форматом и форматом каталогизации. Отличие коммуникативного формата от формата каталогизации заключается в том, что коммуникативный формат регламентирует только набор данных, включая определители содержания (поля, подполя, индикаторы). В нем не оговорена форма, содержание или структура записи локальных систем. С другой стороны, некоторые- спецификации коммуникативного формата могут быть излишними для формата каталогизации. [10, с. 42].

Коммуникативный формат MARC должен обеспечивать:

· возможность его применения для всех видов библиотечных документов;

· достаточную гибкость для решения разнообразных задач в дополнение к каталогизации;

· удобство применения в различных автоматизированных системах. [36, c. 32].

 

ВИДЫ MARC-ФОРМАТОВ

 

В современном информационном мире насчитывается примерно 50 форматов, в названии которых есть общее слово «MARC», которому, как правило, предшествует или аббревиатура страны-разработчика формата, например USMARC, UKMARC, SAMARC (Южно-африканская республика), или ее сокращенное название: CANMARC, DANMARC, AUSMARC, JAPMARC и др. Не всегда название формата говорит напрямую о его принадлежности к определенной стране. Например, ANNAMARC – формат Италии. Формат не обязательно является принадлежностью какой-либо страны. В качестве примеров можно привести формат Амстердамского университета UBVUMARC и OCLC-MARC. Среди форматов семейства MARC несколько особняком стоит INTERMARC, который разрабатывался Францией, Бельгией и франкоязычной частью Швейцарии. Однако он реально используется во Франции только в Национальной библиотеке.

Форматы можно классифицировать по следующим параметрам:

1. Коммуникативные (обменные) форматы, обеспечивающие возможности обмена данными между системами. Эти форматы являются результатом соглашения, которое касается описания структуры и характера записей в массивах баз данных, предназначенных для обмена. Их принято делить по статусу (области распространения):

· Международные (UNIMARC, MARC 21).

· Государственные (USMARC, RUSMARC, Monocle, UNISIST).

· Корпоративные (обеспечивают обмен данными внутри группы организаций).

2. Внутрисистемные форматы, предназначенные для решения служебных и пользовательских задач конкретной системы. Их принято делить по содержанию записываемых данных:

· формат для библиографических записей (данных) – базовый формат, применяемый для описания документов любого вида;

· формат для авторитетных данных – содержит важнейшую информацию о точках доступа в библиографических записях (имена лиц, унифицированные заглавия, названия организаций, географические и предметные термины);

· формат для данных о фонде;

· формат для классификационных данных – содержит информацию о классификационных индексах, присваиваемых документу (сами индексы, пояснительные термины, ссылки и пр.);

· формат для общественной информации – содержит фактические данные (например, описание характера деятельности организации, контактную информацию и т.п.). Каждый формат выполняет свою функцию в рамках общей задачи - обеспечения создания и обмена библиографической информации.[16, с. 69].

Согласованность коммуникативных форматов, входящих в систему, определяется тремя основными составляющими машиночитаемых записей:

1. структурой записи, т.е. физическим представлением и схемой расположения компонентов записи - все форматы реализуют машиночитаемую запись в соответствии с международным стандартом ISO 2709;

2. определителями содержания, которые идентифицируют и дополняют информацию об элементах данных - для одинаковых данных используются одинаковые поля;

3. содержанием записи, т.е. данными, предназначенным для обмена.

Это обеспечивает возможность совместного использования библиографических, авторитетных, классификационных записей в библиотечных системах [10, с. 43].

Основным является формат для библиографических данных, разработанный с целью получения каталогизированного описания в машиночитаемой форме. Библиографический формат – это совокупность взаимосвязанных элементов данных, которая служит для создания, хранения и обмена библиографическими записями в машиночитаемой форме. Объектами описания с его применением стали практически все виды документов. Он предусматривает получение основного и всех видов добавочных описаний, а также раскрытие содержания документа.

Формат для авторитетных данных тесным образом связан с форматом для библиографических данных. Они содержат важнейшую информацию, представляющую собой точки доступа к библиографическим записям. Объектами описания являются все заголовки основных и добавочных описаний формата для библиографических данных, то есть имена лиц, наименования организаций и мероприятий, унифицированные заглавия, предметные термины. Определены два типа заголовков: установленный (авторитетный) – его форма используется для основных и добавочных записей и неустановленный – для организации авторитетного файла и ссылок. Неустановленный заголовок в библиографических записях не используется.

Формат данных о фондах не связан непосредственно с форматом для библиографических данных, как предыдущий. Его предназначение – дать детальную небиблиографическую информацию об описываемом документе, а именно: адрес местонахождения, шифр хранения, количество экземпляров, физическое состояние, методы приобретения, сроки хранения, возможность выдачи по абонементу, стоимость копирования его составной части и т.д. Для библиотек, не желающих поставлять такую подробную информацию, в формате для библиографических данных определено несколько полей для описания фондов. Он ориентирован на крупные библиотеки.

Форматпредоставляет информацию о фондах трех типов библиографических единиц, которые идентифицируются кодами в Маркере:

• однотомная единица, завершенная в одном физическом томе, например, картографический материал, партитура, однотомная книга, компьютерный файл;

• многотомная единица, завершенная или завершение которой планируется в определенном количестве физических единиц, например, набор картографических материалов, музыкальных партитур и частей, многотомная энц

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...