Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Лингвистическое обеспечение кспбм




5.3.1. В автоматизированных информационных системах выделение лингвистического обеспечения (ЛО) из состава информационного обеспечения и оформление его в качестве самостоятельной подсистемы службы или направления деятельности было фактически завершено к 1976 году и получило юридическое закрепление Постановлением от 30.09.81 «Об утверждении единого порядка разработки и развития автоматизированных систем НТИ». В настоящее время этот документ считается утратившим силу.

Основными нормативными актами, определяющими различные аспекты ЛО являются:

· ГОСТ7.49 – 84 Рубрикатор ГАСНТИ (новое название – Государственный рубрикатор НТИ). Структура, правила использования и ведения.

· ГОСТ 7.59 – 90 Индексирование документов. Общие требования к систематизации и предметизации.

· ГОСТ 34.201 – 89 Информационная технология. Комплекс стандартов на автоматизированные системы. Виды, комплектность и обозначения документов при создании автоматизированных систем.

· ГОСТ 34.003 – 90 Информационная технология. Термины и определения.

· РД – 50 – 34.698 – 90. Методические указания. Информационная технология. Комплекс стандартов на автоматизированные системы. Требования к содержанию документов.

· РД – 50 – 680 – 88. Методические указания. Автоматизированные системы. Основные положения.

· Руководство по применению международного коммуникативного формата UNIMARC.

· Форматы USMARC. Краткое описание.в 3-х частях.

· РД - Российский коммуникативный формат представления библиографических записей в машиночитаемой форме (см. также - [ 24-50 ]).

 

5.3.2. Лингвистическое обеспечение определяется с учетом указанных документов,как совокупность применяемых в технологии АБИС информационных языков (ИЯ), лингвистических процессоров и средств поддержки на актуальном уровне лингвопроцессорных и информационно-языковых словарей с целью выполнения следующих системных функций:

· Эффективный поиск в документальных и фактографических базах данных АБИС по тематическим запросам;

· Выпуск информационных изданий (только в части формирования систематических рядов в выпусках изданий);

· Обеспечение межсистемного информационного взаимодействия (в части прямого и обратного конвертирования записей документов и информационно-языковых словарей, их алфавитных и форматных преобразований, а также трансляции ПОДов с языков индексирования конкретной АБИС на ИЯ «посредники» - см. ниже).

Это определение объясняет необходимость отделения в условиях АБИС лингвистического обеспечения от информационного обеспечения.

5.3.3. В документальных БД КСПБМ необходимо обеспечить поиск как по широкотематическим запросам, так и по запросам, сформулированным с точностью до детальных понятий. Эффективными для поиска по широкотематическим запросам являются только классификационные ИПЯ, для поиска по детальным запросам – только вербальные ИПЯ. Тексты на вербальных и классификационных ИЯ не представляются взаимотранслируемыми. Следовательно, в составе ЛО требуется наличие хотя бы одного вербального и одного классификационного ИЯ.

Вопрос наличия в составе ЛО российских автоматизированных информационных и библиотечных систем ИЯ ГРНТИ решен ГОСТом 7.49 – 84 [ 41 ]. Одного этого классификационного ИЯ недостаточно, поскольку основная масса публичных библиотек его не использует. Минимум дополнительных классификационных ИЯ, обеспечивающий достаточно большое покрытие потребностей информационного взаимодействия отечественных и зарубежных библиотек это ИЯ - УДК, ББК и ДДК.

Наиболее эффективным среди вербальных ИПЯ является язык ключевых терминов. Наиболее распространенным вербальным ЯИ в библиотеках является язык предметных рубрик.

Однако ПОДы могут транслироваться с ЯИ предметных рубрик на ЯИ и далее на ИПЯ ключевых терминов. Использование в АБИС языка предметных рубрик в качестве ИПЯ представляется проблематичным (сложности с ведением и использованием словаря предметных рубрик, а также синтаксические трудности). Поэтому в состав ЛО КСПБМ язык предметных рубрик включен только как один из допустимых языков индексирования, а как основной – язык ключевых терминов.

Важно отметить, что в системе автоматизированных публичных библиотек Москвы и России ИПЯ ключевых терминов и т.н. «мешочная грамматика» построения ПОДов и поисковых предписаний (ПП) нашли наиболее широкое распространение. Причинами этого являются:

· Очень широкий тематический состав обрабатываемой литературы, делающий весьма проблематичным использование жёстко нормированной тезаурусами лексики;

· Отсутствие тезаурусов, охватывающих достаточно широкую тематическую область и отвечающих требованиям обеспечения необходимой глубины и точности индексирования обрабатываемой литературы;

· Наличие синтаксических трудностей индексирования документов и запросов жёстко нормированными терминами для уровня подготовки персонала автоматизированных библиотек и их пользователей;

· Относительная простота использования лексики ключевых терминов, близкой к естественному языку и др.

Однако одновременно приходится учитывать, что не контролируемое и не управляемое применение ИПЯ ключевых терминов приводит к значительным потерям в характеристиках полноты и точности поиска. Это связано, в частности, с произвольным выбором и построением индексаторами терминов, которые включаются в ПОДы, и неограниченным использованием синонимии и омонимии. С целью устранения указанных недостатков в КСПБМ должны использоваться методические рекомендации (см. [ 54, 55 ] и Приложение 2) по составлению ключевых слов, доработанные к условиям функционирования публичных библиотек и широко используемые уже в настоящее время как в Москве, так и других регионах России.

 

5.3.4. Лингвопроцессорный состав ЛО КСПБМ, является логическим следствием его информационно-языкового состава.

К числу лингвистических процессоров (ЛП) относятся:

· Внутренние трансляторы (ВТ), в том числе трансляторы ПОДов с одних ЯИ на другие ЯИ;

· Коммуникативные трансляторы, в том числе прямые коммуникативные трансляторы (ПКТ), т.е. трансляторы ПОДов с ЯИ на ЯП, и обратные коммуникативные трансляторы (ОКТ), т.е. трансляторы ПОДов с ЯП на ЯИ;

· Процессоры актуализации лингвопроцессорных и информационно-языковых словарей;

· Комплекс конверторов.

В состав комплекса конверторов могут входить:

· Конверторы преобразований алфавитных кодов,

· Конверторы форматных преобразований,

· Конверторы лексических преобразований и лексического контроля,

· Конверторы тематического отбора (только для документографических БД),

· Конверторы обогащения ПОДов (только для документографических БД),

· Конверторы диалоговой обработки лексики и др.

Состав используемых средств этого вида на последующих этапах развития Сети будет определён в процессе её технического и рабочего проектирования.

5.3.5. Лингвистическое обеспечение системы КСПБМ должно обеспечить:

· Индексирование документов и запросов,

· Эффективный поиск в документальных базах данных по содержательным запросам,

· Внутрисистемную лингвистическую совместимость электронных каталогов и БД библиотек Москвы а также лингвистическую совместимость КСПБМ с наиболее развитыми библиотечно-информационными сетями регионов России и западных стран, в первую очередь – с OCLC.

 

5.3.6. Полный состав средств ЛО, в наибольшей степени соответствующего этим задачам помимо упомянутых выше языков индексирования и лингвистических процессоров, должен также включать:

1. Словарные базы данных, используемые в процессах индексирования а также лексикографического и терминологического контроля входных записей документов и запросов пользователей, трансляции ПОДов и ПП с одних языков индексирования на другие, автоматического перевода элементов записей документов, включая:

· Базу данных ГРНТИ,

· Базу данных УДК,

· Базу данных ДДК,

· Базу данных ББК,

· Тезаурусную базу данных,

· Базы данных грамматических словарей.

2. Средства ведения словарей:

· Процессор словарно-грамматической фильтрации новых слов в ПОДах.

· Процессор тезаурусной фильтрации новых терминов в ПОДах.

· Процессоры актуализации словарей.

5.3.7. Функции поддержки ЛО в организационно-технологической структуре КСПБМ должна взять на себя небольшая группа специалистов (2-3 чел.) в составе службы администрации сети Базового центра-провайдера совместно с выделенными для этой цели представителями библиотек, представляющих различные узлы КСПБМ.

***

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...