Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Глава 3. Анализ лингвистических средств библиотек Беларуси




 

Перманентность развития информационно-технологической среды ставит перед библиотеками Беларуси важные и сложные задачи, такие как: формирование распределенных информационных ресурсов, вхождение в единое информационное пространство, выход на новый технологический и качественный уровень процес-сов получения, обработки и распределения создаваемых информационных ресурсов.

Известно, что обеспечение доступа к информационным массивам осуществляется благодаря средствам лингвистического обеспечения (ЛО), от качества которых зависит эффективность поиска, выигрывает имидж конкретной библиотеки. Интеграционные процессы в библиотечной сфере Беларуси находятся на начальном этапе. Делая первые шаги в направлении создания единого информационного пространства, необходимо осознать важность решения проблем соотношения общесистемных и локальных лингвистических средств, а также их совместимости. Тем не менее, в настоящее время в Беларуси нет единого научно-исследовательского, научно-методического центра по разработке и ведению лингвистических средств (ЛС), и как следствие, отсутствуют экспериментальные исследования в сфере лингвистического обеспечения для формирования теоретической базы. Библиотеки на практике сталкиваются с целым рядом проблем: выбора информационно-поисковых языков (ИПЯ), нормализации лексических единиц, необходимой глубины индексирования документов и т.д.

Был проведен анализ лингвистических средств 8 библиотек вузовской сети.

Объектом изучения являлись:

1. Фундаментальная библиотека БГУ (ФББГУ);

2. Библиотека БГЭУ (ББГЭУ);

3. Библиотека БГУИР (БГУИР);

4. Научная библиотека БНТУ (НБ БНТУ);

5. Библиотека Могилевского государственного университета продовольствия (БМГУП);

6. Библиотека Полоцкого государственного университета (БПГУ);

7. Библиотека Гродненского государственного университета имени Янки Купалы;

8. Библиотека Белорусского государственного медицинского университета (БГМУ).

 

 Целями данного анализа являлись:

· выявление состава лингвистических средств;

· подходов к их формированию;

· пределение качества ЛС;

· наличие контроля за ведением ЛС;

· наличие БД авторитетных/нормативных записей.

Я надеюсь, что полученные результаты будут полезны при определении степени возможной совместимости лингвистических средств в интеграционных процессах в Беларуси.

В результате анализа были получены данные, которые можно сгруппировать в несколько блоков:

1) ЛС, используемые для стандартизации при формировании основных полей библиографических записей (БЗ);

2) ЛС, используемые для выражения основного содержания документов и информационных запросов;

3) структура ЛС;

4) степень контроля за ЛС;

5) наличие авторитетного контроля.

 

БЛОК 1. Задача стандартизации при формировании основных полей библиографических записей в АБИС решается путем создания и использования ряда словарей различной структуры. Анализ дал следующие результаты: словари авторов формируются во всех представленных организациях. В 4 – ведутся словари коллективов. Из 8 представленных организаций в 2 (ФББГУ, БМГУП) к вышеперечисленным добавляются словари языков, регионов, серий. Это не означает, что АБИС в исследуемых библиотеках не позволяют формировать большее количество словарей. Опыт показывает, в некоторых библиотеках максимально возможности АБИС не используют. При этом не стоит забывать, что важнейшим показателем качества массивов библиографической информации с использованием АИБС является именно степень стандартизации при формировании основных полей БЗ, в том числе и поисковых полей.

 

БЛОК 2. Для выражения основного содержания документа и информационных запросов используются различные системы классификаций и вербальные ИПЯ.

В исследуемых библиотеках используются следующие классификационные ИПЯ:

УДК – в 8 библиотеках,

ББК – в 5,

Государственный Рубрикатор научно-технической информации – в 5,

локальные рубрикаторы собственной генерации – в 3,

 Т.о., ассортимент классификационных ИПЯ по всем библиотекам составляет 4 наименования.

В результате анализа выяснилось, из вербальных ИПЯ, используемых в исследуемых библиотеках, наибольшей популярностью пользуются языки ключевых слов, их используют 5 библиотек. В 3 организациях применяется язык предметных рубрик.

Вероятно, что причина популярности языка ключевых слов связана с тем, что формирование языка ключевых слов осуществляется путем свободно выбираемых из лексикона специалистов-пользователей слов и ввода их в базы данных в нормализованной лексикографической форме. Однако необходимо учитывать, что неконтролируемое и неуправляемое применение ключевых слов приводит к значительным потерям в характеристиках полноты и точности поиска. Поэтому специалисты все больше говорят сегодня об использовании информационно-поисковых тезаурусов, в которых лексические единицы характеризуются смысловыми связями друг с другом, а это, в свою очередь, позволяет проводить содержательный поиск информации, не ограничиваясь выдачей материалов по формальному совпадению слов запроса и документа.

Необходимо отметить, что ни в одном из исследуемых учреждений в перечне ЛС не встречается объектно-признаковый язык, ориентированный на решение задач фактографического поиска. Тем не менее, теория ЛО утверждает существование жесткой зависимости между ЛС с одной стороны и набором и качеством информационных продуктов и услуг с другой стороны. Если мы говорим о создании корпоративных систем, то необходимо изначально закладывать разнообразные возможности набора создаваемых продуктов и услуг актуальных сегодня. [5, с.30]

Результаты анализа показывают, что в наших библиотеках используются различные таблицы классификации и различные словари терминов. Связано это с тем, что процесс смысловой содержательной обработки документов – это интеллектуальная деятельность, которую стандартизировать практически невозможно. [6, С. 19]

 Белорусскими библиотеками накоплен достаточный опыт в области создания собственных лингвистических средств, от которого сложно отказаться, поэтому построение единого информационного пространства должно основываться на уважении правил и традиций друг друга. При этом, необходимо понимать, что состав ЛО корпоративной сети должен быть шире, чем состав ЛО АИБС отдельной библиотеки. На пути к интеграции необходимо осознать важность использования всеми будущими участниками сетевого взаимодействия одних и тех же средств и инструментов. Конечно, оптимальным было бы наличие единого контролируемого словаря терминов. Гипотетически, выходом может стать создание национального тезауруса, для которого необходима серия отраслевых тезаурусов. Многие посчитают это утопией, ведь создание тезауруса – процесс трудоемкий и затратный, но, как заявляют ведущие российские специалисты в области ЛО, «предпочтительно иметь тезаурус и использовать его для обогащения поисковых предписаний» [4, с.7]. Так или иначе, на сегодняшнем этапе нам необходима общая договоренность по системе ЛО.

 

БЛОК 3. Набор используемых лингвистических средств в наших библиотеках определяется их функциональным назначением, типо-видовой и отраслевой структурой документально-информационного потока, информационных запросов обрабатываемого системой и т.д.

Большинство формируемых ЛС (в 5 библиотеках) имеют иерархическую структуру, обеспечивающую наличие смысловых связей между лексическими единицами.

 

БЛОК 4. В связи с тем, что проблемы комплексного управления качеством являются в настоящее время важнейшими в экономике любого государства, хотелось бы остановиться на проблеме качества ЛС, т.к. от этого зависит качество библиотечных продуктов и услуг. В 4 организациях – ФБ БГУ, ББГУИР, НББНТУ, БМГУП существуют организационные структуры, ответственные за ведение и поддержку ЛС в рабочем состоянии. На вопрос: «Осуществляется ли контроль (лексикографический и терминологический) за ведением ЛС?» положительно ответили 3 из 4 библиотек. При этом статистический учет лексических единиц осуществляется лишь в 2 библиотеках –ФБ БГУ, БМГУП. Непонятно, как в остальных библиотеках решается вопрос об актуализации словарных баз данных. Ведь именно на основе анализа статистики употребления словарных единиц в поисковых образах документов идет исключение устаревших словарных статей из баз данных тезаурусов и грамматических словарей. На

наличие справочного аппарата в ЛС, обеспечивающего раскрытие смысла понятия и /или уточнение сведений о нем, указали только 5 библиотек.

В процессе анализа не была изучена нормативно-справочная база ЛО АИБС библиотек, в частности нормативные документы, устанавливающие правила ведения, поддержки и актуализации ИПЯ, словарей и правила индексирования. Практика показывает, что в различных библиотеках применяется разный набор аспектов при индексировании. В состав ЛО сегодня необходимо включать методики индексирования документов и запросов, правила, методики и алгоритмы создания и ведения ЛС, это та часть ЛО, которая полностью зависит от нас, нашей компетентности и профессионализма. У многих из них уже немалые базы данных электронных каталогов, вопрос их качества является наиважнейшим в преддверии объединения. Необходимо этому уделять большое внимание именно сейчас, ведь чем больше проходит времени, тем масштабнее предстоит редактирование, поэтому проведение исследований качества электронных каталогов и поиска в них сегодня просто необходимы. [7, С. 19-21]

 

БЛОК 5. Очевидно, что на современном этапе библиографические записи в больших информационных массивах не могут эффективно использоваться без поддержки авторитетных файлов. В настоящее время система создания и ведения национальных баз данных авторитетных/нормативных записей в Беларуси находится в стадии проектной разработки, передача в промышленную эксплуатацию опытного образца коммунальной базы данных авторитетных записей еще планируется. Базовым библиографирующим центром, осуществляющим начальные этапы работ по формированию национальных баз данных, является Национальная библиотека Беларуси (НББ), соисполнители разработок – Национальная книжная палата Беларуси. Анализ показал, что во многих белорусских библиографических центрах существуют заделы для формирования авторитетных записей: картотеки, фактографические базы данных, машиночитаемые словари, которые могут послужить источниками для национальных баз данных авторитетных/нормативных файлов, некоторые библиотеки ведут свои прототипы авторитетных файлов. Так, в репертуаре нормативных записей библиотек представлены: наименования коллективов – в 3 библиотеках; имена лиц – в 2; географические наименования – в 4; предметные рубрики – в 1; унифицированные заглавия – в 1; заглавия серий – в 1; индексы ББК – в 2; индексы УДК – в 2.

Опыт и данные, накопленные некоторыми библиотеками в процессе создания БД авторитетных/нормативных записей, имеют большую ценность, и работу по ведению авторитетного контроля им следует продолжать.

Например, Президентская библиотека РБ осуществляет автоматизированный авторитетный/нормативный контроль с 2001 года. Для решения задач, касающихся технологии и организации ведения баз данных авторитетных/нормативных записей, проблем информационной и лингвистической совместимости баз данных электронных каталогов белорусских библиотек в Президентской библиотеке РБ проводятся открытые заседания редакционно-лингвистической группы с участием ведущих специалистов республики. В ходе этих мероприятий с одной стороны, обсуждаются спорные вопросы, ищутся пути их решения, с другой стороны, для Президентской библиотеки РБ это прекрасная возможность поделиться собственным опытом в области организации ЛО. Высшей оценкой работы в области создания средств лингвистического обеспечения, ведения авторитетного контроля в Президентской библиотеке РБ было предложение НББ в 2004 году участвовать в проекте «Создание и ведение национальных баз данных авторитетных/нормативных записей», задание № 84 Государственной программы «Электронная Беларусь», в части создания национального авторитетного файла для географических названий.

Опыт показывает, что информационно-библиотечные специалисты Беларуси осознают потребность в создании и использовании единых методик выделения ключевых слов и формирования машиночитаемых баз нормативной лексики. Проблемы, связанные с обеспечением единообразия в этих вопросах, необходимо решать как можно быстрее. Нормативно-справочную базу ЛО в условиях сетевого режима работы необходимо создавать на государственном уровне, а для этого нам необходим специализированный орган, который бы организовал и в дальнейшем координировал работу, оказывал методическую и консультативную помощь по вопросам лингвистического обеспечения.

Постепенно библиотеки приходят к пониманию, что силами одной информационной системы невозможно удовлетворить все многообразие возникающих информационных потребностей пользователей, тем более, что каждая из этих систем располагает собственными лингвистическими средствами, освоение которых доставляет пользователям немало трудностей. [7]

Сегодня все совместные усилия должны быть направлены на пользователя, именно это обстоятельство является той движущей силой, которая определяет настоятельную потребность в объединении информационных библиотечных систем, в связи с чем, проблема совместимости различных лингвистических средств становится наиважнейшей.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...