Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Автоматизация аналитико-синтетической переработки семантической информации

Виды аналитико-синтетической переработки информации, являются областями профессионального библиотечно-библиографического творчества. Именно эти виды АСПИ имеются в виду, когда речь идет об автоматизации семантических, а не статистических или технических операций библиотечного дела. Надо признать, что многолетний опыт показал невозможность или нецелесо­образность замены квалифицированных библиотекарей-библиографов высокопроизводительной компьютерной техникой. Практически оправ­данным оказалось сочетание живого творческого интеллекта и алгорит­мических компьютерных технологий, о чем свидетельствует история движения конструктивной мысли в области АСПИ.

1. Начальный этап, 1950-е гг. В этот период появилось первое по­коление электронной вычислительной техники, распространилась идея использовать «разумные машины» для автоматизации сложных и тру­доемких аналитико-синтетических процессов переработки информации. Наиболее привлекательными и легко реализуемыми казались проект ма­шинного (автоматического) перевода и проект автоматической библио­теки. Опыт воплощения этих проектов в нашей стране и в США оказался весьма поучительным.

Работа над проектом электронной информационно-логической маши­ны велась до 1960 г. и была прекращена из-за технической невозможности построить ДЗУ с нужными параметрами. Однако новаторские технические идеи и схемные решения, предложенные в проекте, такие как одноразо­вый ввод информации при многократном использовании, дистанционная связь с абонентами, автоматическое чтение текста, речевой ввод и вывод информации вошли в состав основных информационных технологий. Логика и лингвистика стали осознаваться как научный фундамент для моделирования «разумными машинами» аналитико-синтетических процессов вроде вывода нового знания, доказательства теорем или чтения рукописного текста. Наряду с машинным переводом и логической переработкой информации в 1950-е гг. проводились эксперименты по автоматизации реферирования научно-технических текстов формально-статистическими методами (Г. П. Лун). Таким образом, были созданы предпосылки для углубленного понимания проблем автоматизации анализа и синтеза семантической информации.

2. Автоматизация информационного поиска изначально рассматривалась как главное средство преодоления кризиса ретроспективного поиска, заключающегося в том, что «мы не знаем, что мы знаем». В структуре информатики, становление которой происходило в 1960-е гг., централы место занимала теория информационно-поисковых систем (теория ИПС) нацеленная прежде всего на использование всевозможных техничен средств от перфокарт ручного обращения до вычислительных машин второго и третьего поколения для повышения оперативности, полноты и точности информационного поиска. Под информационным поиском понимался процесс отыскания в некотором множестве текстов (документов) всех таких, которые были посвящены указанной и запросе теме (предмету) или содержали нужные потребителю факты и сведения Это определение фиксировало существование двух видов информациного поиска: документального — выдача текстов (документов) и фактографического — выдача фактов, сведений. Соответственно, документам ИПС относятся к области документального обслуживания, а фактографические ИПС — к области фактографического обслуживания.

Документальный поиск, в свою очередь, подразделяется на поиск первичных документов, например поиск книги в книгохранилище, и но библиографических описаний нужных первоисточников. В первом случае имеет место библиотечный поиск, во втором случае — библиографический поиск. Причем ключевое значение для удовлетворения запроса на семантическую информацию имеет библиографический поиск, который завершается получением описаний, т. е. адресов, позволяющих однозначно идентифицировать (распознать) в документальных потоках и фондах документы, релевантные данному запросу. Эти документы нетрудно извлечь из хранилища посредством адресного библиотечного поиска.

Таким образом, именно библиографический поиск является основной операцией АСПИ в процессе информационного поиска. Уместно подчеркнуть, что все типы библиотечно-библиографических ИПЯ, представлен­ные ранее ориентированы в первую очередь на библиографический, а не библиотечный поиск. Это замечание особенно справедливо для языков координатного индексирования (посткоординируемых языков) типа Д и Е, которые изначально предназначались для автоматизированных ИПС. Раз­работка теории дескрипторных языков и информационно-поисковых те­заурусов является важнейшим достижением отечественной информатики 1960—1970-х гг. Эта теория указывает пути для повышения качества АСПИ в поисковых машинах Интернета и разрешения в конечном счете кризиса ретроспективного поиска.

В 1970-1980-е гг. в нашей стране проводились фундаментальные и при­кладные исследования в области автоматизации индексирования и ре­ферирования. Автоматическое индексирование в дескрипторной ИПС «Электротехника» заключалось в распознавании и пословном переводе на дескрипторный язык ключевых слов из текстов рефератов с помо­щью дескрипторного словаря, хранившегося в памяти системы. В ре­зультате получался ПОД в виде перечня дескрипторов. В более совер­шенных ИПС учитывались синтаксическая структура индексируемого текста и грамматические отношения между дескрипторами. Привле­кательность автоматизации заключается в оперативной обработке больших документальных потоков, значительной глубине индексирова­ния и исключении субъективной непоследовательности индексаторов.

Некоторые системы автоматического индексирования практиковали автоматическое реферирование (экстрагирование), которое заключа­лось в отборе тех фраз текста, в которых имеется большое число дескрип­торов. При отборе учитывалось также место этих фраз в тексте (предпо­чтение отдавалось предложениям в начале и конце текста как наиболее значимым), а также учитывались заданные списком слова-маркеры, такие как «задача», «цель», «метод», «результат», «вывод», «итог» и т. п. Вторич­ный текст, составленный из формально извлеченных из текста предложе­ний, не обладает логической связностью, но дает какое-то представление о содержании первичного документа. Поэтому его называют «квазирефе­ратом».

3. Машиночитаемая каталогизация и оцифровка библиотечных фондов. Автоматизация библиографического поиска, конечно, — важное достижение в библиотечно-информационной деятельности, однако прак­тическая реализация автоматизированных ИПС показала два присущих им «узких места». Во-первых, ввод первичных документов (произведений письменности и печати), во-вторых, доставка найденных документом территориально удаленным потребителям информации. Оба затруднении относятся к проблематике АСПИ и поэтому заслуживают нашего внимания Суть первой проблемы, известной как машиночитаемая каталогизация, заключается в аналитико-синтетической переработке текста человекочитаемого первичного документа в машиночитаемый вторичный документ, служащий объектом автоматизированного библиографического поиска. Технология АСПИ в данном случае сводилась к заполнению каталогизатором формата (рабочего листа), исчерпывающе характеризуют» форму и содержание первичного документа, перенесению данных формата на машиночитаемый носитель и включению машиночитаемого каталожного описания в электронный каталог. Поскольку все перечисленные операции производились вручную, ввод информации в ИПС представлял собой сложный и дорогостоящий технологический процесс. Библиотека Конгресса США, располагающая значительными средствами, решила тем не менее в середине 1960-х гг. начать проект МАРК (МАRС т. е. машиночитаемый каталог).

Первоначально имелась в виду локальная задача — автоматизация поиска в каталогах Библиотеки Конгресса с учетом возможностей многоаспектного индексирования, предусмотренного форматом МАРК. Однако вскоре выяснилось, что в машиночитаемых носителях с каталожными описаниями (в качестве таких носителей использовались магнитные ленты) заинтересованы другие библиотеки, создающие электронные каталоги. В конце 1969 г. была организована служба распространения МАРК, которая п. поставлять магнитные ленты на англоязычную литературу в библиотеки США, Канады, Великобритании и других стран. Экономический эффект централизованной подготовки машиночитаемых носителей состоял в том, что пользователи магнитоленточных изданий освобождались от трудоемких и кропотливых операций по обработке первичных документом ввода в свою библиографическую систему.

Преимущество принципа кооперации «однократная обработка - многократное использование» убедительно продемонстрировала система ОСLC основанная в 1967 г. библиотеками колледжей штата Огайо с целью ОБМЕНА библиографическими записями. В настоящее время ОСLC превратилась во всемирный компьютерный библиотечный центр, который послужил образцом для многочисленных национальных и региональных систем корпоративной (точнее было бы сказать «коопера­тивной») каталогизации. В нашей стране идею межбиблиотечного сотруд­ничества с 1998 г. воплощает Общероссийская информационно-библиотечная компьютерная сеть ЛИБНЕТ.

В настоящее время разработан проект «Основные направления раз­вития Общероссийской информационно-библиотечной компьютерной сети ЛИБНЕТ на 2011-2020 годы». В этом обстоятельном документе сеть ЛИБНЕТ объявляется «единой системой информационно-библиотечного обслуживания России», и предусмотрено достижение в 2015- 2020 гг. впечатляющих целевых показателей, а именно:

- объем Сводного каталога библиотек России (СИБР) для свободного поиска ресурсов в библиотеках страны — не менее 10 млн записей в 2015 г. и 15 млн в 2020 г.;

- число библиотек-участниц СКБР — не менее 5 тыс. в 2015 г. и 50 тыс. в 2020 г.;

- число полнотекстовых документов, представленных в сети ЛИБ­НЕТ — не менее 2 млн в 2015 г. и 5 млн в 2020 г.;

- число зарегистрированных в сети ЛИБНЕТ индивидуальных пользова­телей в год — не менее 500 тыс. в 2015 г. и 1 млн в 2020 г.;

- число поисков в СКБР в год — не менее 10 млн в 2015 г. и 30 млн в 2020 г.

Эти показатели выведут ЛИБНЕТ в ряды мощнейших библиотечных компьютерных сетей, а российские библиотеки и граждане России по­лучат в свое распоряжение фантастический библиотечно-информаци­онный сервис.

Помимо ЛИБНЕТ, примером успешной реализации библиотечного кооперирования может служить созданная ГПНТБ России Автоматизирован­ная система Российского сводного каталога научно-технической литера­туры (АС РСвК), которая представляет собой крупнейшую корпоративную автоматизированную систему, объединяющую около 400 научных и науч­но-технических библиотек.

Машиночитаемая каталогизация неразрывно связана с оцифровкой — преобразованием всех видов человекочитаемой информации (текстовой, аудиовизуальной) в цифровую форму, пригодную для компьютерной об­работки. Благодаря оцифровке, стремительно расширяются пределы электронной коммуникации за счет документальных каналов научной периодики, официальной документации и т. д., несмотря на юридические ограничения, связанные с авторским правом. Оцифровка фондов обеспе­чивает создание электронных библиотек с дистанционным библиографическим поиском и электронной доставкой документов. Оцифровка используется в библиотеках при конверсии (конвертировании) традиции» каталогов из карточной формы в машиночитаемую электронную форму, а также для создания электронных коллекций редких и ценных книг, плакатов, гравюр и т. п. На международной арене компания Google инициировала ряд амбициозных образовательных и книжных проектов, и их числе проект Мировая электронная библиотека, начатый в 2006 г. совместно с Библиотекой Конгресса США и объединяющий сегодня ресурсы многих национальных библиотек мира.

Оцифровка культурного наследия страны рассматривается Государственной программой «Информационное общество (2011-2020 годы) принятой Правительством России в октябре 2010 г., в качестве «ключевой задачи». В Программе предусмотрено создание национального библиотечного ресурса с унифицированным каталогом на базе оцифрованных фондов Российской государственной библиотеки, Российской национальной библиотеки, Президентской библиотеки имени Б. Н. Ельцина, библиотек государственных академий наук Российской Федерации, а также государственных и муниципальных публичных библиотек. В качестве контрольных показателей информатизации российских библиотек приняты: доля библиотечных фондов, переведенных в электронную форму, в общем объеме фондов общедоступных библиотек должна составлять 50% к 2015 г., и не менее 75% к 2020 г.; доля библиотечных фондов, внесенных в электтронный каталог, в общем объеме фондов общедоступных библиотек должна составлять 100% к 2015 г.

В нашей стране и во всем мире энергично и целенаправленно реализу­ются программы автоматизации АСПИ, включающие проекты построения электронных библиотек, сводных каталогов, корпоративных библиотеч­ных сетей, служб виртуального библиографического обслуживания и т. п. Машиночитаемая оцифровка библиотек означает, что они изменяют свою коммуникационную сущность: выходят из документальной коммуника­ции и становятся элементом электронной коммуникации. Значительные капитальные затраты оправдываются обещаниями резко поднять ка­чество библиотечно-информационного обслуживания при сокращении производственных издержек и, самое главное, гарантиями вхождения в информационное общество в качестве полноправного члена. При этом необходимо осознавать, что магистральным путем библиотек в информа­ционное общество является глобальная сеть Интернет.

4. Глобальная сеть Интернет является необходимым условием практи­ческой реализации идеи информационного общества. Интернет сущностно необходим гражданам грядущего мира информации для самостоятельной жизнедеятельности. Другими словами, информационное общество — это общество людей, владеющих навыками работы в сети Интернет. Чуждый Интернету человек не может быть полноценным членом информационного общества. Следовательно, расширение круга пользователей Интернета явля­ется показателем роста информационного общества в той или иной стране.

Согласно официальным данным, содержащимся в отраслевом докла­де Федерального агентства по печати и массовым коммуникациями, динамику проникновения Интернета в Россию иллюстрируют цифры:

2005 г. - 19%, 2006 г. - 23%, 2007 г. - 24%, 2008 г. - 30%, 2009 г. - 35%,

2010 г. — 37% взрослого населения России (43,3 млн человек). Россияне составляют примерно 10% всех европейских интернет-пользователей.

Благодаря Интернету, традиционные каналы документальной коммуникации были дополнены каналами электронной коммуникации, влияние которых на повседневный образ жизни и мировоззрение россиян достаточно очевидно. Несомненна зависимость будущего библиотечной профессии от развития электронной коммуникации. В компьютерных библиотечных и информационных сетях АСПИ осуществляется не творческим умственным трудом квалифицированных референтов-библиографом, а персональными терминалами и серверными узлами, действующими автотоматически. В августе 2002 г. ИФЛА (Международная федерации библиотечных ассоциаций и учреждений) приняла специальный Манифест об Интернете.

Манифест начинается утверждением, что Всемирная сеть Интернет является источником информации для личного совершенствования, образования, культурного развития, экономической деятельности и информированного участия в процессе демократизации. Библиотеки и информационные службы открывают важные пути доступа к Интернету для индивидуальных лиц и сообществ во всем мире, проживающих и так называемых маленьких и удаленных селах и в крупнейших городах. Для одних пользователей они предоставляют условия, руководство и помощь, дли других — являются единственной точкой доступа к информации. Библиотеки и информационные службы ответственны за предоставление и обеспечение общедоступной качественной информации и коммуникации всем членам местного сообщества вне зависимости от их возраста, расы, национальности, религии, культуры, политической принадлежности, физических и других отклонений, пола или каких-либо иных причин. При ним они обязаны уважать права пользователей на невмешательство и частную жизнь и конфиденциальность в отношении используемых ими ресурсом.

Подчеркивается, что доступ к Интернету не должен ограничиваться какой-либо формой идеологической, политической, религиозной цензуры или экономическими барьерами. Однако нужно иметь в виду, что в Интернете, наряду с ценными ресурсами, есть и ненадежные, вводящие в заблуждение и даже оскорбительные сообщения. Поэтому библиотекари в процессе информационного обслуживания должны обучать пользователей качественным и эффективным навыкам работы с Интернетом. Им следует активно продвигать и обеспечивать осмысленный доступ к качественой сетевой информации для всех пользователей библиотеки, включая детей и подростков. Как и в случае с другими основными услугами библиотеки, доступ м Интернету должен быть бесплатным.


 

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...