Автоматизация аналитико-синтетической переработки семантической информации
Виды аналитико-синтетической переработки информации, являются областями профессионального библиотечно-библиографического творчества. Именно эти виды АСПИ имеются в виду, когда речь идет об автоматизации семантических, а не статистических или технических операций библиотечного дела. Надо признать, что многолетний опыт показал невозможность или нецелесообразность замены квалифицированных библиотекарей-библиографов высокопроизводительной компьютерной техникой. Практически оправданным оказалось сочетание живого творческого интеллекта и алгоритмических компьютерных технологий, о чем свидетельствует история движения конструктивной мысли в области АСПИ. 1. Начальный этап, 1950-е гг. В этот период появилось первое поколение электронной вычислительной техники, распространилась идея использовать «разумные машины» для автоматизации сложных и трудоемких аналитико-синтетических процессов переработки информации. Наиболее привлекательными и легко реализуемыми казались проект машинного (автоматического) перевода и проект автоматической библиотеки. Опыт воплощения этих проектов в нашей стране и в США оказался весьма поучительным. Работа над проектом электронной информационно-логической машины велась до 1960 г. и была прекращена из-за технической невозможности построить ДЗУ с нужными параметрами. Однако новаторские технические идеи и схемные решения, предложенные в проекте, такие как одноразовый ввод информации при многократном использовании, дистанционная связь с абонентами, автоматическое чтение текста, речевой ввод и вывод информации вошли в состав основных информационных технологий. Логика и лингвистика стали осознаваться как научный фундамент для моделирования «разумными машинами» аналитико-синтетических процессов вроде вывода нового знания, доказательства теорем или чтения рукописного текста. Наряду с машинным переводом и логической переработкой информации в 1950-е гг. проводились эксперименты по автоматизации реферирования научно-технических текстов формально-статистическими методами (Г. П. Лун). Таким образом, были созданы предпосылки для углубленного понимания проблем автоматизации анализа и синтеза семантической информации.
2. Автоматизация информационного поиска изначально рассматривалась как главное средство преодоления кризиса ретроспективного поиска, заключающегося в том, что «мы не знаем, что мы знаем». В структуре информатики, становление которой происходило в 1960-е гг., централы место занимала теория информационно-поисковых систем (теория ИПС) нацеленная прежде всего на использование всевозможных техничен средств от перфокарт ручного обращения до вычислительных машин второго и третьего поколения для повышения оперативности, полноты и точности информационного поиска. Под информационным поиском понимался процесс отыскания в некотором множестве текстов (документов) всех таких, которые были посвящены указанной и запросе теме (предмету) или содержали нужные потребителю факты и сведения Это определение фиксировало существование двух видов информациного поиска: документального — выдача текстов (документов) и фактографического — выдача фактов, сведений. Соответственно, документам ИПС относятся к области документального обслуживания, а фактографические ИПС — к области фактографического обслуживания. Документальный поиск, в свою очередь, подразделяется на поиск первичных документов, например поиск книги в книгохранилище, и но библиографических описаний нужных первоисточников. В первом случае имеет место библиотечный поиск, во втором случае — библиографический поиск. Причем ключевое значение для удовлетворения запроса на семантическую информацию имеет библиографический поиск, который завершается получением описаний, т. е. адресов, позволяющих однозначно идентифицировать (распознать) в документальных потоках и фондах документы, релевантные данному запросу. Эти документы нетрудно извлечь из хранилища посредством адресного библиотечного поиска.
Таким образом, именно библиографический поиск является основной операцией АСПИ в процессе информационного поиска. Уместно подчеркнуть, что все типы библиотечно-библиографических ИПЯ, представленные ранее ориентированы в первую очередь на библиографический, а не библиотечный поиск. Это замечание особенно справедливо для языков координатного индексирования (посткоординируемых языков) типа Д и Е, которые изначально предназначались для автоматизированных ИПС. Разработка теории дескрипторных языков и информационно-поисковых тезаурусов является важнейшим достижением отечественной информатики 1960—1970-х гг. Эта теория указывает пути для повышения качества АСПИ в поисковых машинах Интернета и разрешения в конечном счете кризиса ретроспективного поиска. В 1970-1980-е гг. в нашей стране проводились фундаментальные и прикладные исследования в области автоматизации индексирования и реферирования. Автоматическое индексирование в дескрипторной ИПС «Электротехника» заключалось в распознавании и пословном переводе на дескрипторный язык ключевых слов из текстов рефератов с помощью дескрипторного словаря, хранившегося в памяти системы. В результате получался ПОД в виде перечня дескрипторов. В более совершенных ИПС учитывались синтаксическая структура индексируемого текста и грамматические отношения между дескрипторами. Привлекательность автоматизации заключается в оперативной обработке больших документальных потоков, значительной глубине индексирования и исключении субъективной непоследовательности индексаторов. Некоторые системы автоматического индексирования практиковали автоматическое реферирование (экстрагирование), которое заключалось в отборе тех фраз текста, в которых имеется большое число дескрипторов. При отборе учитывалось также место этих фраз в тексте (предпочтение отдавалось предложениям в начале и конце текста как наиболее значимым), а также учитывались заданные списком слова-маркеры, такие как «задача», «цель», «метод», «результат», «вывод», «итог» и т. п. Вторичный текст, составленный из формально извлеченных из текста предложений, не обладает логической связностью, но дает какое-то представление о содержании первичного документа. Поэтому его называют «квазирефератом».
3. Машиночитаемая каталогизация и оцифровка библиотечных фондов. Автоматизация библиографического поиска, конечно, — важное достижение в библиотечно-информационной деятельности, однако практическая реализация автоматизированных ИПС показала два присущих им «узких места». Во-первых, ввод первичных документов (произведений письменности и печати), во-вторых, доставка найденных документом территориально удаленным потребителям информации. Оба затруднении относятся к проблематике АСПИ и поэтому заслуживают нашего внимания Суть первой проблемы, известной как машиночитаемая каталогизация, заключается в аналитико-синтетической переработке текста человекочитаемого первичного документа в машиночитаемый вторичный документ, служащий объектом автоматизированного библиографического поиска. Технология АСПИ в данном случае сводилась к заполнению каталогизатором формата (рабочего листа), исчерпывающе характеризуют» форму и содержание первичного документа, перенесению данных формата на машиночитаемый носитель и включению машиночитаемого каталожного описания в электронный каталог. Поскольку все перечисленные операции производились вручную, ввод информации в ИПС представлял собой сложный и дорогостоящий технологический процесс. Библиотека Конгресса США, располагающая значительными средствами, решила тем не менее в середине 1960-х гг. начать проект МАРК (МАRС т. е. машиночитаемый каталог). Первоначально имелась в виду локальная задача — автоматизация поиска в каталогах Библиотеки Конгресса с учетом возможностей многоаспектного индексирования, предусмотренного форматом МАРК. Однако вскоре выяснилось, что в машиночитаемых носителях с каталожными описаниями (в качестве таких носителей использовались магнитные ленты) заинтересованы другие библиотеки, создающие электронные каталоги. В конце 1969 г. была организована служба распространения МАРК, которая п. поставлять магнитные ленты на англоязычную литературу в библиотеки США, Канады, Великобритании и других стран. Экономический эффект централизованной подготовки машиночитаемых носителей состоял в том, что пользователи магнитоленточных изданий освобождались от трудоемких и кропотливых операций по обработке первичных документом ввода в свою библиографическую систему.
Преимущество принципа кооперации «однократная обработка - многократное использование» убедительно продемонстрировала система ОСLC основанная в 1967 г. библиотеками колледжей штата Огайо с целью ОБМЕНА библиографическими записями. В настоящее время ОСLC превратилась во всемирный компьютерный библиотечный центр, который послужил образцом для многочисленных национальных и региональных систем корпоративной (точнее было бы сказать «кооперативной») каталогизации. В нашей стране идею межбиблиотечного сотрудничества с 1998 г. воплощает Общероссийская информационно-библиотечная компьютерная сеть ЛИБНЕТ. В настоящее время разработан проект «Основные направления развития Общероссийской информационно-библиотечной компьютерной сети ЛИБНЕТ на 2011-2020 годы». В этом обстоятельном документе сеть ЛИБНЕТ объявляется «единой системой информационно-библиотечного обслуживания России», и предусмотрено достижение в 2015- 2020 гг. впечатляющих целевых показателей, а именно: - объем Сводного каталога библиотек России (СИБР) для свободного поиска ресурсов в библиотеках страны — не менее 10 млн записей в 2015 г. и 15 млн в 2020 г.; - число библиотек-участниц СКБР — не менее 5 тыс. в 2015 г. и 50 тыс. в 2020 г.; - число полнотекстовых документов, представленных в сети ЛИБНЕТ — не менее 2 млн в 2015 г. и 5 млн в 2020 г.; - число зарегистрированных в сети ЛИБНЕТ индивидуальных пользователей в год — не менее 500 тыс. в 2015 г. и 1 млн в 2020 г.; - число поисков в СКБР в год — не менее 10 млн в 2015 г. и 30 млн в 2020 г. Эти показатели выведут ЛИБНЕТ в ряды мощнейших библиотечных компьютерных сетей, а российские библиотеки и граждане России получат в свое распоряжение фантастический библиотечно-информационный сервис. Помимо ЛИБНЕТ, примером успешной реализации библиотечного кооперирования может служить созданная ГПНТБ России Автоматизированная система Российского сводного каталога научно-технической литературы (АС РСвК), которая представляет собой крупнейшую корпоративную автоматизированную систему, объединяющую около 400 научных и научно-технических библиотек.
Машиночитаемая каталогизация неразрывно связана с оцифровкой — преобразованием всех видов человекочитаемой информации (текстовой, аудиовизуальной) в цифровую форму, пригодную для компьютерной обработки. Благодаря оцифровке, стремительно расширяются пределы электронной коммуникации за счет документальных каналов научной периодики, официальной документации и т. д., несмотря на юридические ограничения, связанные с авторским правом. Оцифровка фондов обеспечивает создание электронных библиотек с дистанционным библиографическим поиском и электронной доставкой документов. Оцифровка используется в библиотеках при конверсии (конвертировании) традиции» каталогов из карточной формы в машиночитаемую электронную форму, а также для создания электронных коллекций редких и ценных книг, плакатов, гравюр и т. п. На международной арене компания Google инициировала ряд амбициозных образовательных и книжных проектов, и их числе проект Мировая электронная библиотека, начатый в 2006 г. совместно с Библиотекой Конгресса США и объединяющий сегодня ресурсы многих национальных библиотек мира. Оцифровка культурного наследия страны рассматривается Государственной программой «Информационное общество (2011-2020 годы) принятой Правительством России в октябре 2010 г., в качестве «ключевой задачи». В Программе предусмотрено создание национального библиотечного ресурса с унифицированным каталогом на базе оцифрованных фондов Российской государственной библиотеки, Российской национальной библиотеки, Президентской библиотеки имени Б. Н. Ельцина, библиотек государственных академий наук Российской Федерации, а также государственных и муниципальных публичных библиотек. В качестве контрольных показателей информатизации российских библиотек приняты: доля библиотечных фондов, переведенных в электронную форму, в общем объеме фондов общедоступных библиотек должна составлять 50% к 2015 г., и не менее 75% к 2020 г.; доля библиотечных фондов, внесенных в электтронный каталог, в общем объеме фондов общедоступных библиотек должна составлять 100% к 2015 г. В нашей стране и во всем мире энергично и целенаправленно реализуются программы автоматизации АСПИ, включающие проекты построения электронных библиотек, сводных каталогов, корпоративных библиотечных сетей, служб виртуального библиографического обслуживания и т. п. Машиночитаемая оцифровка библиотек означает, что они изменяют свою коммуникационную сущность: выходят из документальной коммуникации и становятся элементом электронной коммуникации. Значительные капитальные затраты оправдываются обещаниями резко поднять качество библиотечно-информационного обслуживания при сокращении производственных издержек и, самое главное, гарантиями вхождения в информационное общество в качестве полноправного члена. При этом необходимо осознавать, что магистральным путем библиотек в информационное общество является глобальная сеть Интернет. 4. Глобальная сеть Интернет является необходимым условием практической реализации идеи информационного общества. Интернет сущностно необходим гражданам грядущего мира информации для самостоятельной жизнедеятельности. Другими словами, информационное общество — это общество людей, владеющих навыками работы в сети Интернет. Чуждый Интернету человек не может быть полноценным членом информационного общества. Следовательно, расширение круга пользователей Интернета является показателем роста информационного общества в той или иной стране. Согласно официальным данным, содержащимся в отраслевом докладе Федерального агентства по печати и массовым коммуникациями, динамику проникновения Интернета в Россию иллюстрируют цифры: 2005 г. - 19%, 2006 г. - 23%, 2007 г. - 24%, 2008 г. - 30%, 2009 г. - 35%, 2010 г. — 37% взрослого населения России (43,3 млн человек). Россияне составляют примерно 10% всех европейских интернет-пользователей. Благодаря Интернету, традиционные каналы документальной коммуникации были дополнены каналами электронной коммуникации, влияние которых на повседневный образ жизни и мировоззрение россиян достаточно очевидно. Несомненна зависимость будущего библиотечной профессии от развития электронной коммуникации. В компьютерных библиотечных и информационных сетях АСПИ осуществляется не творческим умственным трудом квалифицированных референтов-библиографом, а персональными терминалами и серверными узлами, действующими автотоматически. В августе 2002 г. ИФЛА (Международная федерации библиотечных ассоциаций и учреждений) приняла специальный Манифест об Интернете. Манифест начинается утверждением, что Всемирная сеть Интернет является источником информации для личного совершенствования, образования, культурного развития, экономической деятельности и информированного участия в процессе демократизации. Библиотеки и информационные службы открывают важные пути доступа к Интернету для индивидуальных лиц и сообществ во всем мире, проживающих и так называемых маленьких и удаленных селах и в крупнейших городах. Для одних пользователей они предоставляют условия, руководство и помощь, дли других — являются единственной точкой доступа к информации. Библиотеки и информационные службы ответственны за предоставление и обеспечение общедоступной качественной информации и коммуникации всем членам местного сообщества вне зависимости от их возраста, расы, национальности, религии, культуры, политической принадлежности, физических и других отклонений, пола или каких-либо иных причин. При ним они обязаны уважать права пользователей на невмешательство и частную жизнь и конфиденциальность в отношении используемых ими ресурсом. Подчеркивается, что доступ к Интернету не должен ограничиваться какой-либо формой идеологической, политической, религиозной цензуры или экономическими барьерами. Однако нужно иметь в виду, что в Интернете, наряду с ценными ресурсами, есть и ненадежные, вводящие в заблуждение и даже оскорбительные сообщения. Поэтому библиотекари в процессе информационного обслуживания должны обучать пользователей качественным и эффективным навыкам работы с Интернетом. Им следует активно продвигать и обеспечивать осмысленный доступ к качественой сетевой информации для всех пользователей библиотеки, включая детей и подростков. Как и в случае с другими основными услугами библиотеки, доступ м Интернету должен быть бесплатным.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|