Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Виды информации в Интернете и профессиональных базах




Информация о предметной области, т. е. об объектах и их свя­зях, может быть представлена в двух видах: формализованном и в виде текста на естественном языке.

Формализованное описание конкретного объекта включает имя, свойства (характеристики) и значение этого свойства для данного объекта. Имя свойства отражает грамматическую роль значения этого свойства по отношению к данному классу объек­тов. Значение свойства (характеристики) может задаваться нор­мированным словарем или произвольно. Например, значение свойства "организационно-правовая форма фирмы, организа­ции" должно выбираться из нормированного словаря, а значение свойства "название организации" является произвольным. Фор­мализованное описание объекта во многом схоже с анкетной формой описания объекта. Некоторые авторы называют форма­лизованное описание информации числовым. Это не совсем точ­ное определение, так как фамилия лица или название организа­ции задается не числовым значением, но может быть представле­но в формализованном виде.

Названия классов объектов, свойств и областей возможных значений этих свойств (характеристик), т. е. язык формализован­ного описания для каждой предметной области, разрабатывают квалифицированные специалисты. С помощью отдельных свойств устанавливаются связи между объектами. Например, ес­ли описаны два объекта: фирма и товар, то между ними устанав­ливается связь—отношение, указывающее, что эта фирма выпус­кает этот товар. Описание такого формализованного языка после согласования с источниками и потребителями информации в данной предметной области издается в виде нормативного доку­мента, и на основе его создаются базы данных формализованной информации. Описание информации в таких базах в максималь­ной степени приближено к представлению специалиста о пред­метной области, в которой он работает. Формализованный язык описания предметной области выполняет следующие основные функции:

• позволяет источнику отбирать лишь ту информацию и опи­сывать ее так, как это необходимо потребителю;

• позволяет в базах данных отражать информацию в том же виде, в каком она отражена в сознании специалиста данной пред­метной области;

• позволяет в информационных системах по указанию потре­бителя проводить автоматическую обработку формализованной информации;

• существенно облегчает поиск нужной информации в базах данных.

 

Другим видом информации о предметной области является информация, представленная в виде текста на естественном языке.

Для того чтобы понять, в какой степени информация на есте­ственном языке, накапливаемая в информационных системах, подходит для удовлетворения информационных потребностей пользователя, рассмотрим в общих чертах природу восприятия че­ловеком реальной действительности и отображение этой действи­тельности на естественном языке. Индивидуальное знание пред­метной области источником и потребителем информации склады­вается из совокупности представлений и понятий [52]. Представления — это чувственно-наглядные образы объектов ре­ального мира. Источником формирования представлений являют­ся психологические процессы ощущения и восприятия, а также информация, получаемая от других членов общества в процессе

Общения; В результате создаются представления об объектах ре­ли ы юго мира. Представления носят субъективный характер, кото­рый определяется внутренним психологическим миром данного человека. Хотя у разных людей создаются разные представления о реальном мире, в них присутствует элемент общности, который позволяет использовать представления в процессе общения.

Понятия образуются в результате логического осмысления представлений об объектах реального мира и являются формой абстрактного мышления, отражающей и фиксирующей сущест­венные признаки данных объектов. Понятия более объективны и в большей степени отражают коллективный опыт. Понятия и представления тесно взаимосвязаны и являются формой отраже­ния реальной действительности в мышлении.

Язык — это средство, с помощью которого люди передают друг другу информацию о реальном мире. Словарные выражения являются материальной формой понятий и представлений. Естест­венный язык является результатом длительного развития обще­ства. Поскольку для различных слоев общества характерна раз­ная степень общности представлений, возникла многозначность слов естественного языка: одно и то же слово приобретало мно­жество различных значений и для одного и того же слова исполь­зовалось несколько словесных выражений. Таким образом, об­щим недостатком естественного языка с позиций оценки эффек­тивности поиска является избыточность и недостаточность.

Избыточность проявляется в следующем:

1) для передачи содержания текста активную роль играют только некоторые слова или словосочетания, так называемые ключевые слова. Другие можно отбросить практически без ущер­ба для понимания смысла;

2) в естественном языке употребляются синонимы, т. е. слова, различающиеся по звучанию и написанию, но тождественные или близкие по смыслу;

3) неоднозначность выражения, т. е. возможность выразить одну и ту же мысль словами, не являющимися синонимами (уменьшение сопротивления — увеличение проводимости).

Недостаточность проявляется в следующем:

1) многозначность слов — омонимия — совпадение по звуча­нию и написанию разных по значению слов: ключ (для двери), ключ (источник);

2) эллипсность — пропуск в тексте подразумеваемых слов.

Если рассматривать процесс отражения объектов реального мира текстом на естественном языке, то можно выделить план содержания—смысл сообщения, т. е. результат процесса мышле­ния, и план выражения — произвольный текст на естественном языке. Таким образом, тексты на естественном языке, хранящие­ся в информационных системах, находятся на уровне плана вы­ражения и характеризуются всеми недостатками естественного языка, отмеченными выше. Следует иметь в виду, что выявлен­ные недостатки следует рассматривать лишь с позиций эффек­тивного поиска сообщений в информационных системах. При­чина неоднозначности выражений при рассмотрении под другим углом будет отнесена к достоинствам естественного языка, на­пример эллипсность.

Отметим, что потребитель информации — пользователь нуж­дается в получении информации о предметной области в соответ­ствии со своими представлениями об объектах, свойствах и отно­шениях в этой области. Свой запрос он также формулирует на уровне плана выражения.

Таким образом, в самой информационной системе, содержа­щей тексты на естественном языке, мы имеем массив планов вы­ражения источников на естественном языке, а на входе информа­ционной системы — множество запросов в виде планов выраже­ния, сформулированных потребителями информации.

Для того чтобы решить задачу поиска требуемой потребителю информации, необходимо смоделировать, представить, о каком фрагменте предметной области потребитель хочет получить ин­формацию. Затем нужно просмотреть хранящиеся документы — планы выражения, составленные источниками, представить и смоделировать, что хотел сказать источник о предметной области и на основе научно обоснованной методики отобрать те из них, ко­торые отвечают на поставленный вопрос полностью или частично.

Работы в областях теории построения документальных ин­формационных систем и машинного перевода, проводимые по­следние 50 лет в нашей стране и за рубежом, показали, что про­цесс выявления смысла из произвольного текста на естественном языке не может быть реализован автоматически, а лишь с участи­ем человека, обладающего глубокими знаниями в данной пред­метной области. Однако общество нуждалось в построении документальных информационных систем в первую очередь в области научно-технической информации. Для того чтобы облегчить поиск в боль­ших массивах текстовой информации, стали строить информа­ционно-поисковые системы, в которых документы описывались с помощью специальных поисковых языков. С помощью элемен­тов этого же языка описывались и запросы. Для отбора докумен­тов в ответ на запрос осуществлялось сравнение поисковых обра­зов запросов и поисковых образов документов, которое проводи­лось на одном и том же искусственном языке.

Такой подход является вынужденным. Из-за недостатков ес­тественного языка, отмеченных выше, документальные инфор­мационные системы не дают ответа на вопрос потребителя, а вы­дают ему документы, в которых может содержаться ответ на его запрос, предоставляя потребителю самостоятельно выявить смысловое содержание этих документов. Вопросы оценки эф­фективности поиска информации в документальных информа­ционных системах будут рассмотрены ниже.

Выводы

1. Мировой рынок деловой информации представлен более чем 8 тыс. крупных информационных агентств, в полном объеме обес­печивающих потребности в деловой информации различных видов бизнеса. Эти агентства предоставляют услуги доступа к 19,4 тыс. информационных баз, содержащих биржевую и финансовую ин­формацию, сведения о фирмах, товарах, услугах, рынках сбыта, статистическую, научно-техническую, правовую информацию и деловые новости. К большинству баз имеется режим непосредст­венного доступа из любой точки мира.

2. Наряду с собранной из различных источников информаци­ей ряд информационных агентств предоставляют информацию с собственной оценкой финансового состояния этой фирмы, что крайне важно при установлении партнерских отношений или рассмотрении вопроса о выдаче кредита.

3. Основная информация из профессиональных баз (свыше 85% общего объема) предоставляется на коммерческой основе. Несмотря на относительно высокие цены, спрос на деловую ин­формацию постоянно растет. За 5 лет (с 1992 по 1997 г.) доходы от продаж информации через Интернет возросли в 28 раз и, по мнению экспертов, в ближайшее время должны составить 20 млрд долл.

4. Информационные ресурсы стали одними из важнейших ресурсов государств. США — лидер мировой экономики форми­рует более 70% мировых ресурсов деловой информации.

5. Бизнесмены в развитых странах стараются предоставить информацию о своей фирме в максимально возможном объеме. Отсутствие или недостаток информации о фирме будет, как правило, преградой на пути делового сотрудничества с такой фирмой.

Вопросы для самопроверки

1. Какие изменения произошли в информационном обеспече­нии российских предприятий в условиях перехода к рыночной эко­номике, где информация стала товаром?

2. Какие основные тенденции в развитии мирового рынка ин­формации могут быть отмечены?

3. В какой степени мировой информационный рынок соответст­вует требованиям государственных и коммерческих структур?

4. Сравните содержание информационных ресурсов профессио­нальных баз и деловых ресурсов Интернета.

5. Как влияет рост объема текстовой информации в общем объе­ме мировых информационных ресурсов на автоматизированную об­работку информации?


Глава 3

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...