Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Определение количественных и качественных свойств информации

 

В процессе развития статической теории информации была выработана общая формула количества информации, которую можно применять и в непрерывных процессах. Статическая теория изучает информацию на уровне знаков и статистических соотношений между ними, что позволяет говорить о ней, как о синтаксической. Согласно этой теории, алфавит знаков задан, а вероятности соответствуют частотам их проявления и выражаются функциями распределения. Если подобное соотношение не соблюдается, то выразить информацию в двоичной форме и определить ее количество не представляется возможным. Таким образом, главная задача статической теории — обеспечить правильность передачи сигналов, физических носителей информации, которые рассматриваются без учета других важных свойств информации — ее содержания, смысла, ценности и т. д.

Однако в практической деятельности человек часто сталкивается именно с такими свойствами информации, поэтому в рамках математической теории информации стали разрабатываться нестатические подходы к определению количества информации. В настоящее время известен целый ряд так называемых теоретико-множественных подходов: алгоритмический, динамический, комбинаторный, топологический. Наряду с этим в последнее время осуществляются математические исследования возможности измерения не только количественных, но и качественных свойств информации — ее смысла, ценности, полезности. Разрабатываются так называемые семантическая и прагматическая концепции информации.

Несмотря на различие математических теорий информации (синтаксической, семантической, прагматической), в них есть много общего, прежде всего в понимании информации как уменьшенной (снятой) неопределенности, поддающейся количественному измерению. Однако для многих видов социальной информации это означает, что ее содержание, смысл и ценность измеряются в знаках, строках, страницах, хотя хорошо известно, что одна и та же информация имеет для разных людей различные смысл и ценность. Следовательно, существующие математические теории применимы только там, где необходимо и возможно измерить информационную емкость определенных материальных систем, пропускную способность определенных каналов связи, количество передаваемой в сообщениях информации, то есть некоторые количественные характеристики качественных свойств информации. Поэтому наряду с математическими развиваются и другие, нематематические теории (концепции) информации: энергетические, философские, управленческие и экономические.

В энергетических концепциях информация рассматривается как специфическая форма энергетических процессов. Энергетические взаимодействия бывают двух видов: физические и информационные. Информационное взаимодействие осуществляется через энергетические процессы, носителем которых является сигнал, несущий информацию. Это относится и к высшему типу информации — социальной информации. Устная речь, слово реализуются посредством энергии физических колебаний. Таким образом, можно говорить о теснейшей взаимосвязи информационных и физических процессов.

Философские теории информации связывают эти понятия с философскими понятиями «разнообразие» и «отражение». Концепцию разнообразия можно пояснить на следующем простом примере. Нельзя себе представить простейший механизм, все детали которого были бы совершенно одинаковыми. Только потому, что выступы одной детали заполняют пазы другой, а ось третьей входит во втулку четвертой и т. д., возможно функционирование механизма как целостной, упорядоченной структуры. Следовательно, лишь благодаря различию, разнообразию существует конкретная структура системы, утверждается ее упорядоченность, происходит взаимный обмен между компонентами и системы в целом со средой. Именно этот процесс позволяет системе находить вовне то, что ей необходимо для развития. Иными словами, упорядоченность системы в значительной мере определяется информационным разнообразием. Отсюда можно сделать вывод, что информационное разнообразие, информация есть важный фактор организации и самоорганизации, и именно поэтому мы рассматриваем данное понятие как фактор организации информатики.

Концепция отражения утверждает, что информация есть знание, результат отражения, обозначение содержания, полученного из внешнего мира. Однако это не всякое знание, не всякое содержание отражения, а знание, выраженное в сообщении.

Не существует знания вообще. Знание — это локальное понятие, относящееся к конкретному человеку в определенное время. Отчужденное от конкретного носителя, превращенное в особую овеществленную и обобществленную форму, знание трансформируется в более общее понятие (категорию) — информацию. Следовательно, социальная информация — это форма представления знания.

Изобретение письменности открыло перед человечеством возможность осуществления двух противоположно направленных процессов: превращение знания в информацию и получение знания из информации. Книгопечатание, электро-, радио- и телесвязь увеличили эти возможности. Появление ЭВМ, средств передачи данных радикально меняет качественные и количественные характеристики этих процессов.

«Возникают вопросы, — пишет академик В. Г. Афанасьев, — можно ли неиспользуемые данные исключить из понятия «информация», тогда как и они могут храниться и передаваться? Обязательным ли является осмысливание информации, поскольку в ЭВМ информация перерабатывается, но не осмысливается? Для ответа на эти вопросы управленческая концепция информации вводит понятие «данные». Данные — это всякие сведения, сообщения, знания, которые хранятся, передаются, перерабатываются, но характер информации приобретают тогда, когда получают содержание и форму, пригодную для использования человеком». Следовательно, данные — это промежуточная форма представления знаний и информации.

Рассматривая различные трактовки понятия «информация», мы синтезировали новое понятие триады «знания — данные — информация». Совершенно очевидно, что эффективность процессов перехода «знание — данные», «информация — данные» и «знания — информация» зависит от эффективности их организации. Каковы организационные формы этих переходов?

Одной из форм организации данных являются базы данных. Под базой данных в настоящее время понимают организованную специальным образом совокупность данных, отображающую свойства и состояния конкретных объектов (и их отношений), принадлежащих некоторой «предметной области». Предметная область представляет собой часть «информационного пространства», отображающую информационные потребности некоторого ограниченного круга пользователей рассматриваемой базы данных. Под информационным пространством некоторого объекта или их множества понимается совокупность всех информационных компонентов этого объекта (или множества) независимо от способов и средств отображения этих компонентов.

Одна из важнейших характеристик информационного пространства — его структурированность, под которой понимается такое его свойство, при котором все содержание и особенности этого пространства представляются «информационными компонентами» и взаимосвязями между ними, выраженными в понятном виде.

В зависимости от степени структурированности выделяются следующие виды информационного пространства:

— неструктурированные (например, разговорная речь);

— слабо структурированные (например, письменность);

— структурированные (например, информационные системы);

— формализованные (для которых известны не только информационные компоненты и связи между ними, но и алгоритмы получения значений любого компонента, например технико-экономические показатели деятельности объекта);

— машиноструктурированные, для которых известны алгоритмы получения не только информационных компонентов, но и их структурных единиц.

Информационные компоненты объектов могут иметь различную природу — это документация (организационно-распределительная, экономическая, конструкторская и т. п.), отчеты о НИР, информация на машинных носителях, звуковая и видеоинформация, информация от датчиков и т. д.

Соответственно понятиям «информация» и «данные» в теории баз данных рассматриваются два различных аспекта: инфологический и да-талогический.

Инфологический аспект включает вопросы смыслового содержания информации независимо от способов ее представления и организации в памяти информационной системы и характеризует предметную область базы данных, то есть ту часть реального мира, информационные потребности которого реализуются конкретной базой данных.

Даталогический аспект включает вопросы представления и организации данных в памяти информационной системы и характеризует формы и методы представления информации посредством данных, правила смысловой интерпретации и преобразования данных.

При формировании данных в соответствии с целями информационной системы происходит абстрагирование от несущественных деталей описания тех или иных свойств предметной области. Переход от инфологического к даталогическому представлению предметной области (от ее инфологической к даталогической модели) представляет собой сложный процесс проектирования отображения: «описание предметной области» — «описание физического размещения данных в памяти информационной системы». На практике он представляет собой последовательность более простых, как правило, итеративных процессов проектирования менее сложных промежуточных отображений, представляющих собой информационные модели предметной области различного уровня абстрагирования.

Основными уровнями абстрагирования и представления данных в настоящее время принято считать внешний, концептуальный и внутренний. Поэтому при создании баз данных проектируются соответствующие внешние, концептуальные и внутренние модели. На внешнем уровне реализуются модели, ориентированные на отдельных пользователей, на концептуальном — на всех пользователей, на внутреннем — также на всех пользователей, но с учетом требований производительности и экономного использования ресурсов вычислительной среды.

Объектами моделирования в технологии баз данных служат «предметная область», «база данных» и «данные», поэтому в теории и технологии баз данных широко используются термины «модель предметной области», «модель базы данных», «модель данных». Анализ специальной литературы позволяет сделать вывод, что эти термины являются родовыми для группы терминов, обозначающих разновидность моделей соответствующего типа.

С середины 1960-х годов в рамках исследований проблем искусственного интеллекта начало развиваться новое направление, связанное с концепцией информации на основе отражения, которое впоследствии получило название «представление знаний». Интеллект организованных систем зависит от их способностей к обучению, которые заложены в систему. В одном случае эти способности состоят в простом запоминании информации, в другом — в умении приобретать навыки использования этой информации для решения задач, в третьем — формировать новое знание в процессе использования уже имеющегося и т. п. В интересах реализации двух последних видов способностей и развивается новое направление науки и техники — «представление знаний».

Совокупность средств информатики, обеспечивающих поддержку представления знаний, именуется банком знаний. Этот комплекс включает в себя базу знаний, программные и технические средства, обеспечивающие процессы формирования, использования и коррекции базы знаний, а также дедуктивные машины для логических выводов, систем и т. д.

Основными формами материализации, овеществления и обособления знаний, превращения их в информацию, а также обратной трансформации информации в знания являются книги, журналы, материалы конференций, совещаний, симпозиумов, конгрессов и других временных объединений специалистов; репринты и препринты; научно-техническая документация и проекты; кино-, теле- и видеофильмы; фонограммы; научно-технические отчеты и диссертации; патенты и т. д.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...