Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Различные подходы к измерению информации

Свойства информации

Как и всякий объект, информация обладает свойствами (объекты различимы по своим свойствам). Характерной особенностью информации, отличающей её от других объектов природы и общества, является отмеченный выше дуализм: на свойства информации влияют как свойства данных, составляющих её содержательную часть, так и свойства методов, взаимодействующих с данными в ходе информационного процесса.
1. Адекватность

Степень соответствия информации, полученной потребителем, тому, что автор вложил в её содержание (то есть в данные).
Адекватность информации иногда ошибочно путают с её достоверностью. Это совершенно разные свойства. Можно привести пример адекватной, но недостоверной информации. Так, например, если 1 апреля в газете появится заведомо ложное сообщение, то его можно считать адекватным. Адекватно толковать его не как информационное, а как развлекательное. То же сообщение, опубликованное 2 апреля, будет и недостоверным, и неадекватным.
2. Актуальность

Степень соответствия информации текущему моменту времени [3].
3. Воспроизводимость и передаваемость

Воспроизводимость информации тесно связана с её передаваемостью и не является её независимым базовым свойством. Если передаваемость означает, что не следует считать существенными пространственные отношения между частями системы, между которыми передаётся информация, то воспроизводимость характеризует неиссякаемость и неистощимость информации, т. е. что при копировании информация остаётся тождественной самой себе [2].
4. Дискретность

Информация состоит из отдельных фактических данных, передающихся в виде отдельных сообщений.
5. Достаточность

Содержательная полнота сообщаемого набора показателей для принятия решения [4].
6. Достоверность

Соответствие информации объективной реальности (как текущей, так и прошедшей) окружающего мира.

На достоверность информации влияет как достоверность данных, так и адекватность методов, использованных при её получении.
7. Доступность

Мера возможности получить ту или иную информацию [3].
8. Запоминаемость

Запоминаемую информацию будем называть макроскопической (имея в виду пространственные масштабы запоминающей ячейки и время запоминания). Именно с макроскопической информацией мы имеем дело в реальной практике [1].
9. Избыточность

Нередко избыточность информации человек чисто психологически воспринимает как её качество, потому что она позволяет ему меньше напрягать своё внимание и меньше утомляться.

Обычный текст, напечатанный на русском языке, имеет избыточность порядка 20–25 %.

Избыточность информации, заключенной в тексте, позволяет догадываться о значении неразборчивых символов.
Визуальная информация имеет очень большую избыточность – более 90 %. Избыточность видеоинформации – до 98–99 %.
Эта избыточность позволяет нам рассеивать внимание, что часто воспринимается как отдых при просмотре кинофильма.

Всякое сокращение избыточности данных непременно влечёт за собой сокращение диапазона возможных методов для их использования. В информационных технологиях вопрос избыточности данных и достаточности методов – это всегда вопрос тонкого и непростого баланса [3].
10. Краткость

Степень сжатости изложения сообщаемых сведений.
11. Непрерывность

Информация накапливается и развивается поступательно [4].
12. Объективность и субъективность

Более объективной принято считать ту информацию, в которую методы вносят меньший субъективный элемент.
13. Полнота

Достаточность информации для принятия решения [3].
14. Понятность

Соответствие содержания информации уровню знаний потребителя [4].
15. Преобразуемость

Фундаментальное свойство информации. Оно означает, что информация может менять способ и форму своего существования. Копируемость есть разновидность преобразования информации, при котором её количество не меняется. В общем случае количество информации в процессах преобразования меняется, но возрастать не может [2].
16. Репрезентативность

Правильность отбора и формирования информации для адекватного отражения передаваемого явления.
17. Своевременность

Степень соответствия момента поступления информации назначенному моменту времени.

18. Содержательность

Семантическая ёмкость информации, равная отношению количества семантической информации в сообщении к объёму обрабатываемых данных.


19. Ценность

Ценность информации зависит от того, насколько она важна для решения задачи, а также от того, насколько в дальнейшем она найдёт применение в каких-либо видах деятельности человека [4].

Аспекты информации

В теории информации рассматриваются 3 аспекта [5].


1. Прагматический аспект

Отражает соответствие информации цели, для достижения которой её предполагает использовать информационный субъект. Определение информации как полезного содержания данных отражает в первую очередь именно прагматический аспект. С этой точки зрения анализируются потребительские свойства информации. Однако если ограничиться лишь этим аспектом, то будет утеряна связь между информацией и данными, а также сужены возможности эффективного использования данных.


2. Семантический аспект

Определяет степень соответствия информационного объекта и его образа, содержащегося в информации (данных), т. е. характеризует смысловое содержание информации. В семантическом аспекте в информации выделяются различные информационные единицы, имеющие смысловые связи как между собой, так, и, возможно, с входящими в них более мелкими информационными единицами. Информационные единицы могут отражать различные стороны информационного объекта или его составных частей.


3. Синтаксический аспект

Связан с формой представления информации и не затрагивает её смыслового содержания. Таким образом, данные пр едставляют собой информацию в синтаксическом аспекте.

Различные подходы к измерению информации

Количество информации – это мера снятия неопределённости одной случайной величины в результате наблюдения за другой.

Количественно выраженная неопределённость состояния получила название энтропии. При получении информации уменьшается неопределённость, т. е. энтропия системы.

В информатике, как правило, измерению подвергается информация, представленная дискретным сигналом.

Различают следующие подходы к измерению информации [1]:

1. Структурный подход

Измеряет количество информации простым подсчётом информационных элементов, составляющих сообщение. Применяется для оценки возможностей запоминающих устройств, объёмов передаваемых сообщений, инструментов кодирования без учёта статистических характеристик их эксплуатации.

В рамках структурного подхода выделяют три меры информации:

1) геометрическая – определяет максимально возможное количество информации в заданных объемах. Единицей измерения является информационный элемент. Мера может быть использована для определения информационной ёмкости памяти компьютера. В этом случае в качестве информационного элемента выступает минимальная единица хранения – бит;


2) комбинаторная – оценивает возможность представления информации при помощи различных комбинаций информационных элементов в заданном объёме.

Использует типы комбинаций элементов и соответствующие математические соотношения, которые приводятся в одном из разделов дискретной математики – комбинаторике.

Комбинаторная мера может использоваться для оценки информационных возможностей некоторого автомата, который способен генерировать дискретные сигналы (сообщения) в соответствии с определённым правилом комбинаторики.

3) аддитивная – эта мера предложена в 1928 г. американским учёным Хартли, поэтому имеет второе название – мера Хартли.

Хартли впервые ввёл специальное обозначение для количества информации – I – и предложил следующую логарифмическую зависимость между количеством информации и мощностью исходного алфавита:
I = l log h,
где I – количество информации, содержащейся в сообщении;
l – длина сообщения;
h – мощность исходного алфавита.

При исходном алфавите {0, 1}; l = 1; h = 2 и основании логарифма, равном 2, имеем
I = 1 · log 2 2 = 1.
Данная формула даёт аналитическое определение бита (BIT – BInary digiT) по Хартли: это количество информации, которое содержится в двоичной цифре.
Единицей измерения информации в аддитивной мере является бит.
Приведём пример.

Необходимо рассчитать количество информации, которое содержится в шестнадцатеричном и двоичном представлении ASCII–кода для числа l.

В соответствии с таблицей ASCII–кодов имеем: шестнадцатеричное представление числа l – 31, двоичное представление числа l – 00110001.

Тогда по формуле Хартли получаем:

для шестнадцатеричного представления

I = 2 · log 2 16 = 8 бит;

для двоичного представления

I = 8 · log 2 2 = 8 бит.

Таким образом, разные представления ASCII–кода для одного символа содержат одинаковое количество информации, измеренной аддитивной мерой.

2. Статистический подход

Учитывает вероятность появления сообщений: более информативным считается то сообщение, которое менее вероятно, т. е. менее всего ожидалось. Применяется при оценке значимости получаемой информации.

В 30-х г. ХХ в. американский ученый Клод Шеннон предложил связать количество информации, которое несет в себе некоторое сообщение, с вероятностью получения этого сообщения.

Вероятность p – количественная априорная (т. е. известная до проведения опыта) характеристика одного из исходов (событий) некоторого опыта. Измеряется в пределах от 0 до 1. Если заранее известны все исходы опыта, сумма их вероятностей равна 1, а сами исходы составляют полную группу событий. Если все исходы могут свершиться с одинаковой долей вероятности, они называются равновероятными.


3. Семантический подход

Учитывает целесообразность и полезность информации. Применяется при оценке эффективности получаемой информации и её соответствия реальности.


4. Вероятностный подход

Р. Хартли в 1928 г. процесс получения информации рассматривал как выбор одного сообщения из конечного наперёд заданного множества из N равновероятных сообщений, а количество информации I, содержащееся в выбранном сообщении, определял как двоичный логарифм N.

Согласно формуле Р. Хартли:
I = log 2 N
– количество информации, которое вмещает один символ N-элементного алфавита, равно log 2 N.
Рассмотрим пример.

Допустим, нужно угадать одно число из набора чисел от единицы до ста. По формуле Хартли можно вычислить, какое количество информации для этого требуется:

I = log 2 100 = 6,644.
Таким образом, сообщение о верно угаданном числе содержит количество информации, приблизительно равное 6,644 единицы информации.

Клод Шеннон в 1948 г. предложил формулу определения количества информации, учитывающую возможную неодинаковую вероятность сообщений в наборе.В качестве единицы информации Клод Шеннон предложил принять один бит.
5. Алфавитный подход

Согласно Колмогорову, количество информации, содержащейся в последовательности символов, определяется минимально возможным количеством двоичных знаков, необходимых для кодирования этой последовательности безотносительно к содержанию представленного ею сообщения. При этом для кодирования наиболее часто используется двоичный алфавит, состоящий из нуля и единицы, это так называемое двоичное кодирование информации.

Качество информации

Качество информации является одним из важнейших параметров для потребителя и определяется следующими характеристиками.

1. Репрезентативность – правильность отбора информации в целях адекватного отражения источника информации. Например, в целях большей репрезентативности данных о себе абитуриенты стремятся представить в приёмную комиссию как можно больше свидетельств, дипломов, удостоверений и другой информации, подтверждающей их высокий уровень подготовки, что учитывается при зачислении в вуз.

2. Содержательность – семантическая ёмкость информации. Рассчитывается как отношение количества семантической информации к её количеству в геометрической мере. Это характеристика сигнала, про который говорят, что "мыслям в нём тесно, а словам просторно". В целях увеличения содержательности сигнала, например, используют для характеристики успеваемости абитуриента не полный перечень его аттестационных оценок, а средний балл по аттестату.

3. Достаточность (полнота) – минимальный, но достаточный состав данных для достижения целей, которые преследует потребитель информации. Эта характеристика похожа на репрезентативность, однако разница состоит в том, что в данном случае учитывается минимальный состав информации, который не мешает принятию решения. Например, абитуриент – золотой медалист – может не представлять в приёмную комиссию свой аттестат: диплом, подтверждающий получение золотой медали, свидетельствует о полном наборе отличных оценок в аттестате.

4. Доступность – простота (или возможность) выполнения процедур получения и преобразования информации. Эта характеристика применима не ко всей информации, а лишь к той, которая не является закрытой. Для обеспечения доступности бумажных документов используются различные средства оргтехники, а для облегчения их обработки используются средства вычислительной техники.

5. Актуальность – зависит от динамики изменения характеристик информации и определяется сохранением ценности информации для пользователя в момент её использования. Очевидно, что касается информации, которая используется при зачислении, она актуальна, так как само обучение уже закончилось, и его результаты изменены быть не могут, а, значит, остаются актуальными.

6. Своевременность – поступление не позже заранее назначенного срока. Этот параметр также очевиден недавним абитуриентам: опоздание с предоставлением позитивной информации о себе при поступлении может быть чревато незачислением.

7. Точность – степень близости информации к реальному состоянию источника информации. Например, неточной информацией является медицинская справка, в которой отсутствуют данные о перенесённых абитуриентом заболеваниях.

8. Достоверность – свойство информации отражать источник информации с необходимой точностью. Эта характеристика вторична относительно точности. В предыдущем примере получаемая информация недостоверна.

9. Устойчивость – способность информации реагировать на изменения исходных данных без нарушения необходимой точности.

Классификация информации

  1. По принадлежности к системе управления:
  • информация о внешней среде;
  • информация управляющей подсистемы;
  • информация управляемой подсистемы;
  • информация о целевой подсистеме.
  1. По форме передачи:
  • вербальная (например, словесная);
  • невербальная (например, графическая).
  1. По стадии возникновения:
  • исходная (первичная, возникающая в источниках информации);
  • производная (сводная, формируемая из исходной по заданному алгоритму);
  • промежуточная (возникающая в процессе преобразования первичной информации в сводную, содержащая перерабатываемые и накапливаемые данные для последующего использования).
  1. По назначению при машинной обработке:
  • входная – информация, поступающая в обработку;
  • выходная – результат обработки, подлежащий дальнейшей передаче.
  1. По месту возникновения:
  • внутренняя;
  • внешняя.
  1. По степени стабильности:
  • условно-постоянная – неизменная в течение длительного времени, многократно используемая для обработки;
  • переменная – первичная информация за определённый период времени, изменяющаяся в зависимости от периодичности поступления.
  1. По отношению к запросу:
  • релевантная – соответствует формулировке запроса;

 

  • пертинентная – соответствующая информационной потребности лица, сформулировавшего запрос.
  1. По уровню в системе управления:
  • информация частных лиц;
  • информация предприятий и организаций;
  • информация министерств и ведомств;
  • информация государственного уровня и др.
  1. По периодичности возникновения:
  • единовременная;
  • ежедневная;
  • еженедельная;
  • декадная;
  • ежемесячная и т. д. [4].

Обработка информации

Информацию можно:

  • создавать;
  • передавать;
  • воспринимать;
  • использовать;
  • запоминать;
  • принимать;
  • копировать;
  • формализовать;
  • распространять;
  • преобразовывать;
  • комбинировать;
  • обрабатывать;
  • делить на части;
  • упрощать;
  • собирать;
  • хранить;
  • искать;
  • измерять;
  • разрушать и др.

 

Моделирование Человечество в своей деятельности (научной, образовательной) постоянно созадет и использует модели окружающего мира. Строгие правила построения моделей сформулировать невозможно, однако человечество накопило богатый опыт моделирования различных объектов и процессов. Модели позволяют в наглядной форме представить объекты и процессы, недоступные для непосредственного восприятия (очень большие или очень маленькие объекты, очень быстрые или очень медленные процессы и др.). Наглядные модели часто используются в процессе обучения. В курсе геграфии первые представления о нашей планете Земля мы получаем, изучая ее модель - глобус, в курсе физики изучаем работу двигателя внутреннего сгорания по его модели, в химии при изучении строения вещества используем модли молекул и кристаллических решеток, в биологии изучаем строение человека по анатомическим муляжам и т.д. Модели играют черезвычайно важную роль в проектировании и создании различных технических устройств. машин и механизмов, зданий, электрических цепей и т.д. Моделирование - это метод познания, состоящий в создании и исследовании моделей. Модлировать можно:
  1. Объекты
    • копии архитектурных сооружений
    • модель атома водорода или солнечной системы
    • глобус
    • детские игрушки
  2. Явления
      • модели физических явлений: грозовго разряда, магнитных сил
      • геофизические модели: модель селевого потока, модель землятресения
  3. Процессы
      • модель развития вселенной
      • модели экономических процессов
  4. Поведение При выполнении человеком какого-либо действия ему обычно предшествует возникновение в его создании модели будущего поведения. Собирается ли он строить дом или решать задачу, преходит улицу или отправляется в поход - он непременно сначала представляет все это в уме. Это главное отличие человека мыслящего от всех других существ на земле. Один и тот же объект в различных ситуациях может описываться различными моделями.
С другой стороны разные объекты могут описываться одной моделью. Модель Каждый объект имеет большое количество различных свойств. В процессе построения моделей выделяются главные, наиболее существенные для проводимого исследования свойства. В процессе исследования аэродинамических качеств модли самолета в аэродинамической трубе важно, чтобы модель имела геометрическое подобие оригинала, но не важен, например, ее цвет. При построении электрических схем - моделей электрических цепей - необходимо учитывать порядок подключения элементов цепи друг к другу, но не важно их геометрическое расположение друг относительно друга и так далее. Модель - это некий новый объект, который отражает существенные особенности изучаемого объекта, процесса или явления.
Глобус -модель земного шара Десткая игрушка - модель настоящего автомобиля
       

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...