Различные подходы к измерению информации
Свойства информации Как и всякий объект, информация обладает свойствами (объекты различимы по своим свойствам). Характерной особенностью информации, отличающей её от других объектов природы и общества, является отмеченный выше дуализм: на свойства информации влияют как свойства данных, составляющих её содержательную часть, так и свойства методов, взаимодействующих с данными в ходе информационного процесса. Степень соответствия информации, полученной потребителем, тому, что автор вложил в её содержание (то есть в данные). Степень соответствия информации текущему моменту времени [3]. Воспроизводимость информации тесно связана с её передаваемостью и не является её независимым базовым свойством. Если передаваемость означает, что не следует считать существенными пространственные отношения между частями системы, между которыми передаётся информация, то воспроизводимость характеризует неиссякаемость и неистощимость информации, т. е. что при копировании информация остаётся тождественной самой себе [2]. Информация состоит из отдельных фактических данных, передающихся в виде отдельных сообщений.
Содержательная полнота сообщаемого набора показателей для принятия решения [4]. Соответствие информации объективной реальности (как текущей, так и прошедшей) окружающего мира. На достоверность информации влияет как достоверность данных, так и адекватность методов, использованных при её получении. Мера возможности получить ту или иную информацию [3]. Запоминаемую информацию будем называть макроскопической (имея в виду пространственные масштабы запоминающей ячейки и время запоминания). Именно с макроскопической информацией мы имеем дело в реальной практике [1]. Нередко избыточность информации человек чисто психологически воспринимает как её качество, потому что она позволяет ему меньше напрягать своё внимание и меньше утомляться. Обычный текст, напечатанный на русском языке, имеет избыточность порядка 20–25 %. Избыточность информации, заключенной в тексте, позволяет догадываться о значении неразборчивых символов. Всякое сокращение избыточности данных непременно влечёт за собой сокращение диапазона возможных методов для их использования. В информационных технологиях вопрос избыточности данных и достаточности методов – это всегда вопрос тонкого и непростого баланса [3]. Степень сжатости изложения сообщаемых сведений. Информация накапливается и развивается поступательно [4]. Более объективной принято считать ту информацию, в которую методы вносят меньший субъективный элемент. Достаточность информации для принятия решения [3].
Соответствие содержания информации уровню знаний потребителя [4]. Фундаментальное свойство информации. Оно означает, что информация может менять способ и форму своего существования. Копируемость есть разновидность преобразования информации, при котором её количество не меняется. В общем случае количество информации в процессах преобразования меняется, но возрастать не может [2]. Правильность отбора и формирования информации для адекватного отражения передаваемого явления. Степень соответствия момента поступления информации назначенному моменту времени. 18. Содержательность Семантическая ёмкость информации, равная отношению количества семантической информации в сообщении к объёму обрабатываемых данных.
Ценность информации зависит от того, насколько она важна для решения задачи, а также от того, насколько в дальнейшем она найдёт применение в каких-либо видах деятельности человека [4]. Аспекты информации В теории информации рассматриваются 3 аспекта [5].
Отражает соответствие информации цели, для достижения которой её предполагает использовать информационный субъект. Определение информации как полезного содержания данных отражает в первую очередь именно прагматический аспект. С этой точки зрения анализируются потребительские свойства информации. Однако если ограничиться лишь этим аспектом, то будет утеряна связь между информацией и данными, а также сужены возможности эффективного использования данных.
Определяет степень соответствия информационного объекта и его образа, содержащегося в информации (данных), т. е. характеризует смысловое содержание информации. В семантическом аспекте в информации выделяются различные информационные единицы, имеющие смысловые связи как между собой, так, и, возможно, с входящими в них более мелкими информационными единицами. Информационные единицы могут отражать различные стороны информационного объекта или его составных частей.
Связан с формой представления информации и не затрагивает её смыслового содержания. Таким образом, данные пр едставляют собой информацию в синтаксическом аспекте.
Различные подходы к измерению информации Количество информации – это мера снятия неопределённости одной случайной величины в результате наблюдения за другой. Количественно выраженная неопределённость состояния получила название энтропии. При получении информации уменьшается неопределённость, т. е. энтропия системы. В информатике, как правило, измерению подвергается информация, представленная дискретным сигналом. Различают следующие подходы к измерению информации [1]: 1. Структурный подход Измеряет количество информации простым подсчётом информационных элементов, составляющих сообщение. Применяется для оценки возможностей запоминающих устройств, объёмов передаваемых сообщений, инструментов кодирования без учёта статистических характеристик их эксплуатации. В рамках структурного подхода выделяют три меры информации: 1) геометрическая – определяет максимально возможное количество информации в заданных объемах. Единицей измерения является информационный элемент. Мера может быть использована для определения информационной ёмкости памяти компьютера. В этом случае в качестве информационного элемента выступает минимальная единица хранения – бит;
Использует типы комбинаций элементов и соответствующие математические соотношения, которые приводятся в одном из разделов дискретной математики – комбинаторике. Комбинаторная мера может использоваться для оценки информационных возможностей некоторого автомата, который способен генерировать дискретные сигналы (сообщения) в соответствии с определённым правилом комбинаторики. 3) аддитивная – эта мера предложена в 1928 г. американским учёным Хартли, поэтому имеет второе название – мера Хартли. Хартли впервые ввёл специальное обозначение для количества информации – I – и предложил следующую логарифмическую зависимость между количеством информации и мощностью исходного алфавита:
При исходном алфавите {0, 1}; l = 1; h = 2 и основании логарифма, равном 2, имеем Необходимо рассчитать количество информации, которое содержится в шестнадцатеричном и двоичном представлении ASCII–кода для числа l. В соответствии с таблицей ASCII–кодов имеем: шестнадцатеричное представление числа l – 31, двоичное представление числа l – 00110001. Тогда по формуле Хартли получаем: для шестнадцатеричного представления I = 2 · log 2 16 = 8 бит; для двоичного представления I = 8 · log 2 2 = 8 бит. Таким образом, разные представления ASCII–кода для одного символа содержат одинаковое количество информации, измеренной аддитивной мерой. 2. Статистический подход Учитывает вероятность появления сообщений: более информативным считается то сообщение, которое менее вероятно, т. е. менее всего ожидалось. Применяется при оценке значимости получаемой информации. В 30-х г. ХХ в. американский ученый Клод Шеннон предложил связать количество информации, которое несет в себе некоторое сообщение, с вероятностью получения этого сообщения. Вероятность p – количественная априорная (т. е. известная до проведения опыта) характеристика одного из исходов (событий) некоторого опыта. Измеряется в пределах от 0 до 1. Если заранее известны все исходы опыта, сумма их вероятностей равна 1, а сами исходы составляют полную группу событий. Если все исходы могут свершиться с одинаковой долей вероятности, они называются равновероятными.
Учитывает целесообразность и полезность информации. Применяется при оценке эффективности получаемой информации и её соответствия реальности.
Р. Хартли в 1928 г. процесс получения информации рассматривал как выбор одного сообщения из конечного наперёд заданного множества из N равновероятных сообщений, а количество информации I, содержащееся в выбранном сообщении, определял как двоичный логарифм N. Согласно формуле Р. Хартли: Допустим, нужно угадать одно число из набора чисел от единицы до ста. По формуле Хартли можно вычислить, какое количество информации для этого требуется:
I = log 2 100 = 6,644. Клод Шеннон в 1948 г. предложил формулу определения количества информации, учитывающую возможную неодинаковую вероятность сообщений в наборе.В качестве единицы информации Клод Шеннон предложил принять один бит. Согласно Колмогорову, количество информации, содержащейся в последовательности символов, определяется минимально возможным количеством двоичных знаков, необходимых для кодирования этой последовательности безотносительно к содержанию представленного ею сообщения. При этом для кодирования наиболее часто используется двоичный алфавит, состоящий из нуля и единицы, это так называемое двоичное кодирование информации. Качество информации Качество информации является одним из важнейших параметров для потребителя и определяется следующими характеристиками. 1. Репрезентативность – правильность отбора информации в целях адекватного отражения источника информации. Например, в целях большей репрезентативности данных о себе абитуриенты стремятся представить в приёмную комиссию как можно больше свидетельств, дипломов, удостоверений и другой информации, подтверждающей их высокий уровень подготовки, что учитывается при зачислении в вуз. 2. Содержательность – семантическая ёмкость информации. Рассчитывается как отношение количества семантической информации к её количеству в геометрической мере. Это характеристика сигнала, про который говорят, что "мыслям в нём тесно, а словам просторно". В целях увеличения содержательности сигнала, например, используют для характеристики успеваемости абитуриента не полный перечень его аттестационных оценок, а средний балл по аттестату. 3. Достаточность (полнота) – минимальный, но достаточный состав данных для достижения целей, которые преследует потребитель информации. Эта характеристика похожа на репрезентативность, однако разница состоит в том, что в данном случае учитывается минимальный состав информации, который не мешает принятию решения. Например, абитуриент – золотой медалист – может не представлять в приёмную комиссию свой аттестат: диплом, подтверждающий получение золотой медали, свидетельствует о полном наборе отличных оценок в аттестате. 4. Доступность – простота (или возможность) выполнения процедур получения и преобразования информации. Эта характеристика применима не ко всей информации, а лишь к той, которая не является закрытой. Для обеспечения доступности бумажных документов используются различные средства оргтехники, а для облегчения их обработки используются средства вычислительной техники. 5. Актуальность – зависит от динамики изменения характеристик информации и определяется сохранением ценности информации для пользователя в момент её использования. Очевидно, что касается информации, которая используется при зачислении, она актуальна, так как само обучение уже закончилось, и его результаты изменены быть не могут, а, значит, остаются актуальными. 6. Своевременность – поступление не позже заранее назначенного срока. Этот параметр также очевиден недавним абитуриентам: опоздание с предоставлением позитивной информации о себе при поступлении может быть чревато незачислением. 7. Точность – степень близости информации к реальному состоянию источника информации. Например, неточной информацией является медицинская справка, в которой отсутствуют данные о перенесённых абитуриентом заболеваниях. 8. Достоверность – свойство информации отражать источник информации с необходимой точностью. Эта характеристика вторична относительно точности. В предыдущем примере получаемая информация недостоверна. 9. Устойчивость – способность информации реагировать на изменения исходных данных без нарушения необходимой точности. Классификация информации
Обработка информации Информацию можно:
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|