Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Понятие и свойства информационных ресурсов.




Конспект лекций

Лекция 1.1. Введение в ИТУ, основные понятия и определения

План

1. Понятие данных, информации и ее свойств.

2. Подходы к оценке ин­формации.

Понятие и свойства информационных ресурсов.

Вопрос 1. Понятие данных, информации и ее свойств.

Данные – это зарегистрированные сигналы реального мира. Объекты материального мира, в котором мы живем, относятся либо к физическим телам, либо к физическим полям. Из школьного курса физики известно, что абсолютного покоя не существует, и физические объекты находятся в состоянии непрерывного движения и изменения. Изменение и движение одних физических объектов служит предпосылкой (сигналом) для изменения свойств других. Такое изменение свойств объекта называется регистрацией сигналов. Человек регистрирует сигналы с помощью органов чувств и технических устройств, получая данные о состоянии мира, в котором он живет.

Понятие «данные» очень близко к понятию «информация», которую в широком смысле слова можно определить как отражение материального мира. Но эти понятия не идентичны. Например, прослушивая передачу на незнакомом нам языке, мы получаем данные (громкий или тихий звук, женский или мужской голос и т.п.), но не получаем информацию. Если с помощью специальных приборов мы измерим громкость звучания передачи, то получим уже информацию об уровне громкости звука, измеряемую в децибелах. В рассмотренном случае для получения информации был применен метод аппаратной обработки данных. Если мы переведем запись передачи на известный нам язык, то получим уже информацию о содержании передачи. Таким образом, информация – это продукт взаимодействия данных и адекватных им методов.

Существуют следующие операции с данными:

1) Создание данных – процесс получения данных из материального мира и приведения их к виду, стандартному для дальнейшей обработки с помощью вычислительной техники.

2) Хранение данных – запись данных на носители информации, используемые в вычислительной технике.

3) Обработка данных – процесс исполнения операций, протекающих в установленной последовательности с целью преобразования исходных данных в результативную информацию.

4) Передача данных – процесс обмена данными между удаленными потребителями, при этом источник данных в информатике принять называть сервером, а потребителя – клиентом.

Приведенный здесь список типовых операций с данными далеко не полон. Миллионы людей во всем мире занимаются созданием, обработкой, преобразованием и транспортировкой данных, и на каждом рабочем месте выполняются свои специфические операции, необходимые для управления социальными, экономическими, научными, промышленными и др. процессами. Полный список возможных операций с данными составить невозможно, да и не нужно. Важно то, что в результате преобразования данных получается достоверная информация.

Информация, как и всякий объект природы, обладает свойствами. Характерной особенностью информации, отличающей ее от других объектов, является то, что на свойства информации влияют как свойства данных, составляющих ее содержательную часть, так и свойства методов преобразования этих данных. С точки зрения информатики наиболее важными представляются следующие свойства информации:

· Объективность и субъективность информации. Понятие объективности информации является относительным, т.к. методы преобразования данных в информацию носят субъективный характер. Более объективной принято считать ту информацию, в которую методы вносят меньший субъективный элемент. Так, например, в результате наблюдения фотоснимка какого-нибудь природного объекта получается более объективная информация, чем в результате наблюдения рисунка того же объекта, выполненного художником.

· Полнота информации. Полнота информации характеризует качество информации (степень полезности для пользователя) и определяет достаточность данных для принятия конкретного решения.

· Достоверность информации. Данные возникают в момент регистрации сигналов, но не все сигналы являются «полезными» - всегда существует какой-то процент посторонних сигналов, т.е. «информационный шум». При увеличении уровня шумов достоверность информации снижается. Таким образом, достоверность можно определить как свойство информации не иметь скрытых ошибок.

· Адекватность информации – степень соответствия отображаемому объекту или явлению. Неадекватная информация может образовываться при использовании неполных или недостоверных данных. Однако и полные, и достоверные данные вследствие применения к ним неадекватных методов могут приводить к появлению неадекватной информации.

· Доступность информации – мера возможности получения ее данным потребителем. На степень доступности информации одновременно влияют как доступность данных, так и доступность адекватных методов для их преобразования. Отсутствие хотя бы одного из указанных факторов приводит к тому, что информация оказывается недоступной.

· Актуальность информации – степень соответствия информации текущему моменту времени. Так, например, информация о стоимости товара месяц назад является неактуальной для тех, кто приобретает этот товар сегодня.

· Защищенность информации – свойство, характеризующее невозможность несанкционированного использования или изменения информации.

· Эргономичность информации – свойство, характеризующее удобство формы или объема информации с точки зрения потребителя.

 

Вопрос 2. Подходы к оценке ин­формации.

 

Для измерения информации вводятся два параметра: количество информации I и объем данных V д.

Эти параметры имеют разные выражения и интерпретацию в зависимости от рассматриваемой формы адекватности. Каждой форме адекватности соответствует своя мера количества информации и объема данных (рис. 1).

Рис. 1. Меры информации

Синтаксическая мера информации

 

Объем данных Vд. в сообщении измеряется количеством символов (разрядов) в этом сообщении. В различных системах счисления один разряд имеет различный вес и соответственно меняется единица измерения данных: в двоичной системе счисления единица измерения - бит (bit - binary digit - двоичный разряд) или байт (1 байт = 8 бит). Например, сообщение в двоичной системе в виде восьмиразрядного двоичного кода 10111011 имеет объем данных V д=8 бит.

Количество информации на синтаксическом уровне связано с понятием неопределенности состояния системы (энтропии системы)..

Пусть до получения информации потребитель имеет некоторые предварительные (априорные) сведения о системе a. Мерой его неосведомленности о системе является функция H(a), которая в то же время служит и мерой неопределенности состояния системы. После получения некоторого сообщения b получатель приобрел некоторую дополнительную информацию Ib(a), уменьшившую его априорную неосведомленность так, что апостериорная (после получения сообщения b) неопределенность состояния системы стала Hb(a).

Тогда количество информации Ib(a) о системе, полученной в сообщении b, определится как

 

Ib(a)=H(a)-Hb(a),

 

т.е. количество информации измеряется изменением (уменьшением) неопределенности состояния системы.

Энтропия системы H(a), имеющая N возможных состояний, согласно формуле Шеннона, равна:

где Рi - вероятность того, что система находится в i-м состоянии.

Для случая, когда все состояния системы равновероятны, т.е. их вероятности равны Pi= 1 /N, ее энтропия определяется соотношением

 

Коэффициент (степень) информативности (лаконичность) сообщения определяется отношением количества информации к объему данных, т.е.

причем 0<Y<1

С увеличением Y уменьшаются объемы работы по преобразованию информации (данных) в системе.

 

Семантическая мера информация

 

Для измерения смыслового содержания информации, т.е. ее количества на семантическом уровне, наибольшее признание получила тезаурусная мера, которая связывает семантические свойства информации со способностью пользователя принимать поступившее сообщение. Для этого используется понятие тезаурус пользователя.

Тезаурус - это совокупность сведений, которыми располагает пользователь или система.

В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя Sp изменяется количество семантической информации Ic, воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус. Характер такой зависимости показан на рис. 2. Рассмотрим два предельных случая, когда количество семантической информации Ic равно 0:

при Sp 0 пользователь не воспринимает, не понимает поступающую информацию;

при Sp; пользователь все знает, и поступающая информация ему не нужна.

Рис. 2. Зависимость количества семантической информации. воспринимаемой

потребителем, от его тезауруса Ic=f(Sp)

 

Максимальное количество семантической информации Ic потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом Sp (Sp = Sp opt), когда поступающая информация понятна пользователю и несет ему ранее не известные (отсутствующие в его тезаурусе) сведения.

Относительной мерой количества семантической информации может служить коэффициент содержательности С, который определяется как отношение количества семантической информации к ее объему:

Прагматическая мера информации

Эта мера определяет полезность информации (ценность) для достижения пользователем поставленной цели..

 

Измерение количества информации

 

В настоящее время получили распространение подходы к определению понятия "количество информации", основанные на том, что информацию, содержащуюся в сообщении, можно нестрого трактовать в смысле её новизны или, иначе, уменьшения неопределённости наших знаний об объекте.

Так, американский инженер Р. Хартли (1928 г.) процесс получения информации рассматривает как выбор одного сообщения из конечного наперёд заданного множества из N равновероятных сообщений, а количество информации I, содержащееся в выбранном сообщении, определяет как двоичный логарифм N.

<TBODY>Формула Хартли: I = log2N. </TBODY>

 

Допустим, нужно угадать одно число из набора чисел от единицы до ста. По формуле Хартли можно вычислить, какое количество информации для этого требуется: I = log2100  6,644. То есть сообщение о верно угаданном числе содержит количество информации, приблизительно равное 6,644 единиц информации.

Приведем другие примеры равновероятных сообщений:

1. при бросании монеты: "выпала решка", "выпал орел";

2. на странице книги: "количество букв чётное", "количество букв нечётное".

Определим теперь, являются ли равновероятными сообщения "первой выйдет из дверей здания женщина" и "первым выйдет из дверей здания мужчина". Однозначно ответить на этот вопрос нельзя. Все зависит от того, о каком именно здании идет речь. Если это, например, станция метро, то вероятность выйти из дверей первым одинакова для мужчины и женщины, а если это военная казарма, то для мужчины эта вероятность значительно выше, чем для женщины.

Для задач такого рода американский учёный Клод Шеннон предложил в 1948 г. другую формулу определения количества информации, учитывающую возможную неодинаковую вероятность сообщений в наборе.

 

Формула Шеннона:

I = – (p1 log2 p1 + p2 log2 p2 +... + pN log2 pN),

где p i — вероятность того, что именно i -е сообщение выделено в наборе из N сообщений. </TBODY>

 

Легко заметить, что если вероятности p1,..., pN равны, то каждая из них равна 1/N, и формула Шеннона превращается в формулу Хартли.

Помимо двух рассмотренных подходов к определению количества информации, существуют и другие. Важно помнить, что любые теоретические результаты применимы лишь к определённому кругу случаев, очерченному первоначальными допущениями.

В качестве единицы информации условились принять один бит (англ. bitbinary, digit — двоичная цифра).

<TBODY> Бит в теории информации — количество информации, необходимое для различения двух равновероятных сообщений.

А в вычислительной технике битом называют наименьшую "порцию" памяти, необходимую для хранения одного из двух знаков "0" и "1", используемых для внутримашинного представления данных и команд. </TBODY>

Бит — слишком мелкая единица измерения. На практике чаще применяется более крупная единица — байт, равная восьми битам. Именно восемь битов требуется для того, чтобы закодировать любой из 256 символов алфавита клавиатуры компьютера (256=28).

Широко используются также ещё более крупные производные единицы информации:

· 1 Килобайт (Кбайт) = 1024 байт = 210 байт,

· 1 Мегабайт (Мбайт) = 1024 Кбайт = 220 байт,

· 1 Гигабайт (Гбайт) = 1024 Мбайт = 230 байт.

В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как:

· 1 Терабайт (Тбайт) = 1024 Гбайт = 240 байт,

· 1 Петабайт (Пбайт) = 1024 Тбайт = 250 байт.

За единицу информации можно было бы выбрать количество информации, необходимое для различения, например, десяти равновероятных сообщений. Это будет не двоичная (бит), а десятичная (дит) единица информации.

 

Вопрос 3. Понятие и свойства информационных ресурсов.

Информационная технология – это комплекс методов, способов и средств, которые реализуются посредством компьютерных информационных систем для обеспечения информационного процесса. Таким образом, каждая информационная технология реализуется в рамках конкретной информационной системы.

В современных информационных технологиях этом широко используются методы и средства создания и ведения баз данных и баз знаний, языки высокого уровня, видеотерминальная техника, специализированные процессоры для редактирования текстов и работы с графической и речевой информацией. Развитие информационных технологий ведет к существенному увеличению объемов перерабатываемой информации и сокращению сроков ее обработки.

Информационные технологии (ИТ) принято классифицировать по типу обрабатываемой информации (например, данные обрабатываются с помощью систем управления базами данных, а знания – с помощью экспертных систем), по типу пользовательского интерфейса (командный, WIMP –интерфейс, т.е. содержащий базы программ и меню действий, и SILK – интерфейс, использующий речевые команды и смысловые семантические связи), по степени взаимодействия между собой (например, дискетное и сетевое взаимодействие).

Таким образом, информационные технологии выступают новым средством превращения знаний, получаемых и накапливаемых в процессе развития науки, практической деятельности людей и функционирования специальных устройств, в информационный ресурс общества, который стал одним из основных ресурсов человечества, достижением современной цивилизации.

Информационный ресур­с – это научные теории, открытия, патенты и изобретения, экономико-мате­матические модели, проекты машин и технологических процессов, сведения о недрах земли и океанов. Это весь веками накопленный духовный потен­циал, являющийся богатством страны. Это то, что определяет интеллектуаль­ную мощь современного государства.

Центральное место в информационном ресурсе (ИР) занимает понятие «знание». Знание – это отражение объективной реальности, выраженное в виде идей, понятий, представлений о предметах и явлениях. Знания передаются от человека к человеку в виде сообщений (информации). Следует отметить, что не все сообщенные знания выступают в качестве информационного ресурса. Книги, радио- и телепередачи, а также другие сообщения еще должны найти своих потребителей. Перед человечеством стоит важная задача – извлечь максимум информации из накопленных за всю историю цивилизации сообщений и превратить ее в активно функционирующий ресурс.

Основные особенности информационного ресурса:

1) В отличие от других видов ресурсов (например, материальных) ИР практически неисчерпаем: по мере развития общества запасы знаний не убывают, а растут.

2) ИР не самостоятелен. Только соединяясь с другими ресурсами – опытом, трудом, энергией, техникой и т.п. – ИР выступает в качестве движущей силы прогресса.

3) Эффективность применения ИР связана с эффектом повторного производства знаний. Так, например, для открытия закона всемирного тяготения человечеству потребовалось много веков своего развития, тогда как современный школьник может получить это знание за несколько минут из учебника физики.

4) Превращение знаний в информационный ресурс зависит от возможностей их кодирования, хранения и передачи, т.е. от уровня развития вычислительной, телекоммуникационной техники и информационных технологий.

 

Лекция 1.2. Информа­ционные технологии управления с точки зрения системного подхода

План

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...