Главная | Обратная связь | Поможем написать вашу работу!

Данные. Основные операции с данными

Данные - это совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки. Преобразование и обработка данных позволяет получить информацию.

Данные сами по себе, пока они не представляют ценности для решения какой-либо задачи, не являются информацией.

Основные операции с данными:

- сбор данных – накопление данных с целью обеспечения достаточной полноты информации для принятия решений;

- формализация данных – приведение данных, поступающих из разных источников, к одинаковой форме;

- фильтрация данных – отсеивание «лишних» данных;

- сортировка данных – упорядочение данных по заданному признаку с целью удобства использования;

- группировка данных – объединение данных по заданному признаку с целью повышения удобства использования;

- архивация данных – организация хранения данных;

- защита данных – комплекс мер, направленных на предотвращение утраты и модификации данных;

- транспортировка данных – прием и передача;

- преобразование данных – перевод данных из одной формы в другую

Отличие информации от данных состоит в том, что данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач.

Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию. Исходя из вышесказанного, можно сделать вывод, что информация - это результат преобразования и анализа данных.

Знания – это зафиксированная и проверенная практикой обработанная информация, которая использовалась и может многократно использоваться для принятия решений.

Знания – это вид информации, которая хранится в базе знаний и отображает знания специалиста в конкретной предметной области. Знания – это интеллектуальный капитал.

Формальные знания могут быть в виде документов (стандартов, нормативов), регламентирующих принятие решений или учебников, инструкций с описанием решения задач. Неформальные знания – это знания и опыт специалистов в определенной предметной области.

Необходимо отметить, что универсальных определений этих понятий (данных, информации, знаний) нет, они трактуются по-разному. Принятия решений осуществляются на основе полученной информации и имеющихся знаний.

Информационные процессы

Информационную деятельность человека можно разделить на три составляющие: хранение, передачу и обработку

Информационные процессы – процессы сбора, обработки, накопления, хранения, поиска, распространения и использования информации. Или процессы, связанные с поиском, хранением, передачей, обработкой и использованием информации.

Информационный процесс - это совокупность последовательных действий, производимых над информацией с целью получения результата. Среди всех информационных процессов можно выделить наиболее общие. К ним относятся передача, хранение и обработка информации.

Слово процесс обозначает некоторое событие, происходящее во времени: учебный процесс, процесс роста, процесс горения... Всякий процесс связан с какими-то действиями, выполняемыми человеком, силами природы, техническими устройствами, а также вследствие их взаимодействия. У каждого процесса есть объект воздействия: ученик, растение, горючее... Очевидно, что в информационных процессах объектом воздействия является информация.

Основные информационные процессы

- Хранение информации. Хранение информации – это процесс поддержания исходной информации в виде, обеспечивающем выдачу данных по запросам конечных пользователей в установленные сроки. Также, хранение информации - способ распространения информации в пространстве и времени. Способ хранения информации зависит от ее носителя ( книга - библиотека, картина - музей, фотография – альбом и др. ). Информация не может существовать без своего носителя. Носитель информации - это среда, непосредственно хранящая информацию. Заметим, что слово "носитель" означает " нести в себе ", то есть содержать, а не переносить информацию. Носителем информации о самом себе является практически любой предмет, явление, живое существо. Можно использовать и другие средства для хранения информации о чем-либо. Это может быть материальный предмет (камень, дерево, папирус, бумага, магнитные, оптические носители информации). Это могут быть волны различной природы (световые, звуковые, электромагнитные) или разные состояния вещества. Чтобы иметь возможность в будущем многократно воспользоваться информацией, используют так называемые внешние (по отношению к человеческой памяти) носители информации. Для извлечения информации из внешних носителей зачастую требуется дополнительные средства (например, для того, чтобы получить информацию, содержащуюся на Flash-карте, необходим ПК или др. устройство). В обществе хранение носителей с информацией организуется в специальных хранилищах. СИТ дают огромные возможности для организованного хранения информации в компактной форме. Здесь играют роль такие показатели, как информационная емкость, время доступа к информации, надежность хранения, время безотказной работы

- Передача информации - процесс обмена данными. Передача информации осуществляется различными способами: с помощью курьера, пересылка по почте, доставка транспортными средствами, дистанционная передача по каналам связи. В процессе передачи информации обязательно участвуют источник и приемник информации: первый передает информацию, второй ее получает. Между ними действует канал передачи информации - канал связи или канал передачи. Канал связи - совокупность технических и других устройств, обеспечивающих передачу сигнала от источника к получателю. Канал передачи - это некоторое среда, которая осуществляет доставку информации. Природа информационных каналов - колебательные движения среды: звуковые, световые, электромагнитные волны и пр. В процессе передачи информация может теряться, искажаться из-за помех и вредных воздействий. Причины таких воздействий могут быть как технического характера - перегрузки, вибрации, электрические и магнитные поля, перепады температур, давления, влажности окружающей среды, так и следствием человеческого вмешательства. Для нейтрализации помех применяются устойчивые материалы и средства связи, программируются избыточные коды, позволяющие восстановить исходную информацию. Развитие цифровых каналов связи открывает новые возможности пользователям компьютерных сетей.

Кодирующее устройство - устройство, предназначенное для преобразования исходного сообщения источника к виду, удобному для передачи. Декодирующее устройство - устройство для преобразования кодированного сообщения в исходное. Деятельность людей всегда связана с передачей информации. В процессе передачи информация может теряться и искажаться: искажение звука в телефоне, атмосферные помехи и др. Эти помехи, или, как их называют специалисты, шумы, искажают информацию. К счастью, существует наука, разрабатывающая способы защиты информации - криптология.

Рисунок 4. Схема передачи информации

- Обработка информации. Обработка информации - процесс получения новой информации на базе уже имеющейся. Или, это процесс преобразования информации от исходной ее формы до определенного результата. Преобразование информации может быть связано с изменением ее содержания или формы представления. В последнем случае говорят о кодировании информации. Например, шифрование информации или перевод текстов на другой язык.

Также, обработка информации представляет собой упорядоченный процесс ее преобразования в соответствии с алгоритмом решения задачи. Последовательность решения задач задается, исходя из их информационной взаимосвязи, когда результаты решения одной задачи используются как исходные данные для решения другой. Процесс решения определяется принятым вычислительным алгоритмом.

Схематически обработку информации можно представить следующим образом:

Выходная информация

Входная информация

Обработка (преобразование) информации

Рисунок 5. Упрощенная схема обработки информации

- Сбор информации. Это деятельность по накоплению данных с целью обеспечения достаточной полноты и в ходе которой он получает сведения об интересующем его объекте. Сбор информации может производиться или человеком, или с помощью технических средств и систем – аппаратно. Например, пользователь может получить информацию о движении поездов или самолетов сам, изучив расписание, или же от другого человека непосредственно, либо через какие-то документы, составленные этим человеком, или с помощью технических средств (автоматической справки, телефона и т.д.).

- Поиск информации. Поиск информации - это извлечение хранимой информации. Или, информационный поиск - процесс поиска документальной информации, удовлетворяющей информационные потребности. Методы поиска информации: наблюдение; общение со специалистами по интересующему вас вопросу; чтение; просмотр; прослушивание, запрос к информационным системам, базам и банкам компьютерных данных и другие методы.

- Защита информации. Это совокупность мер, направленных на предотвращение утраты, воспроизведения и модификации информации. Или, защита информации - это деятельность по предотвращению утечки защищаемой информации, несанкционированных и непреднамеренных воздействий на защищаемую информацию. Для защиты информации от несанкционированного вмешательства возникает необходимость ее засекречивания. На бытовом уровне иногда подменяются понятия кодирования и шифрования. Шифром называют секретный код преобразования информации с целью ее защиты от незаконных пользователей. Защита информации - важный компонент процессов хранения, обработки, передачи и использования информации в системах любого типа, особенно социальных и технических. Изобретением и использованием шифров занимается наука криптография.

Кодирование информации

Одну и ту же информацию, например, сведения об опасности мы можем выразить разными способами: просто крикнуть; оставить предупреждающий знак (рисунок); с помощью мимики и жестов; передать сигнал «SOS» с помощью азбуки Морзе или используя флажковую сигнализацию. В каждом из этих способов мы должны знать правила, по которым можно отобразить информацию. Такое правило назовем кодом.

Код — это набор условных обозначений (или сигналов) для записи (или передачи) некоторых заранее определенных понятий. Или, это набор символов для предоставления информации.

Пример: последовательность букв, цифры в числе, генетический, компьютерный и т.д.

Кодирование информации – это процесс формирования определенного представления информации. В более узком смысле под термином «кодирование» часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки.

Обычно каждый образ при кодировании (иногда говорят — шифровке) представлении отдельным знаком.

Знак - это элемент конечного множества отличных друг от друга элементов. Знак вместе с его смыслом называют символом.

Широко понятие кодирования стало употребляться с развитием технических средств хранения, передачи и обработки информации (телеграф, радио, компьютер).

Например, в начале 20 века телеграфные сообщения кодировались и передавались с помощью азбуки Морзе. Современный компьютер может обрабатывать числовую, текстовую, графическую, звуковую и видео информацию. Все эти виды информации в компьютере представлены в двоичном коде, т.е. используется алфавит мощностью два (всего два символа 0 и 1). Связано это с тем, что удобно представлять информацию в виде последовательности электрических импульсов: импульс отсутствует (0), импульс есть (1). Такое кодирование принято называть двоичным, а сами логические последовательности нулей и единиц - машинным языком. Каждая цифра машинного двоичного кода несет количество информации равное одному биту.

Кодирование текстовой информации

В настоящее время большая часть пользователей при помощи компьютера обрабатывает текстовую информацию, которая состоит из символов: букв, цифр, знаков препинания и др. Традиционно для того чтобы закодировать один символ используют количество информации равное 1 байту, т. е. I = 1 байт = 8 бит. При помощи формулы, которая связывает между собой количество возможных событий К и количество информации I, можно вычислить сколько различных символов можно закодировать (считая, что символы - это возможные события): К = 2^I = 2⁸ = 256, т.е. для представления текстовой информации можно использовать алфавит мощностью 256 символов. Суть кодирования заключается в том, что каждому символу ставят в соответствие двоичный код от 00000000 до 11111111 или соответствующий ему десятичный код от 0 до 255.

Необходимо помнить, что в настоящее время для кодировки русских букв используют пять различных кодовых таблиц (КОИ - 8, СР1251, СР866, Мас, ISO), причем тексты, закодированные при помощи одной таблицы не будут правильно отображаться в другой кодировке. Наглядно это можно представить в виде фрагмента объединенной таблицы кодировки символов.

Кодирование графической информации

В середине 50-х годов для больших ЭВМ, которые применялись в научных и военных исследованиях, впервые в графическом виде было реализовано представление данных. В настоящее время широко используются технологии обработки графической информации с помощью ПК. Широкое применение получила специальная область информатики, которая изучает методы и средства создания и обработки изображений с помощью программно-аппаратных вычислительных комплексов - компьютерная графика. Без нее трудно представить уже не только компьютерный, но и вполне материальный мир, так как визуализация данных применяется во многих сферах человеческой деятельности. Особенно интенсивно технология обработки графической информации с помощью компьютера стала развиваться в 80-х годах. Графическую информацию можно представлять в двух формах: аналоговой или дискретной.

Живописное полотно, цвет которого изменяется непрерывно - это пример аналогового представления, а изображение, напечатанное при помощи струйного принтера и состоящее из отдельных точек разного цвета - это дискретное представление. Путем разбиения графического изображения (дискретизации) происходит преобразование графической информации из аналоговой формы в дискретную. При этом производится кодирование - присвоение каждому элементу конкретного значения в форме кода. При кодировании изображения происходит его пространственная дискретизация. Ее можно сравнить с построением изображения из большого количества маленьких цветных фрагментов (метод мозаики). Все изображение разбивается на отдельные точки, каждому элементу ставится в соответствие код его цвета. При этом качество кодирования будет зависеть от следующих параметров: размера точки и количества используемых цветов. Чем меньше размер точки, а, значит, изображение составляется из большего количества точек, тем выше качество кодирования. Чем большее количество цветов используется (т. е. точка изображения может принимать больше возможных состояний), тем больше информации несет каждая точка, а, значит, увеличивается качество кодирования. Создание и хранение графических объектов возможно в нескольких видах - в виде векторного, фрактального или растрового изображения. Отдельным предметом считается 3D (трехмерная) графика, в которой сочетаются векторный и растровый способы формирования изображений. Она изучает методы и приемы построения объемных моделей объектов в виртуальном пространстве. Для каждого вида используется свой способ кодирования графической информации.

Во Франции в 19 веке возникло новое направление в живописи - пуантилизм. Его техника заключалась в том, что на холст рисунок наносился кистью в виде разноцветных точек. Также этот метод издавна применяется в полиграфии для кодирования графической информации. Точность передачи рисунка зависит от количества точек и их размера.

Качество изображения определяется разрешающей способностью монитора. Чем она выше, то есть больше количество строк растра и точек в строке, тем выше качество изображения. В современных ПК в основном используют следующие разрешающие способности экрана: 640 на 480, 800 на 600, 1024 на 768 и 1280 на 1024 точки. Так как яркость каждой точки и ее линейные координаты можно выразить с помощью целых чисел, то можно сказать, что этот метод кодирования позволяет использовать двоичный код для того чтобы обрабатывать графические данные.

Если говорить о черно-белых иллюстрациях, то, если не использовать полутона, то пиксель будет принимать одно из двух состояний: светится (белый) и не светится (черный). А так как информация о цвете пикселя называется кодом пикселя, то для его кодирования достаточно одного бита памяти: 0 - черный, 1 - белый. Если же рассматриваются иллюстрации в виде комбинации точек с 256 градациями серого цвета (а именно такие в настоящее время общеприняты), то достаточно восьмиразрядного двоичного числа для того чтобы закодировать яркость любой точки. В компьютерной графике чрезвычайно важен цвет. Он выступает как средство усиления зрительного впечатления и повышения информационной насыщенности изображения. Как формируется ощущение цвета человеческим мозгом? Это происходит в результате анализа светового потока, попадающего на сетчатку глаза от отражающих или излучающих объектов. Принято считать, что цветовые рецепторы человека, которые еще называют колбочками, подразделяются на три группы, причем каждая может воспринимать всего один цвет - красный, или зеленый, или синий.

Цветовые модели. Если говорить о кодировании цветных графических изображений, то нужно рассмотреть принцип декомпозиции произвольного цвета на основные составляющие. Применяют несколько систем кодирования: HSB, RGB и CMYK. Первая цветовая модель проста и интуитивно понятна, т. е. удобна для человека, вторая наиболее удобна для компьютера, а последняя модель CMYK-для типографий.

Модель HSB характеризуется тремя компонентами: оттенок цвета(Hue), насыщенность цвета (Saturation) и яркость цвета (Brightness). Можно получить большое количество произвольных цветов, регулируя эти компоненты. Эту цветовую модель лучше применять в тех графических редакторах, в которых изображения создают сами, а не обрабатывают уже готовые. Затем созданное свое произведение можно преобразовать в цветовую модель RGB, если ее планируется использовать в качестве экранной иллюстрации, или CMYK, если в качестве печатной, Значение цвета выбирается как вектор, выходящий из центра окружности. Направление вектора задается в угловых градусах и определяет цветовой оттенок. Насыщенность цвета определяется длиной вектора, а яркость цвета задается на отдельной оси, нулевая точка которой имеет черный цвет. Точка в центре соответствует белому (нейтральному) цвету, а точки по периметру - чистым цветам.

Принцип метода RGB заключается в следующем: известно, что любой цвет можно представить в виде комбинации трех цветов: красного (Red, R), зеленого (Green, G), синего (Blue, B). Другие цвета и их оттенки получаются за счет наличия или отсутствия этих составляющих. По первым буквам основных цветов система и получила свое название - RGB. Данная цветовая модель является аддитивной, то есть любой цвет можно получить сочетание основных цветов в различных пропорциях. При наложении одного компонента основного цвета на другой яркость суммарного излучения увеличивается. Если совместить все три компоненты, то получим ахроматический серый цвет, при увеличении яркости которого происходит приближение к белому цвету.

Системы счисления

Для записи информации о количестве объектов используются числа. Числа записываются с использованием особых знаковых систем, которые называются системами счисления. Алфавит системы счисления состоит из символов, которые называются цифрами.

Система счисления – это знаковая система, в которой числа записываются по определённым правилам с помощью цифр.

Все системы счисления делятся на две большие группы: позиционные и непозиционные.

Непозиционные системы счисления

Как только люди начали считать, у них появилась потребность в записи чисел. Находки археологов на стоянках первобытных людей свидетельствуют о том, что первоначально количество предметов отображали равным количеством каких-либо значков: зарубок, чёрточек, точек. Такая система записи чисел называется единичной, так как любое число в ней образуется путем повторения одного знака. Также люди стремились группировать отметки по 3, 5, 7, 10 штук. Такая группировка облегчала счёт. Люди учились считать не только единицами, но и тройками, пятерками и пр.

Первым вычислительным инструментом у человека были пальцы, поэтому и счёт чаще всего вели группами по 5 или по 10 предметов.

В дальнейшем своё название получили десяток десятков (сотня), десяток сотен (тысяча) и так далее. Такие узловые числа для удобства записи стали обозначать особыми значками — цифрами. Если при подсчёте предметов их оказывалось 2 сотни, 5 десятков и ещё 4 предмета, то при записи этой величины дважды повторяли знак сотни, пять раз – знак десятков и четыре раза знак единицы.

В таких системах счисления от положения знака в записи числа не зависит величина, которую он обозначает, поэтому они называются непозиционными системами счисления. Непозиционными системами пользовались древние египтяне, греки, римляне и некоторые другие народы древности.

Непозиционные системы счисления - это системы счисления, где величина числа не зависит от места позиции цифры.

До нас дошла римская система записи чисел (римские цифры), которая в некоторых случаях применяется в нумерации (века, тома в собрании сочинений, главы книги).

В основе римской системы счисления лежат знаки I (один палец) для числа 1, V (раскрытая ладонь) для числа 5, X (две сложенные ладони) для числа 10, а для обозначения чисел 100, 500 и 1000 используются латинские буквы С, D и М (рис.87).

Рисунок 6. Примеры

В римской системе счисления количественное значение цифры не зависит от её положения в числе. Например, в римском числе XXX (30) цифра X встречается трижды и в каждом случае обозначает одну и ту же величину — число 10, три раза по 10 в сумме дают 30.

Чтобы записать число в римской СС, необходимо разложить его на сумму тысяч, полутысяч, сотен, полусотен, десятков, пятков, единиц. Например, десятичное число 28 представляется следующим образом:

XXVIII =10+10 + 5 + 1 + 1 + 1 (два десятка, пяток, три единицы).

При записи чисел в римской системе счисления применяется правило: каждый меньший знак, поставленный слева от большего, вычитается из него, в остальных случаях знаки складываются.

Например, римское число IX обозначает 9 (-1 + 10), а XI обозначает 11 (10 + 1). Число 99 имеет следующее представление в римской системе счисления:

XCIX = -10 + 100 - 1 + 10.

На Руси вплоть до XVIII века использовалась непозиционная система славянских цифр. Буквы кириллицы (славянского алфавита) имели цифровое значение, если над ними ставился специальный знак - титло. Например А — 1, Д — 4, Р — 100.

Тысячи обозначались теми же буквами с «титлами», что и первые девять цифр, но слева внизу у них ставился специальный знак, например:

Непозиционные системы счисления были более или менее пригодны для выполнения сложения и вычитания, но совсем неудобны при умножении и делении.

Позиционные системы

Позиционные системы счисления - это системы счисления, где величина числа зависит от места позиции цифры. Позиция цифры в числе называется разрядом.

Количество используемых цифр называется основанием позиционной СС. Разряды числа возрастают справа налево, от младших разрядов к старшим. За основание позиционной системы счисления можно принять любое натуральное число, большее 1.

Система счисления, применяемая в современной математике, является позиционной десятичной системой. Её основание равно десяти, так как запись любых чисел производится с помощью десяти цифр:

0, 1, 2, 3, 4, 5, 6, 7, 8, 9.

Хотя десятичную систему принято называть арабской, но зародилась она в Индии в V веке. В Европе об этой системе узнали в XII веке из арабских научных трактатов, которые были переведены на латынь. Этим и объясняется название «арабские цифры». Однако широкое распространение в науке и в обиходе десятичная позиционная система получила только в XVI веке. Эта система позволяет легко выполнять любые арифметические вычисления, записывать числа любой величины. Распространение арабской системы дало мощный толчок развитию математики.

Рассмотрим в качестве примера десятичное число 555. Цифра 5 встречается в числе трижды, причем самая правая обозначает пять единиц, вторая справа — пять десятков и, наконец, третья – пять сотен.

Число 555 было записано в свёрнутой форме. В развёрнутой форме запись числа будет выглядеть следующим образом:

555₁₀ = 5*10² + 5*10¹ + 5*10°.

Для записи десятичных дробей используются разряды с отрицательными значениями степеней основания. Например, число 555,55 в развёрнутой форме будет записываться следующим образом:

555,55₁₀ = 5*10² + 5*10¹ + 5*10°+ 5*10^-1 + 5*10^-2

Числа в двоичной системе в развёрнутой форме записываются в виде суммы ряда степеней основания 2 с коэффициентами, в качестве которых выступают цифры 0 или 1.

Первая позиционная система счисления была придумана ещё в древнем Вавилоне, причем вавилонская нумерация была шестидесятеричной, т. е. в ней использовалось шестьдесят цифр! Интересно, что до сих пор при измерении времени мы используем основание 60 (1 минута = 60 секунд, 1 час = 60 минут).

В XIX веке довольно широкое распространение получила двенадцатеричная СС. До сих пор мы часто употребляем дюжину (число 12): в сутках две дюжины часов, круг содержит тридцать дюжин градусов и т. д.

В информатике широко используются восьмеричная и шестнадцатеричная системы счисления. В восьмеричной системе основание равно 8 и алфавит состоит из восьми цифр {0, 1, 2, 3, 4, 5, 6, 7}.

Запишем восьмеричное число 77 в свёрнутой и развёрнутой формах и переведём его в десятичную систему счисления:

77₈ = 7*8¹ + 7*8° = 6310.

В шестнадцатеричной системе основание равно 16 и алфавит состоит из шестнадцати цифр {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, А, В, С, D, Е, F}, причем первые десять цифр имеют общепринятое обозначение, а для записи остальных цифр {10, 11, 12, 13, 14, 15} используются первые шесть букв латинского алфавита. Запишем шестнадцатеричное число в свёрнутой и развёрнутой формах и переведём его в десятичную систему счисления:

ABCDEF₁₆ = А*16⁵ + В*16⁴ + C*16³ + D*16² + Е*16¹ + F*16° = 10*165+ 11*164 + 12*163 + 13*162+ 14*161+ 15*16° = 11 259 37510.

Вот примеры алфавитов нескольких систем

Основание системы, к которой относится число, обозначается подстрочным индексом к этому числу.

101101₂, 3671₈, 3B8F₁₆.

Предыдущая 123 4 5 6 7 8 9 10 11 12 13 14 15 16 Следующая

Воспользуйтесь поиском по сайту: