Кодирование и декодирование текстовой информации.
Кодирование и обработка текстовой информации 1.1.1. Кодирование текстовой информации Информация, выраженная с помощью естественных и формальных языков в письменной форме, обычно называется текстовой информацией. Начиная с конца 60-х годов прошлого века, компьютеры все больше стали использоваться для обработки текстовой информации. Кодирование и декодирование текстовой информации. Для кодирования прописных и строчных букв русского и латинского алфавитов, цифр и ряда специальных знаков (знаки арифметических операций, знаки препинания и пр.) достаточно использовать 256 различных символов. По формуле, связывающей количество сообщений N и количество информации /, можно вычислить, какое количество информации необходимо, чтобы закодировать каждый знак: N = 21 => 256 = 21 => 28 = 27 => / = 8 битов = 1 байт. Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертанию, а компьютер — по их коду. При вводе в компьютер текстовой информации происходит ее двоичное кодирование, изображение символа преобразуется в его двоичный код. Пользователь нажимает на клавиатуре клавишу с символом, и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код символа). Код символа хранится в оперативной памяти компьютера, где занимает одну ячейку. В процессе вывода символа на экран компьютера производится обратный процесс — декодирование, т. е. преобразование кода символа в его изображение. Кодировки русского алфавита. Важно, что присваивание символу конкретного кода — это вопрос соглашения, которое фиксируется в кодовой таблице. Первые 33 кода (с 0 по 32) этой таблицы соответствуют не символам, а операциям (перевод строки, ввод пробела и т. д.).Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.
Коды с 128 по 255 являются национальными, т. е. в национальных кодировках одному и тому же коду соответствуют различные символы. Существуют пять однобайтовых кодовых таблиц для русских букв (Windows, MS-DOS, КОИ-8, Mac, ISO), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.
В настоящее время широкое распространение получил новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, и потому с его помощью можно закодировать не 256 символов, а N = 2 =65 536 различных символов. Такого количества символов достаточно, чтобы закодировать не только русский и латинский алфавиты, цифры, знаки и математические символы, но и греческий, арабский, иврит и другие алфавиты. Практическая работа 2.1. Кодирование текстовой Информатика и ИКТ-9 информации Контрольные вопросы 1. Почему для кодирования текстовой информации в компьютере перешли от однобайтовых кодировок к двухбайтовой кодировке? Практическая работа 1.1 Кодировки русских букв Задание. В Web-редакторе Компоновщик, входящем в интегрированное приложение для работы в Интернете Sea-Monkey, создать Web-страницы, содержащие слово «информатика» в пяти различных кодировках: Windows, MS-DOS, КОИ-8, ISO и Unicode. Просмотреть их в браузере в нужной кодировке. Варианты выполнения работы: • создание Web-страниц с другим содержанием; • просмотр Web-страниц в различных браузерах (Internet Создание Web-страниц в пяти различных кодировках: Windows, MS-DOS, КОИ-8, ISO и Unicode
1. В операционной системе Windows или Linux запустить интегрированное приложение для работы в Интернете SeaMonkey и ввести команду [Окно-Компоновщик}. 2. В появившемся окне Компоновщика ввести слово «информатика» и название кодировки (например, Windows).
3. Ввести команду [Файл-Изменитъ и сохранить кодировку]. В появившемся диалоговом окне выбрать из списка нужную кодировку (в данном случае Кириллица (Windows 1251)). В текстовом поле ввести название для страницы (в данном случае СР1251). Щелкнуть по кнопке ОК.
4. Аналогично создать страницы в кодировках MS-DOS, КОИ-8, ISO и Unicode. Просмотр пяти Web-страниц в различных кодировках Windows, MS-DOS, КОИ-8, ISO и Unicode в браузере L. В операционной системе Windows последовательно открыть в браузере пять Web-страниц в различных кодировках Windows, MS-DOS, КОИ-8, ISO и Unicode. Для каждой страницы установить нужную кодировку командой [Страница-Кодировка]. Осуществить просмотр Web-страниц.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|