Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Кодирование и декодирование текстовой информации.

Кодирование и обработка текстовой информации

1.1.1. Кодирование текстовой информации

Информация, выраженная с помощью естественных и формальных языков в письменной форме, обычно называет­ся текстовой информацией. Начиная с конца 60-х годов про­шлого века, компьютеры все больше стали использоваться для обработки текстовой информации.

Кодирование и декодирование текстовой информации.

Для кодирования прописных и строчных букв русского и латинского алфавитов, цифр и ряда специальных знаков (знаки арифметических операций, знаки препинания и пр.) достаточно использовать 256 различных символов. По фор­муле, связывающей количество сообщений N и количество информации /, можно вычислить, какое количество инфор­мации необходимо, чтобы закодировать каждый знак:

N = 21 => 256 = 21 => 28 = 27 => / = 8 битов = 1 байт.

Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертанию, а компьютер — по их коду.

При вводе в компьютер текстовой информации происхо­дит ее двоичное кодирование, изображение символа преоб­разуется в его двоичный код. Пользователь нажимает на клавиатуре клавишу с символом, и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код символа). Код символа хранится в оперативной памяти компьютера, где занимает одну ячейку.

В процессе вывода символа на экран компьютера произ­водится обратный процесс — декодирование, т. е. преобразо­вание кода символа в его изображение.

Кодировки русского алфавита. Важно, что присваивание символу конкретного кода — это вопрос соглашения, кото­рое фиксируется в кодовой таблице. Первые 33 кода (с 0 по 32) этой таблицы соответствуют не символам, а операциям (перевод строки, ввод пробела и т. д.).Коды с 33 по 127 являются интернациональными и соот­ветствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.

Коды с 128 по 255 являются национальными, т. е. в на­циональных кодировках одному и тому же коду соответству­ют различные символы. Существуют пять однобайтовых ко­довых таблиц для русских букв (Windows, MS-DOS, КОИ-8, Mac, ISO), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.

 

 

В настоящее время широкое распространение получил новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, и потому с его помо­щью можно закодировать не 256 символов, а N = 2 =65 536 различных символов. Такого количества символов достаточ­но, чтобы закодировать не только русский и латинский ал­фавиты, цифры, знаки и математические символы, но и гре­ческий, арабский, иврит и другие алфавиты.

Практическая работа 2.1.

Кодирование текстовой Информатика и ИКТ-9

информации


Контрольные вопросы

1. Почему для кодирования текстовой информации в компьютере перешли от однобайтовых кодировок к двухбайтовой кодировке?

Практическая работа 1.1 Кодировки русских букв

Задание. В Web-редакторе Компоновщик, входящем в интегрированное приложение для работы в Интернете Sea-Monkey, создать Web-страницы, содержащие слово «инфор­матика» в пяти различных кодировках: Windows, MS-DOS, КОИ-8, ISO и Unicode. Просмотреть их в браузере в нужной кодировке.

Варианты выполнения работы:

• создание Web-страниц с другим содержанием;

• просмотр Web-страниц в различных браузерах (Internet
Explorer, SeaMonkey или др.).

Создание Web-страниц в пяти различных кодировках:

Windows, MS-DOS, КОИ-8, ISO и Unicode

1. В операционной системе Windows или Linux запустить интегрированное приложение для работы в Интернете SeaMonkey и ввести команду [Окно-Компоновщик}.

2. В появившемся окне Компоновщика ввести слово «инфор­матика» и название кодировки (например, Windows).



 


 

3. Ввести команду [Файл-Изменитъ и сохранить кодировку]. В появившемся диалоговом окне выбрать из списка нуж­ную кодировку (в данном случае Кириллица (Windows 1251)).

В текстовом поле ввести название для страницы (в дан­ном случае СР1251). Щелкнуть по кнопке ОК.



 


4. Аналогично создать страницы в кодировках MS-DOS, КОИ-8, ISO и Unicode.

Просмотр пяти Web-страниц в различных кодировках Windows, MS-DOS, КОИ-8, ISO и Unicode в браузере

L. В операционной системе Windows последовательно от­крыть в браузере пять Web-страниц в различных коди­ровках Windows, MS-DOS, КОИ-8, ISO и Unicode. Для каждой страницы установить нужную кодировку командой [Страница-Кодировка]. Осуществить просмотр Web-страниц.

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...