Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Кодирование русского текста




В первых ЭВМ для кодирования текста было отведено 7 бит (128 символов). Этого количества вполне хватило для кодирования всех строчных и прописных букв латинского алфавита, 10 цифр и некоторых знаков. Такая кодированная таблица называется ASCII — американский стандартный код для обмена информацией. Когда появилась необходимость кодировать национальный алфавит, то этот код ASCII (ASC-код) был расширен до 8 бит. Т.о., в кодовой таблице символы располагались в следующем виде:

0-31 — служебные символы

32-128 — латинский алфавит

Остальные — национальный алфавит.

Такой ASC-код называли расширенным.

Основные кодировки для русских букв:

MS DOS (CP 866) используются в ОС MS DOS для IBM-совместимых компьютеров.

MS Windows (1251) — используются в ОС MS Windows

ISO 8859-5 данная кодировка используется в ОС UNIX. Принята международной организацией стандартизации и имеет 10 расширений кодовой таблицы. ISO 8859-5 поддерживает кириллический алфавит. Стандартизация данной кодировки является важнейшим моментом при разработке системы передачи, обработки и хранении информации. Поэтому данная кодировка получила широкое распространение в программных продуктах, в устройствах ввода и отображения информации крупных производителей программного обеспечения и вычислительной техники. Кроме того, кодировка широко используется в основных международных и индустриальных стандартах средств обработки и передачи информации.

Koi 8-R — (называется сетевая кодировка русских букв) получила распространение с развитием сетевых технологий. Часто происходило, что материал, отправленный по электронной почте, обрабатывался программой, которая работала 7-битной кодировкой. В этом случае происходило обнуление 8 бита. Поэтому необходимо было повысить устойчивость текстовой информации к такого рода преобразованиям. Для этого русские буквы расположили на местах фонетических аналогов английских букв. В таком случае, если программа обнуляла 8 бит, текст можно было прочитать.

Сегодня все большее число программ поддерживают стандарт Unicode. С помощью него можно закодировать практически все языки мира. Для кодировки информации отводится 2 байта (65 535 символов).

 

СЖАТИЕ ДАННЫХ

Сжатие данных необходимо для удешевления хранения информации. Особенность большинства данных — избыточность. Под этим понятием понимаются разные значения: в теории лингвистики под избыточностью понимается количество слов, которое можно выбросить без ущерба для смысла, в теории информации — количество случайно удаленных букв, при котором возможно однозначное восстановление информации. Избыточность зависит от: Национальных особенностей языка Типа данных (наиболее избыточны видеоданные, графические данные, текст).

Сжатие — избавление от избыточности. Применительно к документам используется словоархивация, а к программам — архиваторы. Сжатию могут подвергаться файлы, папки, диски. 3 способа архивации:Изменение содержания Изменение структуры данных И то и другое

Если при сжатии происходит изменение содержания, то при восстановлении полного восстановления не происходит. Такой метод применяется для данных, для которых формальная потеря части информации не приводит к снижению его потребительских свойств (видеоданные, аудиоданные, графика). Такой метод применим к текстовому материалу. Характерные форматы сжатия для различных типов данных: МР3, MPEG, JPEG.

Архиваторы, кроме простого сжатия файлов, способны извлекать файлы из архива, создавать новые архивы, добавлять файлы в уже созданные архивы, создавать самораспаковывающиеся и распределенные архивы, восстанавливать поврежденные архивы, защищать архивы от просмотра и несанкционированной модификации, извлекать файлы, не распаковывая архив и др.

 

24. Самораспаковывающиеся архивы — при передаче архивированного файла предполагается наличие архиватора. Если таких средств нет, то создается самораспаковывающийся архив. Он создается на базе обычного архива с присоединением к нему программного модуля. Сам архив имеет расширение ЕХЕ, характерное для изменяемых файлов. Желательно проверить его.

Самораспределенные архивы. Иногда файл в архивированном виде имеет большой размер (больше, чем носитель информации — дискета), т.е. возможность разбить файл на несколько фрагментов, указав размер для каждого файла.

Защита архивов осуществляется заданием пароля. Просмотр архивного файла без его распаковки необходим для обеспечения безопасности при работе с незнакомыми файлами или файлами, полученными через Интернет.

Сжимать можно не только файлы, папки, но и диски.

При уплотнении дисков на физическом диске создается скрытый файл, предназначенный для записи сжатых данных. Этот файл называется файлом сжатого тома, а физический диск, на котором он размещен, называется несущим. Если файл сжатого тома занимает часть несущего диска, то несущий диск становится скрытым, а файл сжатого тома распознается как уплотненный.

 

СЛУЖЕБНЫЕ ПРОГРАММЫ Windows

Проверка диска. Проверяет правильность информации, которая содержится в файловой системе (стандартная проверка), а также осуществляет поиск поврежденных секторов (полная проверка).

Дефрагментация диска. При копировании, удалении или перемещении файлов на диске возникают пустые места, которые заполняются фрагментами других файлов. Если файл разбит на несколько фрагментов, скорость доступа к нему уменьшается, так как на перемещение головок для считывания отдельных фрагментов необходимо больше времени, чем на считывание одного элемента. Дефрагментация состоит в том, чтобы собрать все фрагменты в одно место.

 

КОМПЬЮТЕРНЫЕ ВИРУСЫ

Вирус — программа, обладающая способностью к самовоспроизведению. Он характеризуется: внедрением инфекции в объекты, влиянием на них, диагностикой и лечением.

Назначение вирусов: Вывод из строя ОС и получение скрытых сведений на основе обработки соответствующих событий (нажатие клавиш). Нарушение целостности информации и ее уничтожение.

Классификация вирусов: Среда обитания: Сетевые Файловые (внедряются в используемые файлы:.com,.exe) Загрузочные (внедряются в используемую область диска). Способ заражения: Резидентные (при заражении оставляют в памяти свою резидентную часть, которая перехватывает обращение ОС к объектам). Они находятся в памяти и являются активными до выключения или перезагрузки компьютера. Нерезидентные (не заражают память и являются активными ограниченное время). По степени воздействия: Безвредные (не влияют на работу компьютера, кроме уменьшения свободной памяти на диске). Неопасные (уменьшают объем оперативной памяти и память на дисках. Их действие проявляется в звуковых и видеоэффектах). Опасные (приводят к нарушениям в работе компьютера). Очень опасные (приводят к потере программ, уничтожению данных, стиранию информации в системных областях диска). По особенностям алгоритма: Компаньоны (алгоритм работы состоит в том, что они создаются для.ехе-файлов, файлы-спутники которых имеют расширение.com. При запуске такого файла через командную строку без указания расширения файла первым запускается.com-файл). Простейшие — изменяют содержание файлов и секторов, могут быть легко обнаружены и уничтожены. Репликаторы — черви —распространяются по компьютерным сетям, вычисляют адреса сетевых компьютеров и записывают по этим адресам свои копии. Невидимки (Stels-вирусы) трудно обнаружить и обезвредить, так как они перехватывают обращения ОС к файлам и секторам диска и подставляют вместо своего тела незараженные участки диска. Мутанты — их трудно обнаружить, так как они содержат алгоритм, благодаря которому копии одного и того же вируса не имеют ни одной повторяющейся цепочки байтов. Троянские — не способны к самораспространению, но очень опасны, так как, маскируясь под полезную программу, разрушают загрузочный сектор и файловую систему. Макровирусы используют возможности макроязыка, встроенного в системы обработки данных.

Основными путями проникновения вирусов являются носители информации и компьютерные сети.

Признаки появления вирусов: прекращение работы или неправильная работа ранее успешно функционирующих программ медленная работа компьютера невозможность загрузки ОП исчезновение файлов или каталогов и искажение содержимого изменение даты и времени модификации файлов изменение размеров файлов значительное увеличение файлов на диске уменьшение свободного места уменьшение размеров объема оперативной памяти вывод на экран непредусмотренных сообщений и изображений частое зависание компьютера и сбои в работе и т.д.

 

АНТИВИРУСНЫЕ ПРОГРАММЫ

Программы-детекторы осуществляют поиск характерной для конкретного вируса сигнатуры (последовательности байтов) в операционной памяти, файлах, при обнаружении выдается сообщение. Недостаток — программа находит только известные вирусы.

Программы-вакцины не только находят, но и лечат, удаляют вирусы. Наиболее распространен класс программ Касперский

Программы-ревизоры — самое надежное средство защиты от вирусов. Программа запоминает исходное состояние программ, каталогов (когда они незаражены) и периодически сравнивает с исходным.

Программы-фильтры предназначены для обнаружения подозрительных действий, например, изменение файлов с разрешением.ехе., com. При обнаружении пользователю сообщается, что меняется такой-то файл. Недостаток — назойливость.

Программы-иммунизаторы модифицируют файлы, диски таким образом, что вирус воспринимает их, как зараженные участки.

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...