Лекция 8.4. Глобальная компьютерная сеть Интернет
План 1. Понятие и функции Интернета. 2. Протоколы взаимодействия компьютеров в сети. 3. Понятие и структура IP-адреса. Понятие доменного имени. 4. Службы Интернета 5. Поиск информации в сети Интернет.
Вопрос 1. Понятие и функции Интернета.
Интернет представляет собой объединение разнообразных компьютерных сетей (глобальных, региональных, локальных), соединенных между собой каналами связи. Основными функциями сети Интернет являются: информационная, коммуникационная, совещательная, коммерческая, развлекательная. Основой для организации сети Интернет явилась компьютерная сеть министерства обороны США АRPANet: (АRРА — Advanced Research Projects Agency), созданная в начале 70-х годов для связи компьютеров научных и военных учреждений, предприятий оборонной промышленности. Сеть строилась при участии Пентагона как устойчивая к внешним воздействиям закрытая инфраструктура, способная выжить в условиях ядерного нападения, то есть огромное внимание уделялось ее надежности. В настоящее время основными клиентами Интернет являются частные лица и негосударственные компьютерные сети. Сеть обеспечивает обмен информацией между всеми компьютерами, которые входят в состав сетей, подключенных к ней. Основу ее составляют высокоскоростные магистральные сети. К магистральной сети через точки сетевого доступа МАР (Network Access Point) подсоединяются автономные системы, которые имеют свое административное управление, свои внутренние протоколы маршрутизации. Основные структурные ячейки Интернета — это локальные вычислительные сети. Но существуют и локальные компьютеры, самостоятельно подключенные к Интернету. Каждый подключенный к сети компьютер обладает своим сетевым адресом, по которому его можно найти.
Важный параметр Интернета — скорость доступа к сети, которая определяется пропускной способностью каналов связи между автономными системами, внутри автономных систем и абонентских каналов доступа к автономным" системам. Сеть имеет архитектуру клиент-сервер, то есть имеются компьютеры, в основном получающие информацию из сети, — клиенты, а есть компьютеры, снабжающие клиентов информацией, — серверы.
Вопрос 2. Протоколы взаимодействия компьютеров в сети.
Как и во всякой другой сети, в Интернет существует 7 уровней взаимодействия между компьютерами: физический, логический, сетевой, транспортный, уровень сеансов связи, представительский и прикладной. Каждому уровню взаимодействия соответствует свой набор протоколов (т. е. правил взаимодействия): Протоколы физического уровня определяют вид и характеристики линий связи между компьютерами. Для каждого типа линий связи разработан соответствующий протокол логического уровня, занимающийся управлением передачи информации по каналу. Протоколы сетевого уровня отвечают за передачу данных между устройствами в разных сетях, т. е. занимаются маршрутизацией пакетов в сети. К протоколам сетевого уровня принадлежат IP (Internet Protocol) и ARP (Address Resolution Protocol). Протоколы транспортного уровня управляют передачей данных из одной программы в другую. К протоколам транспортного уровня принадлежат TCP (Transmission Control Protocol) и UDP (User Datagram Protocol). Протоколы уровня сеансов связи отвечают за установку, поддержание и уничтожение соответствующих каналов. В Интернет этим занимаются уже упомянутые протоколы TCP и UDP, а также протокол UUCP (Unix to Unix Copy Protocol). Протоколы представительского уровня занимаются обслуживанием прикладных программ. К таким протоколам принадлежат запускаемые, к примеру, на Unix-сервере протоколы, предоставляющие различные услуги абонентам. К ним относятся также протоколы: Telnet, FTP, Gopher, NFS, NNTP (Net News Transfer Protocol), SMTP (Simple Mail Transfer Protocol), POP2 и POP3 (Post Office Protocol) и т. д.
К протоколам прикладного уровня относятся сетевые службы и программы их предоставления. Представление о взаимодействии протоколов различного уровня дает рис. 1. Рис. 1. Взаимодействие протоколов в Интернет
Вопрос 3. Понятие и структура IP-адреса. Понятие доменного имени.
Адреса компьютеров, подключенных к сети, должны соответствовать особым требованиям. Адрес должен иметь формат, позволяющий выполнять его синтаксическую автоматическую обработку, и должен нести некоторую информацию об адресуемом объекте. Поэтому адреса компьютеров в сети могут иметь двойную кодировку: * обязательную кодировку, удобную для работы системы телекоммуникации в сети; * необязательную кодировку, удобную для абонента сети. Цифровой IР-адрес представляет собой 32-разрядное двоичное число. Он разделяется на четыре блока по 8 бит, которые можно записать в десятичном виде, и содержит полную информацию, необходимую для идентификации компьютера. В десятичном коде IР-адрес имеет вид: 152.37.72.138. 1Р-адрес состоит из двух частей: адреса сети (идентификатора сети, Network ID) и адреса хоста (идентификатора хоста, Ноst ID) в этой сети. IР-адреса выделяются в зависимости от размера организации и типа ее деятельности. Для обеспечения максимальной гибкости 1Р-адреса выделяются в зависимости от количества сетей и компьютеров в организации и разделяются на классы А, В и С. Еще существуют классы В и Е, но они используются для специфических служебных целей. Три класса 1Р-адресов позволяют распределять их в зависимости от размера сети организации. В сети класса А адрес определяется первым октетом 1Р-адреса (слева направо). Значение первого октета, находящееся в пределах 1-126, зарезервировано для гигантских транснациональных корпораций. В мире может существовать всего лишь 126 сетей класса А, каждая из которых может содержать почти 17 млн компьютеров. Класс В использует два первых октета в качестве адреса сети, а значение первого октета может быть в пределах 128-191. В сети класса В может быть около 65 тыс. компьютеров, такие сети имеют крупнейшие университеты и другие большие организации.
В классе С под адрес сети отводится уже три первых октета, а значения первого октета могут быть в пределах 192-223. Это самые распространенные сети, их число может превышать 2 млн, а число компьютеров в каждой сети — до 254. Если любой 1Р-адрес символически обозначить как набор октетов w.х.у.z, то структуру для сетей различных классов можно представить (табл. 1) в следующем виде. Таблица 1 Структура IР-адресов в сетях различных классов
Всякий раз, когда посылается сообщение какому-либо компьютеру в Интернет, IР-адрес используется для указания адреса отправителя и получателя. Доменный адрес состоит из нескольких отделяемых друг от друга точкой буквенно-цифровых доменов (domain — область). Этот адрес построен на основе иерархической классификации: каждый домен определяет целую группу компьютеров, выделенных по какому-либо признаку, при этом домен группы, находящейся слева, является подгруппой правого домена. Например, географические двухбуквенные домены некоторых стран: · Россия — ru; · США-us; · Великобритания — uk. Существуют и домены, выделенные по тематическим признакам: · правительственные учреждения —gov; · коммерческие организации — соm; · учебные заведения - edu; · сетевые организации — net. Доменный адрес имеет произвольную длину, и, в отличие от цифрового адреса, он читается в обратном порядке. Так как преобразование доменного адреса в соответствующий ему цифровой IР-адрес осуществляют специальные серверы DNS (Domain Name Server) — серверы имен, то пользователю нет необходимости знать цифровые адреса.
Вопрос 4. Службы Интернета
Служба — это пара программ, взаимодействующих между собой согласно определенным правилам, протоколам. Одна из программ этой пары называется сервером, а вторая — клиентом. При работе служб Интернета происходит взаимодействие серверного клиентского оборудования и программного обеспечения.
Электронная почта (Е-Маil) является одной из наиболее ранних, служб Интернета. Ее обеспечением занимаются специальные почтовые серверы. Они получают сообщения от клиентов и пересылают их по цепочке к почтовым серверам адресатов, где эти сообщения накапливаются. При установлении соединения между адресатом и его почтовым сервером происходит автоматическая передача поступивших сообщений на компьютер адресата. Почтовая служба использует два прикладных протокола: SМТР и РОРЗ. Первый определяет порядок отправки корреспонденции с компьютера на сервер, а второй — порядок приема поступивших сообщений. Списки рассылки (Mailing List) — это специальные тематические серверы, собирающие информацию по определенным темам и переправляющие ее подписчикам в виде сообщений электронной почты. Служба телеконференций (Usenet). Служба телеконференций похожа на циркулярную рассылку электронной почты, но одно сообщение может быть отправлено большой группе корреспондентов (такие группы называются телеконференциями или группами новостей). Обычное сообщение электронной почты пересылается по узкой цепочке серверов от отправителя к получателю. При этом не предполагается его хранение на промежуточных серверах. Сообщения, направленные на сервер группы новостей, отправляются с него на все серверы, с которыми он связан, если на них данного сообщения еще нет. Далее процесс повторяется Служба World Wide Web (WWW). Это самая популярная служба современной сети Интернет. Основу службы WWW составляют три технологии: гипертекст, язык разметки гипертекста — НТМL (Hypertext Markup Language), универсальный адрес ресурса. Гипертекст — это организация текстовой информации, при которой текст представляет собой множество фрагментов с явно указанными ассоциативными связями между этими фрагментами. Основная идея гипертекстовых технологий заключается в том, что поиск документальной информации происходит с учетом множества взаимосвязей, имеющихся между документами, а значит более эффективно, чем при традиционных методах поиска. Доступ к информации осуществляется не путем последовательного просмотра текста, как в обычных информационно-поисковых системах, а путем движения от одного фрагмента к другому. Универсальный адрес ресурса —URL (Universal Resource Locator) дополнительно к доменному адресу содержит указания на используемую технологию доступа к ресурсам и спецификацию ресурса внутри файловой структуры компьютера. Например, в URL http://www.tsure.ru/University/Faculties/index.htm указаны:
· http— протокол передачи гипертекста, используемый для доступа. В подавляющем большинстве случаев в WWW используется именно гипертекстовый протокол. При доступе по другому протоколу, например через службы FТР или Gopher, указываются соответственно ftp:// или gopher://; · www.tsure.ru — доменный адрес веб-сервера университета. Адреса большей части серверов начинаются с префикса www, указывающего на то, что веб-сервер на данном компьютере запущен; · University/Faculties/index.htm — спецификация файла index.htm.
Указывается путь к интересующему нас файлу в файловой системе компьютера и имя этого файла. В этой части адреса может быть помещена и другая информация, отражающая, например, параметры запроса пользователя и обрабатывающей запрос программы. Если спецификация файла не указана, то пользователю буден выдан файл, по умолчанию назначенный для представления сервера (сайта). Служба передачи файлов (FТР). Необходимость в передаче файлов возникает при приеме файлов программ, при пересылке крупных документов, а также при передаче больших по объему архивных файлов. Протокол FТР работает одновременно с двумя соединениями между сервером и клиентом. По одному соединению идет передача данных, а второе соединение используется как управляющее. IР-телефония. Технология, позволяющая использовать Интернет или любую другую IР-сетъ в качестве средства организации и ведения телефонных разговоров и передачи факсов в режиме реального времени. Существует возможность оцифровать звук или факсимильное сообщение и переслать его так, как пересылаются цифровые данные. И в этом смысле IР-телефония использует Интернет для пересылки голосовых или факсимильных сообщений между двумя пользователями в режиме реального времени. Общий принцип действия телефонных серверов IР-телефонии заключается в следующем: с одной стороны, сервер связан с телефонными линиями и может соединиться с любым телефоном мира, с другой стороны, сервер связан с Интернетом и может связаться с любым компьютером в мире. Сервер получает стандартный телефонный сигнал, оцифровывает его, сжимает, разбивает на пакеты и отправляет через Интернет по назначению с использованием протокола ТСР/IР. Для пакетов, приходящих из Сети на телёфонный сервер и уходящих в телефонную линию, операция происходит в обратном порядке. Для того чтобы осуществить связь с помощью телефонных серверов, организа-1ия или оператор услуги должны иметь серверы в тех местах, куда и откуда планируются звонки. Стоимость IР-связи на порядок меньше стоимости телефонного звонка по обычным телефонным линиям.
Вопрос 5. Поиск информации в сети Интернет. В настоящее время для поиска информации в Интернете наиболее широко используется служба WWW. В качестве основных источников информационных ресурсов WWW могут рассматриваться: • информационные агентства; • средства массовой информации; • специализированные базы данных; • Web-сайты юридических и физических лиц. По некоторым данным в настоящее время общее число документов, размещенных в WWW, превышает миллиард. Такое обилие документов порождает проблему поиска. Очевидно, что сам факт использования при создании WWW протокола HTTP обусловливает три способа поиска необходимой информации во «всемирной паутине». Поиск по адресу. Данный вид поиска применяется в тех случаях, когда пользователю известен адрес Web-сайта, содержащего необходимую ему информацию. Форма адреса (IP, доменный или URL) в этом случае значения не имеет. Поиск по гиперссылкам. В этом случае пользователь осуществляет поиск необходимой информации, пользуясь гиперссылками, размещенными на том или ином Web-сайте. Поиск с помощью поисковых серверов. Такая возможность обеспечивается наличием в Интернете поисковых серверов. Поисковыми серверами называют выделенные хост-компьютеры, в которых размещаются базы данных ресурсов Интернет. Достаточно передать такому серверу фразу или набор ключевых слов, описывающих тему, интересующую пользователя, и сервер возвратит список ресурсов, соответствующих данному запросу. Рассмотрим подробнее особенности различных поисковых серверов. Каталоги — иерархические базы данных о документах сети, пополнение которых осуществляется человеком. Основной характеристикой каталогов является объем базы данных, т. е. количество представленных в ней документов. Для глобальных каталогов эта величина не превышает 5 млн документов, что составляет около 0,5 % общего пространства WWW. Поэтому использование каталогов не может дать результатов, обладающих высокой полнотой. По сравнению с поисковыми машинами скорость наполнения баз данных каталогов достаточно мала, поскольку их пополнение происходит вручную. Однако это может рассматриваться и как преимущество поисковых систем данного типа, поскольку ручной отбор позволяет повысить точность поиска. В качестве второй характеристики каталогов следует выделить количество категорий или рубрик в них. Естественно, чем выше это значение, тем большей точностью характеризуются результаты поиска. Для глобальных каталогов это значение в настоящее время составляет несколько десятков тысяч. Поисковые машины — иерархические базы данных о документах сети, пополнение которых осуществляется специальными программами. Поисковые машины устроены гораздо сложнее каталогов. В структуре поисковой машины выделяют обычно три составляющие: • специальную программу, осуществляющую сканирование Сети, именуемую поисковым роботом; • базу данных документов, называемую индексом; • интерфейсную часть, предназначенную для взаимодействия с пользователем., Поисковый робот осуществляет просмотр Сети с целью выявления новых документов для включения их в базу данных поисковой машины — индекс. Процесс занесения информации о документе в индекс называется индексированием. Чтобы понять, каким образом робот осуществляет отбор документов для анализа, достаточно вспомнить, что большинство опубликованных Web-страниц содержат гиперссылки на другие объекты. Наличие гиперссылок позволяет роботу автоматически формировать очередь документов. В процессе занесения документов в индекс поисковая машина составляет список слов документа, которые являются ключевыми. Каждая поисковая машина имеет свои алгоритмы индексирования и форматы индексных файлов, составляющих базу данных. Следует отметить, что совершенствование методов поиска информации в Интернет привело к созданию нового инструмента — метапоисковых систем. Такие системы не имеют собственных поисковых инструментов и собственной базы данных документов. Их основная задача состоит в том, чтобы передать запрос пользователя «настоящим» поисковым системам. Важным достоинством систем метапоиска является то, что они позволяют задействовать сразу несколько поисковых служб, при этом у пользователя нет необходимости подключаться к каждой из этих служб и многократно вводить запрос. Метапоисковые системы бывают двух видов: представленные в виде Web-сайта в Интернет и реализованные как отдельные программы, требующие установки на пользовательский компьютер.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|