Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Система поиска файлов Archie

Archie - это сервис, облегчающий работу с anonymous FTP серверами, обеспечивающий поиск файлов на таких серверах. Серверов поддерживающих сервис Archie всего существует около десятка, и каждый из них сильно загружен. Серверы Archie хранят списки файлов на многих серверах FTP, и по Вашему запросу могут искать интересующий Вас файл по имени или части имени. Вы должны задать шаблон для поиска и характеристики поиска, в ответ получаете список имен серверов и мест расположения файлов на них, которые удовлетворяют Вашему запросу. Существуют специальные программы-клиенты Archie, но можно воспользоваться услугами такого сервера, и соединившись с ним по протоколу telnet и войдя под именем archie.

К недостаткам Archie относится децентрализованность, высокая загруженность серверов, необходимость уметь задавать шаблон имени для поиска файла. Каждый сервер обслуживает свой набор серверов FTP, возможно перекрывающихся - Вы можете не найти необходимую информацию на одном сервере, однако найти на другом.

Гипертекстовая система Gopher

Одним из достаточно известных и распространенных сервисов Интернет является GOPHER (правда устаревшим). Хотя сейчас он уже практически не развивается, или, во всяком случае, развивается гораздо медленнее прочих сервисов похожего назначения, но тем не менее через GOPHER доступно довольно-таки большое количество информации - в первую очередь, по историческим причинам - был период, когда GOPHER был лучшим средством публичного доступа к информации. Современные средства работы с информацией в Интернет (например, WWW просмотрщики) обеспечивают в том числе доступ к серверам GOPHER, поэтому специальных программам-клиентов GOPHER в настоящий момент не используется. Что касается использования сервера GOPHER для предоставления новой информации в публичный доступ - вряд ли целесообразно использовать морально устаревший сервис GOPHER.

GOPHER - это распределенная система экспорта структурированной информации. При работе с GOPHER Вы находитесь в системе вложенных меню, из которых доступны файлы различных типов - как правило, простые тексты, но это может быть и графика, и звук и любые другие виды файлов. Таким образом, в публичный доступ экспортируются файлы с информацией, но не в виде файловой системы, как в FTP, а в виде аннотированной древовидной структуры. GOPHER - сервис прямого доступа и требует, чтобы и сервер, и клиент были полноценно подключены к Интернет.

Система гипермедиа WWW

WWW (World Wide Web - всемирная паутина) - самый популярный и интересный сервис Интернет сегодня, самое популярное и удобное средство работы с информацией. Самое распространенное имя для компьютера в Интернет сегодня - www, больше половины потока данных Интернет приходится на долю WWW. Количество серверов WWW сегодня нельзя оценить сколько-либо точно, но по некоторым оценкам их более 30 тысяч. Скорость роста WWW даже выше, чем у самой сети Интернет. Сегодня WWW - самая передовая технология Интернет, и она уже становится массовой технологией - возможно, недалек тот день, когда каждый человек, знающий, что такое телефон, будет знать, что такое WWW.

WWW - информационная система, которой весьма непросто дать корректное определение. Вот некоторые из эпитетов, которыми она может быть обозначена: гипертекстовая, гипермедийная, распределенная, интегрирующая, глобальная. Ниже будет показано, что понимается под каждым из этих свойств в контексте WWW.

WWW работает по принципу клиент-сервер, точнее, клиент-серверы: существует множество серверов, которые по запросу клиента возвращают ему гипермедийный документ - документ, состоящий из частей с разнообразным представлением информации (текст, звук, графика, трехмерные объекты и т.д.), в котором каждый элемент может являться ссылкой на другой документ или его часть. Ссылки эти в документах WWW организованы таким образом, что каждый информационный ресурс в глобальной сети Интернет однозначно адресуется, и документ, который Вы читаете в данный момент, способен ссылаться как на другие документы на этом же сервере, так и на документы (и вообще на ресурсы Интернет) на других компьютерах Интернет. Причем пользователь не замечает этого, и работает со всем информационным пространством Интернет как с единым целым. Ссылки WWW указывают не только на документы, специфичные для самой WWW, но и на прочие сервисы и информационные ресурсы Интернет. Более того, большинство программ-клиентов WWW (browsers, навигаторы) не просто понимают такие ссылки, но и являются программами-клиентами соответствующих сервисов: FTP, GOPHER, сетевых новостей Usenet, электронной почты и т.д. Таким образом, программные средства WWW являются универсальными для различных сервисов Интернет, а сама информационная система WWW играет интегрирующую роль.

Вот некоторые термины, использующиеся в WWW - конечный пользователь может их и не знать, но рано или поздно они Вам встретятся и они не должны вызвать у Вас недоумение. Первый термин - html (hypertext markup language, язык разметки гипертекста). Это формат гипермедийных документов, использующихся в WWW для предоставления информации. Формат этот не описывает то, как документ должен выглядеть, но его структуру и связи. Внешний вид документа на экране пользователя определяется навигатором - если Вы работаете за графическим или текстовым терминалом, то в каждом случае документ будет выглядеть по-своему, но структура его останется неизменной, поскольку она задана форматом html. Имена файлов в формате html обычно оканчиваются на html (или htm, shtml). Второй термин - URL (uniform resource locator, универсальный указатель на ресурс). Так называются те самые ссылки на информационные ресурсы Интернет. Еще один термин - HTTP (hypertext transfer protocol, протокол передачи гипертекста). Это название протокола, по которому взаимодействуют клиент и сервер WWW.

WWW - сервис прямого доступа, требующий полноценного подключения к Интернет, и более того, часто требующий быстрых линий связи, в случае, если документы, которые Вы читаете, содержат много графики или другой нетекстовой информации. Однако существуют мосты, позволяющие получать информацию, содержащуюся в WWW, посредством электронной почты. Возможность такая есть, но таких мостов мало, да и толку от них немного - чтобы успешно использовать возможности WWW, требуется прямой доступ в Интернет, а при его отсутствии теряются многие плюсы, создавшие WWW сегодняшнюю популярность. Кроме того, некоторые возможности, имеющиеся при обычной работе, просто недоступны через электронную почту. Это, в основном, относится к элементам интерактивности в WWW. Например, в языке html поддерживаются формы. Пользователь вводит в них некоторую информацию, которая затем может передаваться на сервер. Таким образом заполняются анкеты, регистрационные карты, проводятся социологические опросы.

Практически любая информация, которая предоставляется в публичный доступ, отображается средствами WWW. Если какая-та информация не может быть помещена в WWW, то это обусловлено некоторыми ограничениями и недостатками WWW. Во-первых, соединение между клиентом и сервером WWW одноразовое: клиент посылает запрос, сервер выдает документ, и связь прерывается. Это значит, что сервер не имеет механизма уведомления клиента об изменении или поступлении новых данных. Проблема решается сегодня несколькими способами: разрабатывается новая версия протокола HTTP, которая будет позволять длительное соединение, передачу данных в несколько потоков, разделение каналов передачи данных и управления ими. Если она будет реализована и станет поддерживаться стандартным программным обеспечением WWW, то это решит снимет вышеописанные недостатки. Другой путь предлагается с использованием навигаторов, которые смогут локально исполнять программы на интерпретируемых языках - как это сделано в проекте Java компании Sun Microsystems.

Усилия эти затруднены децентрализованностью WWW - например, сегодня стандартом становятся не те расширения языка html, которые лучше, но те, которые привносятся самыми популярными навигаторами, такими как Netscape Navigator. Децентрализованность несет и множество других проблем: отсутствие общего каталога серверов и средств тотального поиска по ним. Однако и эта проблема решается, причем более успешно, чем предыдущие - сегодня есть и каталоги, и поисковые системы, которые, если и не являются глобальными, то, тем не менее, охватывают достаточно большую часть документов WWW, чтобы быть полезными и успешно применяться для поиска информации.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...