Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Принцип действия каталогов. Комбинированные (гибридные) ПС




Принцип действия каталогов

Как отмечалось ранее, поиск информации в Интернете можно производить с помощью поисковых систем и каталогов. Другое нередко используемое название поисковых средств, построенных с помощью каталогов, — иерархические ПС.

Термин «иерархия» означает: расположение частей или элементов целого в по­рядке от высшего к низшему. В данном случае правильнее говорить: иерархия — это уточнение содержания документа от его общих характеристик к частным ха­рактеристикам.

Синонимами термина «каталог» являются слова: директория, справочник, категория, рубрикатор.

Каталоги представляют собой тематически подобранные сетевые адреса, которые сопровождаются краткими комментариями (аннотациями).

Каталоги появились самым естественным путем: пользователи отбирали для себя ссылки на любимые места в Интернете и составляли упорядоченные темати­ческие списки с детализацией каждого раздела (рубрики). Именно так возник всемирно известный каталог Yahoo!, созданный студентами Стэндфордского универ­ситета Дэвидом Фило и Джерри Янгом.

В каталогах размещение информации ведется с помощью многоуровневой руб­рикации, причем на каждом уровне происходит все большая детализация (уточне­ние) сведений об искомом (хранящемся) документе. При этом каждая последую­щая рубрика не исключает свойств документа, определенных предыдущей рубри­кой, а лишь уточняет их. Иначе говорят: рубрики находятся в отношении соподчинения, иерархии. Еще говорят: используется принцип последовательного уточнения.

Важным термином, характеризующим работу каталогов, является рубрикация.

Рубрикация — помещение документа в соответствующий раздел (подраздел, рубрику), которое, как правило, производится вручную специалистами (модерато­рами, аналитиками) или авторами разработанных документов. Разработчиков Web-страниц иногда называют владельцами ресурсов или Web-дизайнерами.

Процедура рубрикации достаточно субъективна и осуществляется на основа­нии индивидуальных представлений людей о данной предметной области. Авторы при размещении своих страниц порой руководствуются не соображением точного соответствия документа названию рубрики, а другими соображениями. Например, с целью увеличения посещаемости своих страниц их помещают в рубрики, наибо­лее популярные в данный момент времени. Документ, содержащий разнообраз­ную информацию на Web-странице, порой помещают в несколько рубрик.

На следующем рисунке показан фрагмент каталога. Указанные рубрики содер­жат в себе другие рубрики, в которые еще в большей степени уточняют содержи­мое хранящегося документа.

Перечислим доменные адреса некоторых отечественных каталогов:

http: //www. mail. ru/,        http: //www. km. ru/url/,

http: //www. ru/,                 http: //www. ulitka. ru/

http: //www. susanin. net/,           http: //students. informika. ru,

http: //www. stars. ru/,        http: //yp. piter. com/.

В Интернете, кроме иерархических каталогов, встречаются и другие типы каталогов — неиерархические, в которых нет соподчинения, например каталоги, испо­льзующие алфавитно-предметную классификацию. В качестве примера можно назвать энциклопедии, музыкальные сайты, телефонные справочники и др.

Рис. 8. 2

Таким образом, поисковые системы и тематические каталоги имеют свои достоинства и недостатки, взаимно дополняют друг друга.

Поисковые системы «осматривают» большое число сайтов, однако автоматический отбор искомых документов сопровождается достаточно большим числом ошибок.

База данных каталога хранится на одном сервере и содержит меньший объем информации, чем ПС. Тем не менее результаты поиска с помощью каталогов имеют большую релевантность по сравнению с поиском с помощью ПС.

Комбинированные (гибридные) ПС

Естественным путем образовались комбинированные (гибридные) ПС, которые называют порталами.

Портал ‑ мощные поисковые системы, которые позволяют вести поиск по ключевым словам и с помощью каталогов, а также содержат страницы различных тематических направлений.

Результаты поиска с помощью различных ПС будут отличаться друг от друга. Это объясняется тем, что в каждой ПС проиндексировано различное число документов и эти документы совсем не обязательно одинаковые. Кроме того, алгоритмы индексации на каждой ПС имеют свои особенности.

Существуют национальные ПС, которые в первую очередь обрабатывают информацию, составленную на родном языке, например русскоязычная региональная ПС Rambler.

Периодичность обновления информации с помощью роботов также различна, и она определяется быстродействием конкретной ПС (частотой посещения сайтов). Для расширения просматриваемого в сети пространства рекомендуют использовать несколько ПС.

Метапоисковая система позволяет вести автоматический поиск по сделанному запросу с использованием сразу нескольких поисковых машин.

Укажем адреса некоторых метапоисковых систем общего назначения:

www. metacrawler. com, www. metor. com, www. infozoid. com, www. accufnd. com.

Кроме ПС общего назначения существуют специализированные ПС.

Они предназначены для поиска

· музыкальных файлов (www. midi. ru),

· произведений искусств (www. artplanet. com),

· рисунков (www. graphsearch. com),

· книг (http: //bukinist. agava. ru/),

· кулинарные рецептов (www. cooking. ru/search. html).

В заключение перечислим ПС, предназначенные для поиска файлов:

http: //www. lycos. com/computers/downloads/, http: //www. filesearch. ru/,

http: //www. files. ru/,                          http: //www. freeware. ru/.

При использовании перечисленных систем поиск происходит не с помощью ключевых слов, а по известным именам файлов.

Примечание.

Ежедневно поисковая система Google обрабатывает более 150 миллионов за­просов (март 2003 года).

 


Горбунов Николай Петрович

Попова Ирина Юрьевна

Судаков Сергей Ефимович

 

Информационно-поисковые системы

 

Лабораторный практикум
для студентов специальностей 060800

  Подп. к печати Формат
Усл. печ. л.   Уч. -изд. л Тираж экз.
Изд. № Заказ №  

 

РИО СПбГАСЭ, лицензия ЛР №040849

Член Издательско-полиграфической Ассоциации университетов России

СПб государственная академия сервиса и экономики

192171, г. Санкт-Петербург, ул. Седова, 55/1

Отпечатано в ИИГ НОУ «АКТиБ», 192171, СПб., ул. Седова, 55/1

Лицензия ИД №05598 от 14. 08. 2001 г.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...