Принцип действия каталогов. Комбинированные (гибридные) ПС
⇐ ПредыдущаяСтр 10 из 10 Принцип действия каталогов Как отмечалось ранее, поиск информации в Интернете можно производить с помощью поисковых систем и каталогов. Другое нередко используемое название поисковых средств, построенных с помощью каталогов, — иерархические ПС. Термин «иерархия» означает: расположение частей или элементов целого в порядке от высшего к низшему. В данном случае правильнее говорить: иерархия — это уточнение содержания документа от его общих характеристик к частным характеристикам. Синонимами термина «каталог» являются слова: директория, справочник, категория, рубрикатор. Каталоги представляют собой тематически подобранные сетевые адреса, которые сопровождаются краткими комментариями (аннотациями). Каталоги появились самым естественным путем: пользователи отбирали для себя ссылки на любимые места в Интернете и составляли упорядоченные тематические списки с детализацией каждого раздела (рубрики). Именно так возник всемирно известный каталог Yahoo!, созданный студентами Стэндфордского университета Дэвидом Фило и Джерри Янгом. В каталогах размещение информации ведется с помощью многоуровневой рубрикации, причем на каждом уровне происходит все большая детализация (уточнение) сведений об искомом (хранящемся) документе. При этом каждая последующая рубрика не исключает свойств документа, определенных предыдущей рубрикой, а лишь уточняет их. Иначе говорят: рубрики находятся в отношении соподчинения, иерархии. Еще говорят: используется принцип последовательного уточнения. Важным термином, характеризующим работу каталогов, является рубрикация. Рубрикация — помещение документа в соответствующий раздел (подраздел, рубрику), которое, как правило, производится вручную специалистами (модераторами, аналитиками) или авторами разработанных документов. Разработчиков Web-страниц иногда называют владельцами ресурсов или Web-дизайнерами.
Процедура рубрикации достаточно субъективна и осуществляется на основании индивидуальных представлений людей о данной предметной области. Авторы при размещении своих страниц порой руководствуются не соображением точного соответствия документа названию рубрики, а другими соображениями. Например, с целью увеличения посещаемости своих страниц их помещают в рубрики, наиболее популярные в данный момент времени. Документ, содержащий разнообразную информацию на Web-странице, порой помещают в несколько рубрик. На следующем рисунке показан фрагмент каталога. Указанные рубрики содержат в себе другие рубрики, в которые еще в большей степени уточняют содержимое хранящегося документа. Перечислим доменные адреса некоторых отечественных каталогов: http: //www. mail. ru/, http: //www. km. ru/url/, http: //www. ru/, http: //www. ulitka. ru/ http: //www. susanin. net/, http: //students. informika. ru, http: //www. stars. ru/, http: //yp. piter. com/. В Интернете, кроме иерархических каталогов, встречаются и другие типы каталогов — неиерархические, в которых нет соподчинения, например каталоги, использующие алфавитно-предметную классификацию. В качестве примера можно назвать энциклопедии, музыкальные сайты, телефонные справочники и др. Рис. 8. 2 Таким образом, поисковые системы и тематические каталоги имеют свои достоинства и недостатки, взаимно дополняют друг друга. Поисковые системы «осматривают» большое число сайтов, однако автоматический отбор искомых документов сопровождается достаточно большим числом ошибок. База данных каталога хранится на одном сервере и содержит меньший объем информации, чем ПС. Тем не менее результаты поиска с помощью каталогов имеют большую релевантность по сравнению с поиском с помощью ПС.
Комбинированные (гибридные) ПС Естественным путем образовались комбинированные (гибридные) ПС, которые называют порталами. Портал ‑ мощные поисковые системы, которые позволяют вести поиск по ключевым словам и с помощью каталогов, а также содержат страницы различных тематических направлений. Результаты поиска с помощью различных ПС будут отличаться друг от друга. Это объясняется тем, что в каждой ПС проиндексировано различное число документов и эти документы совсем не обязательно одинаковые. Кроме того, алгоритмы индексации на каждой ПС имеют свои особенности. Существуют национальные ПС, которые в первую очередь обрабатывают информацию, составленную на родном языке, например русскоязычная региональная ПС Rambler. Периодичность обновления информации с помощью роботов также различна, и она определяется быстродействием конкретной ПС (частотой посещения сайтов). Для расширения просматриваемого в сети пространства рекомендуют использовать несколько ПС. Метапоисковая система позволяет вести автоматический поиск по сделанному запросу с использованием сразу нескольких поисковых машин. Укажем адреса некоторых метапоисковых систем общего назначения: www. metacrawler. com, www. metor. com, www. infozoid. com, www. accufnd. com. Кроме ПС общего назначения существуют специализированные ПС. Они предназначены для поиска · музыкальных файлов (www. midi. ru), · произведений искусств (www. artplanet. com), · рисунков (www. graphsearch. com), · книг (http: //bukinist. agava. ru/), · кулинарные рецептов (www. cooking. ru/search. html). В заключение перечислим ПС, предназначенные для поиска файлов: http: //www. lycos. com/computers/downloads/, http: //www. filesearch. ru/, http: //www. files. ru/, http: //www. freeware. ru/. При использовании перечисленных систем поиск происходит не с помощью ключевых слов, а по известным именам файлов. Примечание. Ежедневно поисковая система Google обрабатывает более 150 миллионов запросов (март 2003 года).
Горбунов Николай Петрович Попова Ирина Юрьевна Судаков Сергей Ефимович
Информационно-поисковые системы
Лабораторный практикум
РИО СПбГАСЭ, лицензия ЛР №040849 Член Издательско-полиграфической Ассоциации университетов России СПб государственная академия сервиса и экономики 192171, г. Санкт-Петербург, ул. Седова, 55/1 Отпечатано в ИИГ НОУ «АКТиБ», 192171, СПб., ул. Седова, 55/1 Лицензия ИД №05598 от 14. 08. 2001 г.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|