Если запрос состоит из нескольких слов и при этом некоторые из них вообще не удалось найти в Internet, то выдаются результаты поиска по частичному запросу, из которого отсутствующие в Internet слова исключены. При этом на странице результатов поиска выдается соответствующая диагностика.
Как видим, язык запросов Rambler не отличается обширным "словарным запасом". Но зато эта ИПС позволяет проводить расширенный поиск, благодаря чему даже неискушенные пользователи могут значительно сужать круг поиска, а значит повышать его релевантность.
ИПС Апорт
Как и другие русскоязычные поисковики, Апорт проводит поиск независимо от того, в какой грамматической форме слово было указано в запросе. Разработчики системы, однако, отмечают, что для редких слов, неологизмов и т.п. морфологический поиск не работает. В этом случае может пригодиться символ - заменитель ‘*’ (звездочка).
Оператор логическое И; подразумевается по умолчанию
Запрос быстрый поиск полностью эквивалентен запросу быстрый AND поиск. По любому из этих запросов будут найдены документы, содержащие оба слова
ИЛИ, OR, |
Оператор логическое ИЛИ. Позволяет искать документы, содержащие хотя бы один из операндов
быстрый ИЛИ поиск — будут найдены документы, содержащие любое из указанных слов или оба слова одновременно
НЕ, NOT, -
Оператор логическое НЕ. Ограничивает поиск документами, не содержащими слово, указанное после оператора
Фрукты НЕ яблоки — будут найдены документы, содержащие слово "фрукты", но не содержащие слово "яблоки"
()
Круглые скобки
Круглые скобки задают порядок действия логических операторов. По запросу быстрый ИЛИ качественный поискбудут выданы документы, содержащие либо слово "быстрый', либо одновременно слова "качественный' и "поиск" (оператор и действует первым).
По запросу (быстрый ИЛИ качественный) поискбудут выданы документы, где встречаются одновременно слова "быстрый" и "поиск", либо "качественный' и "поиск"
"…" либо '…'
Двойные или одинарные кавычки позволяют находить словосочетание, указанное в них или близкое к нему. Последняя оговорка связана с двумя обстоятельствами: 1) стоп - слова в кавычках игнорируются, как и в обычном запросе; 2) грамматическая форма слов кавычками не фиксируется
"яблоки на снегу" — будут найдены документы, содержащие следующие фрагменты: "яблоки на снегу", "яблоки и снег", "яблокам под снегом", "яблоко снег" и т.п.
сл2(…) либо [2,…] либо с2(…) либо w2(…)
Ограничение расстояния в словах (двойка указана как пример)
сл5(папа мама сын) —будут найдены документы, где между словами "папа", "мама" и "сын" стоит не более двух других слов (т.е. общее число слов во фрагменте не более 5). Порядок, в котором встречаются заданные слова, не важен
дата= либо дата: либо date= либо date:
Ограничение поиска документами, попадающими в заданный интервал дат
папа дата=01/01/97-01/02/97 —будут выданы все документы, содержащие слово папа и имеющие дату от 1 января 1997 года до 1 февраля 1997 года. date=01/01/97 пaпa — будут выданы все документы, содержащие слово "папа" и имеющие дату 1 января 1997 года. дата:<01/02/97 папа ИЛИдата: -01/02/97 папа — будут выданы все документы, содержащие слово "папа" и имеющие дату не позже 1 февраля 1997 года
url= либо url:
Ограничение поиска или одним, или несколькими серверами, или даже частью сервера
url= www.intel.ru — будут выданы (в случайном порядке) все документы, проиндексированные Апортом на сервере www.intel.ru.
url=www.intel.ru & IPI & условия — будут выданы все документы сервера www.intel.ru, содержащие слова "IPI" и "условия".
url=www.intel.ru/IPINet/* — будут выданы все документы, проиндексированные Апортом на сервере www.intel.ru в каталоге IPINet и его подкаталогах.
url = *.agama.com — будут выданы все документы, проиндексированные Апортом на серверах www.agama.com, russia.agama.com и т.д. Подобные запросы могут обрабатываться довольно долго. Не рекомендуется делать запрос типа *.ru, так как результаты, содержащие несколько миллионов документов, все равно никто не станет просматривать
title= либо t= либо заг= либо з=
Указанное после равенства слово или конструкция в круглых скобках должны искаться в заголовках документов (перед круглыми скобками знак равенства можно опускать)
заг=(папа ИЛИ мама) — будут найдены документы, содержащие в заголовке слово папа или слово мама, или оба слова одновременно
keywords= либо kw= либо клсл= либо кл=
Указанное после равенства слово или конструкция в круглых скобках должны искаться в поле meta keywords документов (перед круглыми скобками знак равенства можно опускать)
kw(nana и мама) — будут найдены документы, для которых автор в ключевых словах указал оба слова: "папа" и "мама"
alt= либо а= либо рис= либо р=
Указанное после равенства слово или конструкция в круглых скобках должны, искаться в полях ALT (комментарии к изображениям)
рис (Билл Гейтс) — будут найдены документы, в которых есть изображение с комментарием, содержащим как минимум два слова: "Билл" и "Гейтс"
anchor=
Указанное после равенства слово или конструкция в круглых скобках должны искаться в тексте ссылок
anchor=(ненавижу Интернет) — будут найдены документы, в тексте ссылок на которые встречаются оба слова: "ненавидеть" и "Интернет"
description=
Указанное после равенства слово или конструкция в круглых скобках должны искаться в тексте описаний сайтов и в поле meta description документов
description=("уксусная кислота") — будут найдены корневые документы сайтов, в тексте описаний которых встречается словосочетание "уксусная кислота", а также документы, в которых это словосочетание встречается в поле meta description
text= либо х= либо текст= либо т=
Указанное после равенства слово или конструкция в круглых скобках должны искаться только в обычном тексте. По умолчанию слова запроса ищутся как в тексте, так и во всех указанных выше полях. Чтобы искать только по тексту, выдаваемому в основное окно браузера, следует использовать данный оператор
текст=(оплавление ИЛИ содержание) — будут найдены документы, в которых любое из указанных слов встречается в пределах основного текста документа
Следует отметить, что по богатству предоставляемых сервисов ИПС Апорт не уступает порталам и может стать той страницей, с которой пользователь начинает и на которой заканчивает работу в Internet.
Зарубежные ИПС
AllTheWeb
В середине 2003 г. ИПС AllTheWeb (www.alltheweb.com) занимала второе место после Google по количеству проиндексированных страниц, хотя по популярности этот поисковик уступает популярности англоязычных поисковых систем Yahoo и AltaVista. Возможности AllTheWeb по проведению расширенного поиска весьма впечатляющи и сопоставимы с таковыми в Google.
Операторы ИПС AllTheWeb
Синтаксис
Что означает оператор
“ ”
Поиск точной фразы
()
Логическое ИЛИ
+
Обязательное наличие слова, эквивалентно применению оператора AND между словами (подразумевается по умолчанию)
-
Исключение из результатов поиска документов с данным словом (логическое И НЕ)
and
Логическое И
or
Логическое ИЛИ
andnot
Логическое И НЕ
rank
Оператор ранжирования, например, результаты поиска белый rank пароход будут содержать слово «белый» и предпочтительно слово «пароход»
слово site:^домен
Поиск документов с указанным словом на страницах заданного домена или сайта
“текст” site:домен*
Поиск текста в указанном домене
url: слово
Поиск страниц, в адресе которых содержится указанное слово
link:ссылка
Поиск страниц, содержащих указанную ссылку
title:слово
Поиск страниц, в заголовке которых содержится указанное слово
слово language:яз
Поиск страниц, содержащих указанное слово и написанных на указанном языке
слово filesize:<1024
Поиск страниц, содержащих указанное слово и имеющих объем менее 1 кБ
слово filesize:[1024;2048]
Поиск страниц, содержащих указанное слово и имеющих объем от 1 до 2 кБ
слово filetype:pdf
Поиск файлов формата PDF, содержащих указанное слово
слово filetype:msword
Поиск документов MS Word, содержащих указанное слово
слово filetype:flash
Поиск flash – файлов, содержащих указанное слово
Yahoo!
Это — один из самых посещаемых поисковых Web-узлов не только в США, но и в других странах. В начале 2000-х годов, когда Google еще только "набирала обороты", это был вообще самый популярный поисковый каталог.
Сильная сторона Yahoo! (www.yahoo.com) — именно подробнейший каталог, максимально учитывающий вкусы и привычки жителей США. Но это — еще и мощный портал, предоставляющий множество сервисов. Вы можете с его помощью получить информацию о фирмах, товарах и Internet-магазинах, совершить разнообразные покупки, получить бесплатный почтовый ящик и бесплатно же разместить в Сети свой фотоальбом. Вы также можете завести адресную книгу и деловой календарь, который автоматически напомнит вам о важных встречах и делах, послав SMS-сообщение на мобильный телефон или письмо по электронной почте. Вы можете хранить на Yahoo! свой "портфель" документов и осуществлять мгновенный обмен сообщениями с помощью Internet-пейджера Yahoo! Messenger. Но поскольку тема лабораторной работы — поиск информации в Internet, далее мы будем говорить именно об этом.
Как уже говорилось, Yahoo! — это, прежде всего, подробнейший поисковый каталог. Поначалу поисковая машина Yahoo! обладала весьма скромными возможностями. Но, учитывая растущий интерес пользователей именно к этому способу поиска, разработчики Yahoo! снабдили свою ИПС мощной поисковой машиной, упростили и сделали максимально удобным ее интерфейс.
Возможности расширенного поиска в Yahoo довольно ограничены.
Операторы ИПС Yahoo
Синтаксис
Что означает оператор
“ ”
Поиск точной фразы
()
Логическое ИЛИ
+
Обязательное наличие слова, эквивалентно применению оператора AND между словами (подразумевается по умолчанию)
-
Исключение из результатов поиска документов с данным словом (логическое И НЕ)
t:слово
Поиск документов, в заголовке которых встречается указанное слово
u:слово
Поиск документов, в URL которых встречается указанное слово
Другие зарубежные ИПС
В Интернете насчитывается несколько тысяч зарубежных поисковых систем. Перечислим только несколько наиболее известных из них: