Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Адрес: http://www.aport.ru/.




Одна из поисковых систем Рунета, громко заявившая о себе в начале XXI века. Она отличается более совершенным алгоритмом поиска и меньшим, чем в других поисковиках, количеством рекламы. Но, к сожалению, развитие этой поисковой системы после приобретения его компанией Golden Telecom затормозилось. Эта система индексирует не только содержимое сайтов, но также и специальные теги: <title>, <meta keywords=>, <meta description=>, <img alt=> и др. Это позволяет Веб-мастерам правильно "оптимизировать" свои сайты. Несмотря на меньшее количество проиндексированных сайтов в Апорте, чем у конкурентов (а, может быть, благодаря этому), система дает меньше "сорных" ссылок, в ответе практически отсутствуют дорвеи, а сами ссылки больше соответствуют теме запроса. Эти особенности поиска позволяют автору рекомендовать эту поисковую систему как идеальную для датамайнинга.

Рис. B.09. Снимок экрана главной страницы Апорта.

Смотри также файл в архиве.

B.4.2.4. Mail RU.

Адрес: http://go.mail.ru/

Эта поисковая система выросла из тематического каталога портала MAIL RU. Этот портал первоначально предназначался для размещения в нем бесплатных почтовых ящиков. До сих пор это основной бизнес портала. В настоящее время в портале открываются новые сервисы: блоги, фотогалереи, он-лайн торговля, платежная система Деньги@mail.ru, новостной портал и т.п. Пожелаем успехов компании - владельцу портала.

Рис. B.10. Снимок экрана главной страницы поиска портала.

B.4.3. Англоязычные поисковые машины.

B.4.3.1. Google.

Адрес: http://www.google.ru/

Свою историю эта поисковая система Интернета ведет с сентября 1998 года. Сегодня она является крупнейшей и наиболее посещаемой поисковой машиной Интернета. У нее имеется множество локализаций (в том числе и русская версия). Попасть на первую страницу Google - предел мечтания любого оптимизатора сайтов. Интерфейс поисковика предельно прост и понятен, главная страница не перегружена дополнительными элементами - новостями, баннерами, рекламой и т.п. Это особенно актуально для пользователей dial-up соединений. Однако и полезной информации, зайдя на главную страницу, мы не почерпнем.

Поисковая машина Google узнает о новом появлении веб-страниц с помощью ссылок на нее с других сайтов. Вообще отличительной особенностью этого поисковика является то, что и поиск, и положение сайта в собственном рейтинге по числу ссылок на ресурс (т.н. Page Rank). По желанию можно узнать, индексирован ли конкретный веб-сайт поисковым роботом Google, а также добавить любой ресурс в базу данных вручную.

Google индексирует и осуществляет поиск в документах формата HTML, PHP (гипертекстовые документы Интернета), DOC, RTF, XLS (документы Microsoft Office), PDF (документы Adobe Acrobat), SWF (документы Adobe Flash), и файлов ряда других популярных форматов. В основе поиска, как уже говорилось, лежит технология Page Rank. Кроме того, индексируя страницу, поисковый робот полностью изучает содержимое всех страниц сайта.

К услугам пользователей Google - стандартный поиск документов, поиск в картинках, группах, в каталоге, а также расширенный поиск с возможностью задавать некоторые дополнительные параметры (тип файла, дату последнего изменения и т.д.).

Логический оператор И подставляется автоматически на месте пробела. Еще один оператор, поддерживаемый поисковой машиной Google - это оператор “И-НЕ”, обозначаемый в командной строке как “-”. Если ввести в поисковой строке браузера: “машины - антикварные”, то поисковая система выдаст “на гору” все сайты, содержащие в себе слово “машина” и не содержащее слова “антикварные”. Кстати, Google учитывает при поиске слов и их морфологические формы. В качестве оператора ИЛИ Google использует знак “+”.

Вид главной страницы поисковой системы Google представлен на рисунке B.11.

Рис. B.11. Вид главной страницы поисковой системы Google.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...