Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Поиск с помощью поисковых машин. Примеры использования

 

Первый вопрос, возникающий у начинающего пользователя Интернет: "Как же все-таки найти необходимый источник информации в Интернете?" Безусловно, нет неправильных или правильных методов поиска в Интернете. Одни из способов могут потребовать большего времени и усилий, чем другие. Но в итоге пользователь отдаст предпочтение тому способу, который покажется ему наиболее удобным и эффективным.

Существует два основных способа поиска информации в Интернет:

по ключевому слову ("инвентаризация") или фразе ("виды инвентаризации");

в предметных каталогах поисковой машины, например в разделе "Бухгалтерский учет".

Рассмотрим способ поиска по ключевому слову или фразе.

Идея данного метода проста для пользователей различных уровней и сводится к вводу ключевого слова (фразы) по теме интересующего вопроса в соответствующем поле поисковой машины. После чего поисковая машина производит поиск информации, содержащей указанное слово (фразу) в Интернете.

Способ поиска информации по ключевому слову стал возможен после разработки компьютерных программ, получивших название - "роботы". Задачей программы-робота является, регулярный сбор в Интернете информации о сайтах и помещение собранной информации в свою базу данных, с которой и работает пользователь, обращающийся к услугам поисковой машины. Во время ввода в поисковую машину ключевого слова из базы данных, сформированной программой-роботом, выводится перечень сайтов, содержащих ключевое слово (фразу).

На данный момент существует несколько десятков известных роботов. Так как принцип работы каждого из роботов специфичен, то одно и то же ключевое слово, вводимое в разные поисковые машины (Yandex или Rambler), дает различную совокупность сайтов (по порядку их представления и по охвату). Это приводит пользователя к некоторым затруднениям, касающихся проблемы выбора необходимой информации из большого количества представленных данных.

Основными причинами отличий в работе программ-роботов являются:

одни из программ-роботов собирают все, что им удается собрать в Интернете по заданной теме, а другие извлекают из сайтов только определенные страницы по заданной теме;

одни из "роботов" распознают сложные объекты для поиска, доступ к которым возможен только с паролем (рисунки карт, фреймовые ссылки и страницы), а другие роботы не обладают возможностями распознавания сложных объектов.

невозможность поисковой машины производить индексацию представленной информации (то есть детализировать и проводить автоматическую классификацию) независимо от количества информации в базе данных поисковой машины.

Рассмотрим принципы поиска информации на примере некоторых известных отечественных и зарубежных поисковых машин (Яndex, AltaVista, Dogpile)

1) Яndex (Яндекс).

http://www.yandex.ru/

Поисковая машина Яндекс является лучшей поисковой машиной в российском Интернете. Ее база данных содержит не менее 200 000 серверов и до 30 миллионов документов, на просмотр которых поисковая машина затрачивает не больше нескольких секунд.

Поиск информации производится следующим образом: вводится в специальное окно ввода ключевое слово (например, "инвентаризация"). Затем справа от окна ввода нажимается кнопка "Найти".

Ранжированные по значимости результаты поиска появляются в течение нескольких секунд. В начале списка размещаются наиболее важные документы. Ранг найденного документа определяется тем, в каком месте документа находится ключевое слово. Наиболее важным местом документа является заглавие документа. Также на определение ранга влияет количество упоминаний ключевого слова (число упоминаний больше - ранг выше).

Таким образом, сайты, которые расположены первыми в списке, являются ведущими не с точки зрения содержания, а по количеству упоминаний ключевого слова. Поэтому пользователю рекомендуется не ограничиваться просмотром первых предложенных поисковой машиной сайтов. К тому же поисковая машина дает возможность оценить содержательную часть сайта по краткому его описанию, размещенному под адресом сайта.

Например, поиск сайтов по ключевому слову "инвентаризация" выдаст список, в начале которого будут представлены веб-страницы (сайты), в заголовках которых будет содержаться эта фраза. В случае обнаружения поисковой машиной документов, содержащих эту фраза более одного раза, остальные документы поисковая машина распределит по частоте встречаемости заданной фразы.

Но даже ранжированный перечень документов, предложенных поисковой машиной по запросу пользователя и введенного им ключевого слова, может оказаться очень широким. В связи с этим, как и в других мощных поисковых машинах, в Яндекс предоставлена возможность в первых списках, выбрать документы, которые наиболее полно отображают цель поиска. Например, на ключевое слово "инвентаризация" Яндекс предлагает список из более около 5 миллионов веб-страниц, где первый российский сайт аудиторской фирмы ООО "Аудит Ай Ти Групп" http://www.auit.ru/auit_about стоит на первом месте.

2) AltaVista.

http://www.altavista.com/

AltaVista является наилучшим поисковым инструментом в сети Интернет. Эта база данных содержит более 100 миллионов веб-страниц, просмотр которых может занимать несколько секунд.

Поиск информации производится вводом ключевого слова ("inventarizacia") в специальное поле и активизацией кнопки "Search" (англ., "Поиск"), справа от поля. Результаты поиска выдаются за нескольких секунд. Разграниченные по значимости: наиболее важные документы размещены в начале списка.

AltaVista также имеет возможность ограничения результатов поиска определенным языком, а через опцию "Advanced" (Дополнительно) найти страницы, созданные в заданные временные промежутки (годы, месяцы и т.п.). Например, на ввод ключевого слова " inventarizacia" с указанием языка Russian, поисковая машина AltaVista предоставит около 100 русскоязычных веб-страниц.

Специально предназначенная синтаксическая поисковая функция "Related pages" поисковой машины AltaVista предоставляет возможность не только поиска изображений и картинок, но и информации по веб-страницам со схожей информацией.

3) Инструменты мета-поиска. Dogpile (http://www.dogpile.com/).

В Интернете на настоящее время представлены серверы, позволяющие производить одновременный поиск по нескольким базам данных. Поисковая машина (http://www.dogpile.com/) может осуществлять поиск по 14 базам данных Интернета. В базу данных поисковой машины Dogpile входят AltaVista, Yaho, Lycos и прочие. Сторонники мета-поиска утверждают, что использование большого количества поисковых машин значительно повышает эффективность поиска. Но эта поисковая машина имеет свои негативные стороны. Так как поиск информации с помощью поисковой машины Dogpile не осуществляется по объединенной базе данных всех (AltaVista, Yaho, Lycos) поисковых машин, то запрос приходится вводить в базе данных отдельно по каждой поисковой машине. Это приводит к трудоемкости и объемности работы пользователя. Пользователю приходится набирать огромное количество веб-страниц. Также в каждом из перечней найденной информации, представленной отдельной поисковой машиной, пользователю выводится много аналогичной информации, предоставленной иными поисковыми машинами. Происходит дублирование информации, что негативно сказывается на времени поиска информации.

В связи с существующими проблемами мета-поиска, этот подход к поиску рекомендуется использовать лишь в случаях, редкости и необычности информации.

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...