Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Основы поиска в Web с помощью ИПС Google




Чувствительность к регистру клавиатуры. Некоторые поисковые машины чувствительны к регистру клавиатуры, т.е. при поиске они учитывают строчные и заглавные буквы. Google не чувствителен к регистру клавиатуры. Введете вы в строке запроса слово Three, three, THREE или даже thRee – результат будет один и тот же.

Поиск по слову – поисковая машина ищет все страницы, на которых встречается указанное в запросе слово. Чаще всего результат поиска по одному слову содержит ссылки на огромное число страниц, просмотреть которые вручную просто невозможно, поэтому возникает необходимость задавать более сложные критерии, чтобы сузить область поиска.

Похожие страницы. При нажатии ссылки "Похожие страницы", которая имеется рядом с любым результатом поиска, Google находит web - страницы, похожие на этот результат.

Функция "Похожие страницы" может использоваться в разных целях. Если Вам понравилось содержание определенного сайта, но этой информации недостаточно, то с помощью этой функции можно найти похожее содержание, которое Вас заинтересует. Например, если Вы ищете информацию о продукте, то эта функция поможет найти информацию о конкурирующих продуктах, чтобы можно было сравнить их напрямую. Если Вы собираете информацию на определенную тему, "Похожие страницы" помогут за небольшое время найти множество ресурсов – при этом беспокоиться о выборе правильных ключевых слов не придется.

Поиск по нескольким ключевым словам – по умолчанию Google ищет страницы, содержащие вхождения указанных ключевых слов независимо от того, расположены ли они на странице рядом или удалены друг от друга.

Пример: на запрос snowblower snowmobile поисковая машина будет искать все страницы, на которых встречаются оба эти слова, независимо от их местоположения на странице.

Поиск по фразе – чтобы Google нашел фразу из нескольких слов, заключите эти слова в двойные кавычки.

Примеры: to be or not to be – Google ищет совпадения, где бы они не появились на странице, т.е. осуществляет поиск по ключевым словам,

“to be or not to be” - Google ищет точную гамлетовскую фразу «быть или не быть».

Основные булевы выражения. Поиск по всем или отдельным ключевым словам зависит от булевых выражений, заданных по умолчанию. Поисковая машина может в качестве оператора по умолчанию использовать логическую операцию AND (поиск всех вхождений ключевых слов) или логическую операцию OR (поиск ключевых слов по отдельности).

В частности, по умолчанию в Google применяется булев оператор AND. Это означает, что если вы вводите в запросе несколько слов без модификаторов, то Google выполняет поиск страниц с вхождениями всех указанных ключевых слов.

Например, на запрос snowblower snowmobile “Green Bay” будут искаться страницы со всеми этими словами. Если же вы хотите указать, что ключевые слова и фразы приемлемы и по отдельности, то укажите между ними оператор OR:
snowblower OR snowmobile OR “Green Bay”.

Внимание! Логический оператор OR следует вводить только заглавными буквами, иначе он не будет работать корректно.

Круглые скобки. Логические операторы AND и OR можно комбинировать с круглыми скобками, чтобы создавать более сложные запросы.

Пример: На запрос snowblower (snowmobile OR “Green Bay”) выполняется поиск страниц со словами snowblower snowmobile или snowblower “Green Bay”.

Отрицание. Если вы хотите, чтобы в результате поиска не появлялся некоторый элемент запроса, предварите этот элемент знаком «минус» (-).

Внимание! Знак «-» нужно ставить непосредственно перед словом или фразой, которые вы хотите исключить. Если знак «-» с обеих сторон ограничен пробелами, то он не будет работать.

Пример: Запрос snowblower snowmobile -“Green Bay” выполняется для слов snowblower snowmobile, но не для фразы “Green Bay”.

Явное присоединение. Существуют определенные слова, которые Google игнорирует, поскольку они считаются слишком общими. Такие слова – в частности, «I», «a», «the», «of» - называются стоп – словами. Вы можете заставить Google учитывать стоп – слова, если предварите такое слово знаком «плюс»: +the king.

Стоп – слово внутри фразы поиска не игнорируется, и предварять его знаком «+» не нужно.

Пример: Поиск “the move” glam даст более точный результат, чем поиск +the move glam.

Синонимы. Google будет учитывать не только точные совпадения, но и те, которые он считает синонимами для каждого ключевого слова, если вы воспользуетесь оператором синонимов «тильда» (~). В результатах синонимы выделяются полужирным шрифтом наряду с заданными ключевыми словами, так что их легко отыскать.

Google отбирает синонимы по специальному алгоритму, поэтому некоторые результаты поиска могут вас удивить.

Пример: Поиск ~ape возвращает информацию для слов monkey, gorilla, chimpanzee и др.

Диапазоны чисел. Одна из наиболее сложных позиций для поиска в Интернете – диапазон дат, курсов валют, размеров, высот и других единиц. Оператор диапазона чисел «..» задает поиск результата внутри указанного диапазона чисел, или начиная от некоторого минимального значения, или кончая некоторым максимальным значением. При указании диапазона не забывайте задавать размерность интервальной единицы.

Примеры: prada pums size 5..6

slr digital camera 3..5 megapixel $800..1000

acres Montana land 500..

raincoat dog..$30

Мне повезет! Вместо того, чтобы выдавать привычный список результатов, из которых вы вручную отбираете лучшие, Google может сразу отправить вас на страницу, которую он считает наиболее значимым результатом (первую страницу в списке результатов), если после задания критерия поиска вы вместо кнопки Search (Поиск) щелкните на кнопке
I’m Feeling Lucky! (Мне повезет!).

Пример: По запросу washington post после щелчка на кнопке I’m Feeling Lucky! (Мне повезет!) вы попадете непосредственно на страницу http://www.washingtonpost.com.

Символ – заменитель слова. Некоторые поисковые машины поддерживают технологию, которая называется морфологическим поиском. В этом случае вы можете добавить символ – заменитель – обычно это «звездочка, *», а иногда «знак вопроса,?» - к части запроса, чтобы поисковая машина возвращала варианты для различных словоформ. К примеру запрос по слову moon* вернет результат для слов moons, moonlight, moonshot и др.

Google не поддерживает явный морфологический поиск, и вместо него предлагает заменитель слова целиком. Это удобно, если вы в некоторой фразе забыли слово или слова. Одна звездочка заменяет одно забытое слово, две звездочки – два слова и т.д. Вы можете использовать такую методику для поиска стихов, песен и др.

Примеры: three * mice

“You silly *, you can’t change your fate”

Специальный синтаксис. В дополнение к операторам AND, OR и поиску по фразе Google предлагает специальный синтаксис для сужения области поиска.

Дополнительная команда, именуемая специальным синтаксисом, позволяет Google искать части web – страниц. Это очень помогает, когда вы имеете дело с миллиардами web – страниц.

Указывая, что ключевые слова должны появляться только в заголовке или URL возвращаемой web – страницы, вы более точно определяете результат.

Одни из элементов специального синтаксиса хорошо работают в комбинации, другие – хуже, а третьи – совсем не работают.

Описание элементов специального синтаксиса:

intitle: ограничивает область поиска заголовком web – страниц

allintitle: разновидность intitle, находит страницы, где в заголовке присутствуют все указанные слова.

Примеры: intitle:“george bush”

allintitle:“money supply” economics

Некоторые пользователи предпочитают не применять allintitle:, поскольку этот синтаксис не очень хорошо работает в комбинации с другими элементами.

intext: поиск только в основном тексте, т.е. текст ссылок, URL и заголовки игнорируются.

Примеры: intext:“yahoo.com”

intext:html

allintext: разновидность intext, находит страницы, где в основном тексте присутствуют все указанные слова.

inanchor: ищет текст в анкерах ссылок, т.е. в тексте описания ссылки

allinanchor: разновидность элемента in*, работает, как описано выше

site: позволяет сузить область поиска сайтом или доменом верхнего уровня. Поисковая машина AltaVista, напротив, использует для этой цели два элемента синтаксиса – host: и domain:, а Google только один - site:.

Примеры: site:loc.gov

site:thomas.loc.gov

site:tom peters edu

site:nc.us

site:www.msu.ru правила приема – поиск правил приема в МГУ.

Элемент site: не годится для поиска страниц, расположенных в иерархии ниже главного сайта или сайта по умолчанию (т.е. подкаталогов, например, /sam/album/). Вместо этого синтаксиса применяйте inurl:.

inurl: ограничивает поиск URL и web - страницами. Этот синтаксис обычно хорошо работает для нахождения страниц поиска и помощи, поскольку они, как правило, связаны между собой.

allinurl: разновидность элемента in*

Примеры: inurl:help

allinurl:search help

Применение inurl: вместо site: в запросе имеет одно преимущество: вы получаете возможность искать подкаталоги.

Элементы inurl: и site: можно комбинировать, чтобы получить информацию о поддоменах, например:

site:oreilly.com –inurl:www.oreilly.com – данный запрос указывает Google выдать список всех страниц с доменом oreilly.com, но пропустить страницы с поддомена www.oreilly.com.

link: возвращает список страниц, связанных с указанным URL. Синтаксис link: одинаково хорошо работает и с «глубокими» URL вроде http://www.raelity/org/apps/bloshom/. Префикс http:// игнорируется.

Пример: Запрос link:www.google.com возвращает перечень страниц, связанных с главной страницей Google.

cache: позволяет отыскать в кэше копию проиндексированной Google страницы, даже если она не доступна по первоначальному URL или ее содержание давно изменилось.

За ссылкой "Сохранено в кэше" кроется версия страницы на момент ее последней индексации. Google использует сохраненное в кэше содержание для оценки релевантности страницы относительно запроса поиска. При просмотре страницы из кэша сверху появится заголовок, где указано, что, возможно, это не самая последняя версия страницы.

Ссылка "Сохранено в кэше" не показывается для сайтов, которые еще не были проиндексированы, а также для тех, чьи владельцы запросили Google не сохранять в кэше содержание их сайтов.

Пример: cache:www.yahoo.com

Кэш Google особенно полезен для извлечения предыдущих версий страниц, которые часто меняются.

filetype: ищет суффиксы или расширения файлов. Как правило, поиск файлов с различными расширениями дает различный результат (к примеру, filetype:htm и filetype:html). Вы можете даже искать генераторы страниц, такие как ASP, PHP, CGI и др., если сайт не скрывает их за переадресацией и прокси – серверами.

Помимо HTML страниц, в Google можно искать файлы в двенадцати других форматах. Вдобавок к документам PDF, можно вести поиск по документам Microsoft Office, PostScript, Corel WordPerfect, Lotus 1-2-3 и многим другим.

Google также предоставляет функцию "В виде HTML", позволяя пользователям видеть содержание файлов в этих форматах, даже если у них не установлена соответствующая программа. Эта функция также позволяет уберечься от вирусов, которые иногда содержатся в файлах определенных форматов.

Дополнительные типы файлов обеспечивают пользователям Google более широкий обзор содержания, доступного во всемирной сети Интернет. Со временем список доступных форматов файлов в Google будет расширяться.

Примеры: homeschooling filetype:pdf

“leading economic indicators” filetype:ppt

related:, как и следует ожидать, находит страницы, связанные с указанными страницами. Это отличный способ искать категории страниц.

Пример: Поиск related:google.com возвращает множество поисковиков, например Lycos, Yahoo! и др.

info: выдает страницы, содержащие больше информации относительно указанного URL: ссылки на кэш, список страниц, связанных с этим URL, и страницы, содержащие сам URL.

Примеры: info:www.oreilly.com

info:www.nytimes.com/technology

define: выдает определения слов. Чтобы получить определение слова или фразы, нужно просто ввести слово define: и требуемое слово или фразу. Если Google найдет определение слова или фразы в Интернете, эта информация будет выведена на странице результатов поиска.

Пример: define: парадигма

movie: этот синтаксис находит обзоры фильмов, опубликованные в Web.

Пример: movie:97333

movie:corvallis

music: позволяет искать информацию, связанную с музыкой. Вы получаете информацию, разделенную по темам: артисты, альбомы, стихи, и каждую тему можно исследовать более подробно.

Пример: music:pink floid

Комбинация синтаксисов. Были времена, когда специальные синтаксисы Google не комбинировались, и пользователям приходилось ограничиваться одним синтаксисом на запрос. С тех пор многое изменилось. Еще остаются отдельные элементы, которые не комбинируются с другими, однако большинство работают совместно. Толковая комбинация синтаксисов способна значительно сузить область поиска.

Существует несколько простых правил, которые необходимо соблюдать при комбинации синтаксисов. Они по большей части определяются налагаемыми ограничениями:

· не смешивать элементы, которые сводят на нет действие друг друга, например:
site:ucla.edu –inurl:ucla

· не злоупотреблять единственным синтаксисом, например: site:com site:edu. Чтобы ограничить поиск двумя сайтами, используйте синтаксис вроде
perl (site:edu OR site:com)

· не применяйте синтаксисы allinurl: или allintitle: совместно с другими. Вместо этого воспользуйтесь inurl: или intitle:

· не используйте много синтаксисов одновременно – это слишком сужает область поиска.

Если вам необходимо сузить область поиска, лучшее, что доступно, это синтаксисы intitle: и site: birth intitle:search intitle:records site:tx.us

Иногда вам требуется отыскать определенный тип информации, но вы не хотите ограничивать область поиска только заголовками. Тогда поиск нужно сузить по теме, например, искать текст внутри URL: intitle:neurosurgery inurl:help.

Нельзя комбинировать друг с другом элементы, которые запрашивают особую информацию, такие как rphonebook:, bphonebook:, phonebook:, movie:, music:, define:. Отдельно следует использовать также синтаксис link:.

В зависимости от вида поиска, который требуется, понадобятся различные образцы комбинаций синтаксисов. Иногда, к примеру, следует сфокусироваться на PDF – файлах (fyletype:pdf), чтобы отыскать именно те документы, которые нужны. Или следует обратить на особые типы файлов с конкретных доменах (filetype:ppt site:tompeterw.com). Экспериментируйте, комбинируйте синтаксисы так, как это требуется для поисков.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...