Поисковые системы русскоязычного пространства Интернета и глобальные (англоязычные поисковые) системы
Стр 1 из 2Следующая ⇒ ТЕХНОЛОГИИ ПОИСКА ТЕМАТИЧЕСКОЙ ИНФОРМАЦИИ В СЕТИ INTERNET
Представление о контекстном поиске Контекстный поиск - поиск по текстам документов (комментариев). Производится при выборе условия поиска «Поиск по тексту». При вводе поисковой фразы система дает предупреждение о «шумовых словах», используемых в запросе. Такие слова выделяются цветом, появляется предупреждающее сообщение, и при поиске они будут отброшены. Кроме этого при вводе запроса автоматически подключается словарь (тезаурус) словоформ, что, с одной стороны, позволяет упростить процесс составления (ввода) поисковой фразы (пользователь выбирает предлагаемые системой слова, заведомо содержащиеся в базе данных), а с другой стороны, система сразу выделит во введенной поисковой фразе слова, которых нет в текстах базы данных. Существует несколько видов контекстного поиска (Рисунок 4)
Рисунок 4. Виды контекстного поиска Алгоритм контекстного поиска Алгоритм контекстного поиска следующий: ¾ в слове (словах поисковой цепочки) выделяется основа (в каждом слове отбрасываются окончания); ¾ порядок слов в поисковой фразе не важен, слова фразы объединяются по принципу логического “И”; ¾ система воспринимает группу слов, заключенных в кавычки, как задание найти тексты, в которых искомые слова находятся рядом (составляют фразу); ¾ в поисковой фразе не пропускаются “шумовые слова”. В поисковой фразе контекстного поиска возможно использование чисел и буквенно-цифровых последовательностей (номера документов, химические формулы и т.п.). Допустимыми символами для таких последовательностей являются буквы русского и латинского языка, дефис, наклонная и обратная черта (“\” и “/”).
Запросы и их виды Как говорят, сколько людей, столько и мнений. Кому то интересна одна тематика, кому-то другая – один ищет одни ответы на свои вопросы, второй на другие. У каждого пользователя поисковой системы свои задачи, которые он хочет решить. Для этого он набирает свой запрос. Он может отличаться от запросов других людей по количеству слов, по смыслу, по популярности, с привязкой на определенную местность и т.д. Поэтому в поисковом продвижении всевозможные слова четко классифицированы. Знание классификации поисковых запросов крайне важно для успешного создания семантического ядра. Поэтому рассмотрим виды запросов. Длина Бывают однословные, двусловные, трехсловные и многословные. Стоп-слова (местоимения, предлоги, союзы и междометия) не учитываются при подсчете. Чем больше слов в запросе, тем он точнее, соответственно проще пользователю поисковой системы найти необходимую информацию. Например: мебель, мягкая мебель, мебель для детской комнаты, интернет магазин мебели в Шадринске. Четкость Здесь все поисковые фразы делятся на четкие и нечеткие. Конкретный запрос подразумевает конкретный ответ. Если вопрос расплывчатый, поисковая система выдаст пространственный ответ на похожие темы запроса. Например, запросы “фильмы Октябрь” и “фильмы в кинотеатре Октябрь” отличаются только одним словом, но именно это слово в корне меняет смысл вопроса. Пользователь получит на них совершенно разную выдачу. В первом случае появятся ссылки на все киноленты, которые показывались (или будут показываться) в октябре месяце или будут в своем названии содержать слово “октябрь”. Во втором случае выйдет список на документы о кинолентах в кинотеатре Октябрь. Частотность Это число, которое показывает сколько раз эту поисковую фразу спрашивали пользователи поисковых систем в течение месяца. Соответственно, чем оно больше, тем популярней тема вопроса. Различают высоко- средне- и низкочастотные запросы. Для каждой тематики эти показатели очень разные и зависят от ее конкурентности и популярности. Например, для популярной тематики “вязание спицами” высокочастотные слова начинаются с 10000, а низкочастотные доходят до 2500.
Конкурентность Этот параметр показывает популярность тематики и коренным образом влияет на сложность продвижения целевой страницы по этому запросу. Чем важней тема вопроса, тем больше средств необходимо вложить для продвижения целевой страницы в топ-10. Это обычно ключевые слова, которые относятся к товарам и услугам. Различаются на высоко- средне- и низкоконкурентные запросы. Но их градация не такая же, как в параметре частотности. Высококонкурентное слово может быть как высокочастотным, так и средне- и низкочастотным. Но далеко не всегда низкочастотное слово может быть высоко- и средне-конкурентным. Обычно, в 85% оно низкоконкурентное. Зависимость от географии Существуют геозависимые и геонезависимые поисковые фразы. Если запрос включает в себя точное местонахождение (обычно это город в Рунете) или сам запрос не требует указания местонахождения, то такой вопрос является геонезависимым. Если же запрос подразумевает уточнение пункта местности, то он является геозависимым. Например, ключевой запрос “заказ пиццы в Шадринске” геонезависимый, потому что он указывает местность. “Рецепт пиццы” тоже не зависит от точного пункта назначения, потому что пользователю поисковой системы не важно, в каком городе делается пицца – в каждом городе эти рецепты одни и те же. А вот запрос “заказ пиццы” является геозависимым, потому что подразумевает задание конкретного адреса. Целевая составляющая Это самый важный параметр, который показывает принадлежность запроса к определенному виду цели, которую хочет достичь пользователь поисковой системы. Бывают информационными, навигационными, транзакционными, мультимедийными, общими и служебными. ¾ навигационный запрос показывает пользователю информацию о конкретном месте в сети Интернет. Например, это может быть веб-ресурс какой-то компании или ссылка на известный сайт или географический документ. Например, “город Москва” или “официальный сайт компании Sony”;
¾ информационный запрос необходим тогда, когда пользователь желает найти конкретную информацию или сведения в Интернете. Почти всегда пользователь не знает, где именно искать, но зато точно понимает, что именно он хочет увидеть. Именно по таким запросам продвигаются различные информационные порталы и большинство блогов; ¾ транзакционный запрос подразумевает под собой определенное действие, которое хочет совершить пользователь поисковой системы. Такие поисковые запросы, как “заказать книгу” или “купить детскую кровать” показывают желание человека сделать транзакцию; ¾ мультимедийный запрос говорит о том, что пользователь поисковика ищет аудио, видео или графический файл в Интернете. Раньше такой запрос просто входил в группу транзакционных, но в последнее время с увеличением мультимедийного контента он стал входить в отдельную группу. ¾ общий запрос получается у пользователей, которые не выражают какую-либо конкретику, когда запрашивают у поиска необходимую информацию. Обычно такой запрос отражает общее понятие и часто состоит из одного или двух слов; ¾ служебный запрос часто используют специалисты и профессионалы определенных видов деятельности. Из-за своей специфичности их используют только для продвижения сайтов узконаправленной тематики. Подразделение по стадии поиска Есть еще важная градация запросов, которые используются для продвижения продающих страниц. Эти страницы содержат в себе контент конкретной услуги или товара. Для успешной реализации покупателя ведут по 4-м стадиям продаж: сначала посетителю рисуют проблему, потом находят решение этой задачи, выбирают вариант ее решения и в конце приводят к форме подписки, покупки и т.д., где он выполняет конечную транзакцию. Соответственно по всем этим стадиям пользователь поисковой системы задает конкретный запрос. Сезонность
Очень важный момент, который необходим для правильного продвижения информационных сайтов многих тематик. Дело в том, что есть такие ключевые слова, которые актуальны только в определенное время года (дни, недели или месяцы). Поиск методом исключений Поисковая система реализует возможность задания сложных поисковых запросов, позволяющих находить сообщения по содержащимся в них словам или фразам, а также по значению определенных свойств, таких, как источник, сайт, домен, страна, язык, сюжет, категория, дата публикации или обнаружения. Выражение формируется из операторов, принадлежащих трем классам: базовые, логические и ограничивающие. Базовые операторы возвращают списки сообщений по определенным ключам, таким, как слово, источник или сайт. Набор базовых операторов продиктован внутренней структурой хранения информации в системе. Логические операторы позволяют комбинировать выражения, объединяя, пересекая результаты поиска, либо исключая один результат из другого. Ограничивающие операторы сужают результат поиска, фильтруя найденные сообщения по указанным критериям. Синтаксис поискового запроса: Обычно запрос представляет из себя просто одно или несколько слов, например, контактная информация. По такому запросу будут найдены страницы, на которых встречаются оба слова запроса. Логические операторы (Табл.7) позволяют строить более сложные запросы, например: контактная информация или телефон. По такому запросу будут найдены страницы, на которых встречаются либо слова "контактная" и "информация", либо слово "телефон". По запросу контактная информация не телефон будут найдены страницы, на которых встречаются либо слова "контактная" и "информация", но не встречается слово "телефон".Вы можете использовать скобки для построения более сложных запросов. Таблица 4. Логические операторы
Поисковые системы русскоязычного пространства Интернета и глобальные (англоязычные поисковые) системы Rambler Поисковая система Rambler - сервер компании <Стек> из города Пущино (автор - Дмитрий Крюков). Она является одной из наиболее популярных и мощнейших систем и содержит данные о сотнях тысяч документов. Поиск осуществляется на страницах серверов сети Internet в пределах бывшего СССР. Rambler производит сканирование и индексацию страниц серверов, накапливает данные и позволяет осуществлять поиск в своей базе данных через Web-интерфейс. При организации запросов могут быть использованы как русские так и английские слова и словосочетания. Осуществляя запрос пользователь может применять операторы И (&) и ИЛИ (|), а также символы *,? и () для группы слов. Также эта поисковая система предоставляет возможность поиска в телеконференциях relcom.
Адрес системы: http://www.rambler.ru Апорт! Система <Апорт!> разработана компанией <Агама>. Она выполняет поиск по серверу <Агама> и по другим российским серверам. Эта поисковая система предоставляет самые широкие возможности при организации запросов и позволяет задавать слова для поиска в любой грамматической форме. При осуществлении запроса допускается использование операторов Ии ИЛИ, символа *, двойные кавычки для поиска по целой фразе, а также фигурные и квадратные скобки, задающие длину контекста в предложениях и в словах соответственно. Также возможен автоматический перевод запроса с русского на английский язык (и наоборот) и поиск документов с искомыми словами на двух языках одновременно. Адрес системы: http://russia.agama.com/aport/ Русская машина поиска Поисковая система <Русская машина поиска> разработана российской компанией RusInfOil. Она выполняет поиск русскоязычных материалов по ключевым словам на страницах WWW-серверов России, стран бывшего СССР и ориентированных на Россию зарубежных сайтов. К основным инструментам составления запроса относятся: операторы Ии ИЛИ, возможность ограничения поиска и возможность задания вероятного числа ошибок. Адрес системы: http://search.interrussia.com TELA Разработанная петербургским провайдером <Дукс> поисковая система TELA позволяет производить поиск по ключевым словам русскоязычных страниц в WWW и англоязычных страниц на российских серверах. Сбор страниц осуществляет подсистема-робот, созданная на базе MOMspider (MultiownerMaintenanceSpider, UniversityofCalifornia), а поисковая часть сервера выполнена на базе системы поиска freeWAIS-sf (UniversityofDortmund). Система TELA предоставляет возможность задавать слова для поиска в произвольной форме благодаря применению русской версии системы поддержки морфологии языка ILIAS. Адрес системы: http://tela.dux.ru UnicorHarvest Поисковая система UnicorHarvest корпорации <УНИКОР> создана на основе системы Harvest и осуществляет поиск по WWW-серверам университетов-участников корпорации <УНИКОР>, а также некоторым другим научным и образовательным российским серверам. Адрес системы: http://www.unicor.ac.ru/search.ru.html Система поиска в телеконференциях relcom Система поиска в телеконференциях relcom является сервером петербургской компании <Дукс>. Эта страница значительно облегчает задачу поиска той или иной информации в русскоязычных телеконференциях. Данное поисковое средство предоставляет возможность поиска по ключевым словам статей по всем конференциям иерархии relcom.* или relcom.commerce.*, по отдельным коммерческим конференциям сети Relcom, а также по петербургским конференциям группы spb.*. Адрес системы: http://www.dux.ru/news.html RussianInternetSearch Система RussianInternetSearch создана и поддерживается в рамках проекта RussianExpress и индексирует не только информацию на российских серверах (России и стран бывшего СССР), но также и все русскоязычные ресурсы, сосредоточенные в зарубежных странах. Поиск информации осуществляется как на серверах, так и на частных Web-страницах. Также возможен поиск по русскоязычным телеконференциям. Адрес системы: http://www.search.ru Конечно же, все существующие русскоязычные поисковые серверы обладают как своими достоинствами так и своими недостатками. Несмотря на значительные достижения российских программистов в области разработки средств, позволяющих быстро отыскать необходимую информацию в базе данных, созданные ими продукты в целом все еще отстают от своих зарубежных аналогов (Altavista, Yahoo, Lycos, Excite, Infoseek и т.д.).
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|