Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Проблемы с авторскими правами

Поиск Яндекса

Поиск Яндекса позволяет искать документы на русском, украинском, белорусском, казахском, английском, немецком и французском языках с учётом морфологии этих языков и близости слов в предложении.

С начала 2006 года по 2009 год поиск «Яндекса» был установлен на портале Mail.ru.

 

Охват форматов

Помимо веб-страниц в формате HTML, Яндекс индексирует документы в форматах PDF (Adobe Acrobat), Rich Text Format (RTF), двоичных форматах Word (.doc), Excel (.xls), PowerPoint (.ppt), Flash (.swf), RSS (блоги и форумы).

Язык поисковых запросов

Отличительная особенность Яндекса — возможность точной настройки поискового запроса. Это реализовано за счёт гибкого языка запросов. Так, например, для операции исключения можно указать область действия: запрос A ~~ B найдёт документы (страницы), в которых присутствует А, но не присутствует В, а запрос А ~ Б — документы, где слово Б не присутствует со словом А в одном предложении. Аналогично, оператор & ищет сочетания ключевых слов в предложении, а && — во всём документе.

Оператор! позволяет отключить морфологию для конкретного слова, а!! позволяет указать нормальную форму, что позволяет обойти некоторые проблемы связанные с омонимией. Например запрос!!Иванов будет находить Иванова и Ивано́вых, но не Ивана.

Результаты поиска

По умолчанию Яндекс выводит по 10 ссылок на каждой странице выдачи результатов, в настройках результатов поиска можно увеличить размер страницы до 20, 30 или 50 найденных документов. Иногда порядок сайтов на этих страницах может отличаться, так как обновление баз для этих результатов происходит не одновременно.

Если по запросу найдено очень много ссылок, страница результатов предлагает ограничить диапазон поиска — по региону (то есть по диапазону IP) или по дате. Если по какому-либо слову или словам ничего не найдено, предлагается заменить его/их на похожие (поскольку предлагаемые варианты зависят от частоты нахождения похожих слов, иногда возникают забавные ситуации). Также, предлагается исправить слова, набранные не в той раскладке клавиатуры.

 

 

Качество поиска

Время от времени алгоритмы Яндекса, отвечающие за релевантность выдачи, меняются, что приводит к изменениям в результатах поисковых запросов. Последнее такое изменение произошло в ноябре 2009 года, когда была выложена обновленная версия поисковой программы «Снежинск». В частности, эти изменения направлены против поискового спама, приводящего к нерелевантным результатам по некоторым запросам.

Индексирование в поисковых системах — процесс добавления сведений (о сайте) роботом поисковой машины в базу данных, впоследствии использующуюся для (полнотекстового) поиска информации в проиндексированных сайтах.

В сведения о сайте чаще всего входят ключевые слова (алгоритм определения ключевых слов зависит от поисковой системы), статьи, ссылки, документы, также могут индексироваться изображения и т. д.

 

 

Сайты, которые «Яндекс» не индексирует или ограничивает ранжирование:

1. Копирующие или переписывающие информацию с других ресурсов и не создающие оригинального контента.

2. Единственной целью которых является перенаправление пользователя на другой ресурс, автоматически (редирект) или добровольно.

3. С автоматически сгенерированным (бессмысленным) текстом.

4. С каталогами (статей, программ, предприятий и т. п.), если они являются только агрегаторами контента, не создают тексты и описания самостоятельно и не предоставляют никакого уникального сервиса.

5. С невидимым или слабовидимым текстом или ссылками.

6. Отдающие разный контент пользователям и роботам поисковых систем (клоакинг).

7. Предоставляющие товары или информацию по партнерским программам, но не представляющие никакой ценности для пользователя.

8. Использующие обманные техники (например, вредоносный код, скрипты, настройки серверов), перенаправляющие пользователей на сторонние ресурсы или меняющие окно результатов поиска на страницы других ресурсов при переходе из поисковых систем.

9. Содержащие списки поисковых запросов (многократное повторение и перечисление ключевых слов), предназначенные исключительно для обмана поисковой системы и манипулирования результатами ее работы, в том числе использование элементов страниц, скрывающих ключевые слова, например, посредством скроллинга или других технических приемов.

10. Группы сайтов одного владельца/компании, предоставляющие пользователю одни и те же товары или услуги, созданные с целью заполнения нескольких позиций в результатах поиска и сбора трафика.

11. Немодерируемые форумы, доски объявлений, содержащие большое количество ссылочного спама.

12. Ставящие внешние ссылки исключительно для обмана поисковых систем и «накачивания» релевантности и не являющиеся рекомендацией автора посетить ресурс.

13. Сайты или группы сайтов, интенсивно ссылающиеся друг на друга (линкфармы).

14. Страницы сайта с результатами поиска.

Веб-сервисы

Информационно-поисковые

  • Поиск и ya.ru
  • Каталог — каталог веб-сайтов с сортировкой по индексу цитирования. Пополняется вручную редакторами каталога, имеется возможность платной регистрации.
  • Новости — главные новости дня, полученные из основных СМИ, представленных в Интернете. Есть возможность поиска по новостям, а также подписки на новости по заданному поисковому запросу.
  • Поиск по блогам и форумам — поиск по ресурсам, имеющим RSS-представление, а также рейтинг актуальных запросов, популярных категорий и новостей.
  • Маркет — поиск предложений по продаже товаров и услуг, подбор моделей.
  • Словари — энциклопедии, справочники, словари-переводчики.
  • Картинки — поиск изображений.
  • Видео — поиск роликов, видеохостинг.
  • Карты — карты мира и России, карты крупных городов РФ (с точностью до дома), поиск по карте, информаци о пробках, прокладка маршрутов и панорамы улиц Москвы, Санкт-Петербурга и Киева.
  • Афиша — информация о доступных мероприятиях: кино, театр, концерты, спорт, клубы и т. д.
  • Погода — прогноз погоды.
  • Телепрограмма — программы центральных, региональных и спутниковых каналов ТВ.
  • Расписания — расписания поездов, самолётов и пригородных электричек.
  • Авто — поиск по объявлениям о продаже автомобилей.
  • Книги — поиск книг, изданий и авторов.
  • Время — разница во времени между городами.
  • Музыка — поиск музыки.

Персонализированные

  • Почта — электронная почта.
  • Я.ру — блоговый сервис.
  • Фотки — фото-хостинг.
  • Народ — бесплатный хостинг для персональных интернет-страниц, а также служба хранения файлов.
  • Деньги — платёжная система, позволяющая оплачивать товары и услуги в Интернете.
  • Открытки — сервис для отправки электронных открыток
  • Закладки — система хранения закладок, интегрированная с «Яндекс. Баром».
  • Подписки — подписка на новости.
  • Лента — онлайновый RSS-ридер.
  • Мои находки — история поисковых запросов.
  • Мой Круг — социальная сеть, приобретена Яндексом в марте 2007.
  • Ответы — Яндекс. Ответы

Другие

  • Вебмастер — сервис для владельцев сайтов. Настройка индексирования, региона, отслеживание позиций в результатах поиска.
  • Города — Интернет-индексы городов России.
  • Тариф — поиск по тарифам интернет-провайдеров.
  • Открытки
  • Игрушки
  • Весна — автоматическая генерация философских эссе.
  • Интернет — измеряет скорость интернет соединения.
  • Локальная сеть Яндекса — предоставляет возможность пользоваться всеми сервисами Яндекса не по федеральному, а по локальному тарифу.
  • Метрика — позволяет измерять трафик, анализировать поведение пользователей и оценивать эффективность рекламных кампаний.
  • Рекламная сеть Яндекса — система, позволяющая владельцам сайтов зарабатывать, размещая блоки Яндекс. Директ на своих сайтах.
  • Яндекс.Директ — система размещения контекстной рекламы с оплатой по кликам.
  • Игра в города на Яндексе — игра в города на Яндекс. Картах.
  • Поиск для сайта — сервис организации поиска по сайту.

Программные продукты

  • Спам-фильтр Спамоборона для корпоративного использования.
  • Программа для поиска файлов Yandex Desktop Search на компьютере.
  • Программа мгновенного обмена сообщениями Я.Онлайн на основе Jabber. Позволяет также получать уведомления о новых письмах из Яндекс. Почты и других почтовых сервисах, о новых событиях с сайтов Одноклассники.ru и ВКонтакте.
  • Программа Punto Switcher — автоматический переключатель раскладки.
  • Виджеты для операционных систем Mac OS X, Windows Vista и Windows 7, а также для браузера Opera: Поиск, Пробки, Часы, Новости, Погода.
  • Яндекс ICQ — специальная версия клиента ICQ c символикой и интеграцией некоторых сервисов от Яндекса.
  • Яндекс. Сервер — продукт для корпоративного поиска и/или поиска по сайту.
  • Яндекс. Фотки — фоторедактор
  • Яндекс. Бар — тулбар для Internet Explorer и Firefox.

 

 

Google

Google (произносится /ˈguːgl/, «гугл») — первая по популярности (77,05 %) в мире поисковая система, обрабатывающая более 40 миллиардов запросов в месяц (доля рынка 62,4 %).

Поисковой системой Google владеет корпорация Google Inc.

Индексирует более 8 миллиардов веб-страниц. Google может находить информацию на 191 языке (на 15 октября 2009).

Поддерживает поиск в документах форматов PDF, RTF, PostScript, Microsoft Word, Microsoft Excel, Microsoft PowerPoint и других.

Индексация сайтов

Поисковый робот Google имеет User Agent — Googlebot, который является основным роботом, сканирующим содержание страницы для поискового индекса. Помимо него существуют ещё несколько специализированных роботов:

  • Googlebot-Mobile — робот, индексирующий сайты для мобильных устройств,
  • Google Search Appliance (Google) gsa-crawler — поисковой робот нового аппаратно-программного комплекса Search Appliance,
  • Googlebot-Image — робот, сканирующий страницы для индекса картинок,
  • Mediapartners-Google — робот, сканирующий контент страницы для определения содержания AdSense,
  • Adsbot-Google — робот, сканирующий контент для оценки качества целевых страниц AdWords.

Существует теория эффекта песочницы, которая утверждает, что сайты, которые имеют новые доменные имена, частые смены владельцев или нэймсерверов, помещаются в «песочницу» (зону ожидания) и пребывают там, пока механизм Google не сочтёт сайт готовым из неё выйти.

Также существует обратная теория, называющаяся «бонус новичка», в которой при первоначальной индексации сайта, в силу некоторых аспектов (например нескольких ссылок с авторитетных ресурсов), сайту сразу присваивается высокий Page Rank и хорошие места в поисковой выдаче. По истечении некоторого времени, после снятия этого эффекта сайту присваиваются его реальные показатели.

Проблемы с авторскими правами

KaZaA и Церковь Сайентологии использовали Закон об авторском праве в цифровую эпоху (DMCA), чтобы потребовать от Google удалить ссылки на материалы на их сайтах якобы защищённые авторским правом. Google по закону обязан удалить эти ссылки, но вместо того, чтобы убрать результаты поиска, предпочитает связать результаты с жалобами, которые подали эти организации.

New York Times жаловалась на то, что кэширование их содержания поисковым роботом — особенность, используемая поисковиками, в том числе Google Web Search, нарушает авторские права. Google соблюдает стандартные Интернет-приёмы для запросов об отключении кэширования посредством файла robots.txt — стандартного механизма, позволяющего администраторам веб-сайта потребовать исключения своего сайта или его части из результатов поиска — или через мета-теги, позволяющие редактору контента указать, можно ли индексировать или архивировать документ и можно ли проходить по ссылкам в документе. Окружной суд США штата Невада постановил, что кэши компании Google не нарушают авторских прав согласно американскому законодательству в делах Field v. Google и Parker v. Google.

PageRank

Google использует алгоритм расчёта авторитетности PageRank. PageRank является одним из вспомогательных факторов при ранжировании сайтов в результатах поиска. PageRank не единственный, но очень важный способ определения положения сайта в результатах поиска Google. Google использует показатель PageRank найденных по запросу страниц, чтобы определить порядок выдачи этих страниц посетителю в результатах поиска.

Синтаксис запросов

Интерфейс Google содержит довольно сложный язык запросов, позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и т. д.

Поиск в найденном

Для некоторых результатов поиска Google предоставляет повторное поле для поиска, которое позволяет пользователю найти то, что он ищет внутри конкретного веб-сайта.

Голосовой поиск

22 сентября компания запустила голосовой поиск в России. Чтобы осуществить поиск необходимо нажать в телефоне кнопку рядом со строкой поиска и произнести свой запрос, телефон отправит ваш голос на сервер и браузер выдаст строку с распознанным вашим запросом и результатами поиска по нему.

 

 

Рамблер

Rambler Media Group (AIM: RMG) — интернет-холдинг, включающий в качестве сервисов поисковую систему, рейтинг-классификатор ресурсов российского Интернета, информационный интернет-портал.

Поисковая система Рамблер понимает и различает слова русского, английского и украинского языков. По умолчанию поиск ведётся по всем формам слова. По умолчанию в Рамблере результаты ранжируются по степени соответствия (релевантность) запросу и группируются по сайтам.

Настройки языка поиска: любой, русский, английский, украинский. Учитывается морфология.

Rambler создан в 1996 году.

Сервисы

Поиски и рейтинги

1. Rambler — Глобальный поиск;

2. R0.ru — Легкая версия поиска;

3. Top100 — Тематический рейтинг сайтов;

4. Видео — Поиск среди более тридцати миллионов видео-роликов;

и другие

Товары и услуги

1. Rambler-Plus — Система онлайн-платежей;

2. Путешествия — Туры и туроператоры;

3. Недвижимость — Покупка, продажа, аренда собственности;

и другие

Новости

Развлечения

1. Игры — Сотни популярных игр;

2. Фото — Личные архивы цифровых фотографий;

3. Аудио — Радио, MP3, аудиокниги;

4. Открытки — Виртуальные поздравления на все случаи жизни;

5. Видео — Архив видео-изображений;

и другие.

 

Общение

1. Virtus — Центр виртуального общения;

2. Рамблер Друзья — Собери друзей в онлайне;

3. Почта — Обмен сообщениями по электронной почте;

и другие.

Инструменты и сервисы

1. Карты — Наши пробки точнее;

2. Словари — Перевод английских и немецких слов;

3. Мобильная версия — Рамблер в твоем телефоне;

и другие.

 

4. Каталоги ресурсов. Метапоисковые системы

Каталог Интернет-ресурсов, или просто Интернет-каталог (англ. web directory), — структурированный набор ссылок на сайты с кратким их описанием. Сайты внутри каталога разбиваются по темам, а внутри тем могут быть ранжированы или по индексу цитирования (как в каталогах Яндекса или Google), или по дате добавления, или по алфавиту, или по другому параметру. Это один из старейших сервисов Интернета. Подавляющее большинство рейтингов посещаемости ресурсов имеют классификатор сайтов, но ранжирование всегда основано на посещаемости сайтов. В зависимости от широты тематики ссылок каталоги могут быть общими и специализированными (тематическими).

Они были созданы для того, чтобы упростить задачу навигации по существующим ресурсам. Наиболее известными каталогами являются Yahoo! и каталог поисковой системы Яндекс.

Занесение сайтов в каталог, как правило, производит редактор соответствующей рубрики (модератор). Чаще всего используется процедура регистрации сайта его владельцами с последующей работой редактора. Модераторами также оценивается и полезность ресурса, в результате чего каждый ресурс получает экспертную оценку, которая помогает пользователям находить наиболее авторитетные сайты по интересующим их темам.

Регистрация сайта в каталогах может быть платной и бесплатной.

Поисковые каталоги полезно использовать для ознакомления с новой тематикой, так как в каталоге уже отобраны и отсортированы самые лучшие сайты по теме.

 

Каталоги

Глобальные каталоги

1. Каталог Yahoo

2. DMOZ

Русскоязычные каталоги

1. Каталог@mail.ru

2. Яндекс.Каталог

3. RIN

 

Метапоисковая система - это поисковый инструмент, посылающий запрос одновременно на несколько поисковых систем, каталогов. Собрав результаты, метапоисковая система удаляет дублированные ссылки и, в соответствии со своим алгоритмом, ранжирует результаты в общем списке.

В отличие от отдельных поисковых машин и каталогов, метапоисковые системы не имеют собственных баз данных и не регистрируют URL сайтов. Метапоисковые системы экономят достаточно много времени, избавляя от необходимости вводить запрос в каждой отдельной поисковой системе. Результаты, в большинстве случаев - в высшей степени релевантны. Метапоисковые системы могут использоваться веб-мастерами для выяснения, присутствует ли их сайт в главных поисковых системах, какие у него рейтинги и насколько популярны ссылки.

 

Контрольные вопросы

1. Что является «спайдером» в поисковых машинах?

2. Обрабатывая конкретный запрос пользователя, поисковая система оперирует своими внутренними ресурсами или всеми ресурсами Интернета?

3. Индексирует ли Яндекс сайты не создающие оригинального контента?

4. Приведите рейтинг основных поисковых систем за последний месяц.

 


1.Всемирная паутина, Веб, World Wide Web, WWW - распределенная глобальная информационная сеть, которая характеризуется клиент-серверным принципом организации составляющих ее узлов, ориентацией на гипермедийный (текст, звук, графика) и гипертекстовый вид информационных ресурсов, а также отсутствие ограничений региональными или административными границами (глобальное распространение, действие и использование).

[2] FTP-сервер - сервер, обеспечивающий обмен файлами по протоколу FTP.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...