Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Первый запрос – Авторское право

Кафедра информационных технологий и управляющих систем

 

ОТЧЁТ ПО ЛАБОРАТОРНОЙ РАБОТЕ (ПРАКТИЧЕСКОЙ РАБОТЕ) № 01

 

По дисциплине «Основы научного поиска в мировых Web ресурсах»

 

Группа БМО-01

 

 

Студент: Дьячкова С.С. _____________________________

(подпись, дата)

 

Оценка работы____________

 

Преподаватель: Стреналюк Ю.В. _____________________________

(подпись, дата)

 

Королев, 2012

 

 

Лабораторная работа № 1

Обзор и анализ информационно поисковой системы Yandex

1. В качестве информационной потребности данной работы выступает поиск статей по авторскому праву (интеллектуальной собственности) и его защите. Тема магистерской диссертации «Разработка методов защиты интеллектуальной собственности (авторских прав) в ВУЗе»

2. Поисковые запросы:

- Авторское право;

- Интеллектуальная собственность;

- Защита интеллектуальной собственности;

3. Описание интерфейса поисковой системы Яндекс:

Яndex - это полнотекстовая вербальная ИПС (информационно-поисковая система) с использованием избыточного индексирования с учетом морфологии русского языка. ИПС подразумевает предварительную обработку текста, в том числе составление некоторого индекса, по которому затем происходит поиск. ИПС может быть организована как БД (база данных) с текстовыми полями. Другой вариант организации ИПС - работа с внешними текстами. В этом случае тексты остаются "как есть" - то есть файлами в файловой системе, страницами на сервере или полями какой-то БД, а не затягиваются внутрь системы.

Полнотекстовый поиск - поиск по текстовым документам различных форматов. Это могут быть текстовые поля баз данных, тексты стандартных форматов - txt, doc, html, rtf, xls. Под текстом подразумевается набор слов (выделенную по некоторым правилам последовательность букв), чисел и марок (смеси букв и цифр или букв разных алфавитов).

Система с учетом морфологии языка умеет для всех слов этого языка делать анализ, то есть понимать, формой какого слова они являются. Каждое слово языка в начальной форме имеет парадигму - совокупность всех своих словоформ, полученных при изменении слова по числам, падежам, родам и временам.

При вводе адреса www.yandex.ru в адресную строку окна Microsoft Internet Explorer загружается начальная страница информационно-поисковой системы Yandex с разнообразными гиперссылками, закладками и поисковой строкой.

Режим простого поиска заключается в том, что в строку поиска вводится одно слово или их совокупность (словосочетание) в том виде, в котором оно слышится или произносится пользователем на самом деле. В результате такого поиска поисковая система по заданному запросу находит ответ в своей БД и выдает пользователю ранжированный по релевантности список всех адресов серверов, на которых “по мнению поисковой системы” находится искомая информация (где употребляется хотя бы одно из введенных пользователем слов). При этом могут быть найдены адреса серверов с совершенно посторонней (ненужной) информацией.

Строгий поиск требует ввода в строку поиска кроме самих слов специальных символов и знаков, которые позволяют поисковой системе более точно находить именно те документы, которые необходимы пользователю, и выдавать их для просмотра в удобной для пользователя последовательности. В результате поиска пользователь получает в распоряжение группу адресов серверов с конкретной информацией на конкретную тему без лишней информации.

Глубина поиска – количество найденных документов по заданному запросу. Если документов много – большая глубина поиска (плохо), если документов мало – малая глубина поиска (хорошо).

Язык запроса - AND, OR, NOT. Поиск по точной словоформе. Возможность поиска с расстоянием. Поддержка скобочных выражений. Поиск в заголовках и ссылках. Есть возможность поиска на естественном языке без использования логических операторов.

Вывод информации - Название документа, размер файла, URL, дата последнего обновления, степень соответствия запросу, кодировка. Подсветка искомых слов в найденных документах. Есть возможность поиска похожих документов и повторного поиска только в найденных документах

 

4. Тип доступных документов: doc, pdf, html, rar, txt, rtf

5. Формирование простых поисковых запросов и поисковых запросов с вводом логических функций:

Первый запрос – Авторское право

 

 

 

Результат поиска: 149 млн ответов

Результат поиска: страниц — 149 170 355,

сайтов — не менее 60 523.


Статистика слов: право — 1 637 244 054, авторское — 203 650 866.

В данном случае система находит документы, в которых в одном предложении встречаются все слова “авторское” и “право”.

Результат поиска самый большой. Причем будут найдены слова как с большой, так и с маленькой буквы.

 

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...