Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Информационный поиск, поиск информации




[information retrieval, data search] -

Процесс нахождения, отбора и выдачи определенной заранее заданными признаками информации (в т.ч. - документов, их частей и/или данных) из массивов и записей любого вида и на любых носителях. Побудительной причиной осуществления информационного поиска является информационная потребность, выраженная в форме информационного запроса. В зависимости от степени привлечения к информационному поиску технических средств и участия в нем человека различают: "ручной", "машинный" и "автоматизированный" информационный поиск. Последний может производиться в режиме диалога или пакетной обработки запросов.

В автоматизированных информационных системах (см. АИС) информационный поиск обеспечивается и осуществляется с привлечением лингвистических, информационных, программно-технических, технологических, организационных средств и составленных из них комплексов {подробнее о них см. раздел II. Автоматизация информационных процессов и информационные системы - Прим. авт.).

Непосредственно информационный поиск производится средствами информационно-поисковой системы, являющейся подсистемой АИС. Основными критериями качества результатов информационного поиска являются полнота, точность и оперативность поиска.

Виды поиска:

Библиографический поиск [bibliographic search/retrieval] - Вид информационного поиска по массивам библиографических описаний документов.

Документальный информационный поиск, поиск документов [document retrieval] - Вид информационного поиска, связанный с процессами нахождения и выдачи документов.

Двоичный поиск [binary search] - Быстрая техника, использующаяся для поиска любой конкретной записи в упорядоченном списке записей.

Фактографический информационный поиск [data retrieval] - Вид информационного поиска, связанный с процессами нахождения и выдачи конкретных (фактографических) данных.

Координатный поиск [coordinate retrieval] - Вид информационного поиска, основанный на использовании координатного индексирования.

Ретроспективный поиск [retrospective retrieval] - Информационный поиск, проводимый о всем накопленном массиве документов или фактов по любому запросу, соответствующему тематике и виду "информационно-поискового массива ".

ТЕОРИЯ ИНФОРМАЦИОННОГО ПОИСКА

[information retrieval theory] -

Раздел Информатики, изучающий и разрабатывающий вопросы построения информационно-поисковых систем (см. ниже) и их использования.

ПОИСКОВАЯ СИСТЕМА [retrieval system] -

Комплекс средств, предназначенный для нахождения и получения (выдачи) необходимых объектов (в т.ч. - изделий, документов, текстов и т.п.), обладающих определенными признаками, соответствующими указанным в запросах. Различают поисковые системы: "ручные", "механизированные", "автоматизированные" и т.п.

ИНФОРМАЦИОННО-ПОИСКОВАЯ СИСТЕМА (ИПС)

[information retrieval system] -

Автоматизированная поисковая система, реализованная на средствах электронной вычислительной техники и предназначенная для нахождения а также выдачи ее пользователям необходимой информации по заданным критериям. ИПС представляет собой совокупность информационно-поискового языка, (программных) средств и правил перевода текстов на этот язык (индексирования), обеспечения их поиска и критериев соответствия. В информационной практике принято многоаспектное использование термина "ИПС", которое связанно с ее абстрактным или материализованным представлениями.

Абстрактное представление ИПС ограничивается рассмотрением информационно-поискового языка, правил индексирования и критериев выдачи (см. ниже). Материализованное представление ИПС включает в это понятие также информационные массивы, их носители (магнитные, оптические диски и т.п.), программные и технические средства. В указанном плане ИПС может рассматриваться как часть системы управления базами данных (см. СУБД).

В зависимости от видов информационных массивов, на работу с которыми ориентирована ИПС, различают документографические (документальные), фактографические, документально-фактографические (интегрированные) ИПС.

Абстрактная информационно-поисковая система [abstract information retrieval system] - Совокупность информационно-поискового языка, методов индексирования и поиска документов и данных.

ОРАС (Online Public Access Catalogue) - Информационно-поисковая система, ориентированная на предоставление услуг доступа конечным пользователям к библиотечным (преимущественно - библиографическим) базам данных в диалоговом ("онлайновом") режиме.

КРИТЕРИЙ [criterion] -

Признак, который при оценке объектов, выполняемой путем сравнения, принимается в качестве наиболее существенного для принятия определенного решения, например, - отбора и последующей выдачи документов из информационного массива при поиске. При информационном поиске используются разнородные критерии и, в частности; критерии "соответствия", "смыслового соответствия" и "формального соответствия" и др. (см. ниже):

Критерий соответствия [match criterion] - Признак или совокупность признаков, по которым определяется степень соответствия между запросом или поисковым предписанием и поисковым образом документа, самим документом или записью его части для принятия решения о выдаче или не выдаче конкретного документа наинформационный запрос, обрабатываемый системой.

Критерий смыслового соответствия, критерий релевантности (документов, данных) [relevansy criterion] - Признак или совокупность признаков, по которым определяется степень смыслового соответствия между содержанием поискового предписания и поискового образа документа, самим документом или записью его части для принятия решения о выдаче или не выдаче конкретного документа на информационный запрос, обрабатываемый системой.

Критерий формального соответствия [formal match criterion] - Признак или совокупность признаков, по которым определяется степень формального соответствия между поисковым предписанием и поисковым образом документа, самим документом или записью его части для принятия решения о выдаче или не выдаче конкретного документа на информационный запрос, обрабатываемый системой.

Релевантность [relevance] - Характеристика степени соответствия смыслового содержания документа, найденного в результате поиска, содержанию информационного запроса.

Пертинентность [pertinence] - Характеристика степени соответствия документа или данных, найденных в результате поиска, информационной потребности пользователя, выраженной в его запросе.

Точность поиска, коэффициент точности поиска/выдачи [precision ratio, accuracy ratio, precision coefficient, accuracy coefficient] - Количественная характеристика результатов информационного поиска. Точность поиска определяется путем деления количества выданных в результате выполнения поиска релевантных (см. релевантность)документов на общее число выданных документов (релевантных и не релевантных). Данный показатель используется также для оценки качества информационно-поисковых систем.

Коэффициент информационного шума, коэффициент шума [noise, noise ratio, noise coefficient] - Количественная характеристика информационного поиска. Коэффициент информационного шума (ИШ) определяется путем деления количества выданных в результате выполнения поиска нерелевантных документов (см. релевантность) на общее число выданных документов (релевантных и не релевантных). Будучи выраженным в процентах, ИШ = 100%;- ТП=0. Данный показатель используется также для оценки качества информационно-поисковых систем.

Полнота поиска, коэффициент полноты поиска [recall, recall ratio, recall coefficient] - Количественная характеристика результатов информационного поиска, которая определяется путем деления количества выданных в результате выполнения поиска релевантных (см. релевантность) документов на общее число релевантных документов, имеющихся в информационно-поисковой системе (выданных и не выданных). Данный показатель используется также для оценки качества информационно-поисковых систем,

Коэффициент потерь [losses coefficent] - Количественная характеристика результатов информационного поиска. Коэффициент потерь (КП) определяется путем деления количества не выданных в результате выполнения поиска релевантных документов (см. релевантность) на общее число релевантных документов, имеющихся винформационно-поисковой системе (выданных и не выданных). Будучи выраженным в процентах, КП = 100% - полнота поиска. Данный показатель используется также для оценки качества информационно-поисковых систем.

Оперативность (время) поиска [seek time] -

1. Время, затрачиваемое на выполнение поиска, с момента формирования задания и выдачи команды на производство поиска до момента получения его результатов;

2. В ЭВМ - Время, затрачиваемое головкой чтения/записи дисковода (накопителя), для того, чтобы достичь определенного элемента данных, записанного на диске, дискете или другом носителе данных внешней памяти ЭВМ.

Процессы, завершающие поиск:

Отбор [selection] - Процесс выделения из небольшого массива документов или данных, отвечающих дополнительным признакам, не учтенным или частично учтенным при информационном поиске. Отбор может составлять часть информационного поиска или выполняться как самостоятельная операция. В зависимости от степени участия в этом процессе человека различают: "автоматический" и "машинный" (т.е. с привлечением технических средств).или "ручной" отбор.

Выдача/вывод информации [information output] - В автоматизированных системах - процесс выведения документов или данных на экран монитора ЭВМ или в виде твердойкопии при помощи печатающего устройства или планшетного графопостроителя (плоттерав.

ОТОБРАЖЕНИЕ [display, imaging, mapping] -

1. Процесс визуального представления данных, например, на экране монитора ЭВМ:

2. Установление соответствия между элементами двух множеств;

3. Установление соответствия между двумя структурами;

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...