Информационный поиск, поиск информации
[information retrieval, data search] - Процесс нахождения, отбора и выдачи определенной заранее заданными признаками информации (в т.ч. - документов, их частей и/или данных) из массивов и записей любого вида и на любых носителях. Побудительной причиной осуществления информационного поиска является информационная потребность, выраженная в форме информационного запроса. В зависимости от степени привлечения к информационному поиску технических средств и участия в нем человека различают: "ручной", "машинный" и "автоматизированный" информационный поиск. Последний может производиться в режиме диалога или пакетной обработки запросов. В автоматизированных информационных системах (см. АИС) информационный поиск обеспечивается и осуществляется с привлечением лингвистических, информационных, программно-технических, технологических, организационных средств и составленных из них комплексов {подробнее о них см. раздел II. Автоматизация информационных процессов и информационные системы - Прим. авт.). Непосредственно информационный поиск производится средствами информационно-поисковой системы, являющейся подсистемой АИС. Основными критериями качества результатов информационного поиска являются полнота, точность и оперативность поиска. Виды поиска: Библиографический поиск [bibliographic search/retrieval] - Вид информационного поиска по массивам библиографических описаний документов. Документальный информационный поиск, поиск документов [document retrieval] - Вид информационного поиска, связанный с процессами нахождения и выдачи документов. Двоичный поиск [binary search] - Быстрая техника, использующаяся для поиска любой конкретной записи в упорядоченном списке записей.
Фактографический информационный поиск [data retrieval] - Вид информационного поиска, связанный с процессами нахождения и выдачи конкретных (фактографических) данных. Координатный поиск [coordinate retrieval] - Вид информационного поиска, основанный на использовании координатного индексирования. Ретроспективный поиск [retrospective retrieval] - Информационный поиск, проводимый о всем накопленном массиве документов или фактов по любому запросу, соответствующему тематике и виду "информационно-поискового массива ". ТЕОРИЯ ИНФОРМАЦИОННОГО ПОИСКА [information retrieval theory] - Раздел Информатики, изучающий и разрабатывающий вопросы построения информационно-поисковых систем (см. ниже) и их использования. ПОИСКОВАЯ СИСТЕМА [retrieval system] - Комплекс средств, предназначенный для нахождения и получения (выдачи) необходимых объектов (в т.ч. - изделий, документов, текстов и т.п.), обладающих определенными признаками, соответствующими указанным в запросах. Различают поисковые системы: "ручные", "механизированные", "автоматизированные" и т.п. ИНФОРМАЦИОННО-ПОИСКОВАЯ СИСТЕМА (ИПС) [information retrieval system] - Автоматизированная поисковая система, реализованная на средствах электронной вычислительной техники и предназначенная для нахождения а также выдачи ее пользователям необходимой информации по заданным критериям. ИПС представляет собой совокупность информационно-поискового языка, (программных) средств и правил перевода текстов на этот язык (индексирования), обеспечения их поиска и критериев соответствия. В информационной практике принято многоаспектное использование термина "ИПС", которое связанно с ее абстрактным или материализованным представлениями. Абстрактное представление ИПС ограничивается рассмотрением информационно-поискового языка, правил индексирования и критериев выдачи (см. ниже). Материализованное представление ИПС включает в это понятие также информационные массивы, их носители (магнитные, оптические диски и т.п.), программные и технические средства. В указанном плане ИПС может рассматриваться как часть системы управления базами данных (см. СУБД).
В зависимости от видов информационных массивов, на работу с которыми ориентирована ИПС, различают документографические (документальные), фактографические, документально-фактографические (интегрированные) ИПС. Абстрактная информационно-поисковая система [abstract information retrieval system] - Совокупность информационно-поискового языка, методов индексирования и поиска документов и данных. ОРАС (Online Public Access Catalogue) - Информационно-поисковая система, ориентированная на предоставление услуг доступа конечным пользователям к библиотечным (преимущественно - библиографическим) базам данных в диалоговом ("онлайновом") режиме. КРИТЕРИЙ [criterion] - Признак, который при оценке объектов, выполняемой путем сравнения, принимается в качестве наиболее существенного для принятия определенного решения, например, - отбора и последующей выдачи документов из информационного массива при поиске. При информационном поиске используются разнородные критерии и, в частности; критерии "соответствия", "смыслового соответствия" и "формального соответствия" и др. (см. ниже): Критерий соответствия [match criterion] - Признак или совокупность признаков, по которым определяется степень соответствия между запросом или поисковым предписанием и поисковым образом документа, самим документом или записью его части для принятия решения о выдаче или не выдаче конкретного документа наинформационный запрос, обрабатываемый системой. Критерий смыслового соответствия, критерий релевантности (документов, данных) [relevansy criterion] - Признак или совокупность признаков, по которым определяется степень смыслового соответствия между содержанием поискового предписания и поискового образа документа, самим документом или записью его части для принятия решения о выдаче или не выдаче конкретного документа на информационный запрос, обрабатываемый системой. Критерий формального соответствия [formal match criterion] - Признак или совокупность признаков, по которым определяется степень формального соответствия между поисковым предписанием и поисковым образом документа, самим документом или записью его части для принятия решения о выдаче или не выдаче конкретного документа на информационный запрос, обрабатываемый системой.
Релевантность [relevance] - Характеристика степени соответствия смыслового содержания документа, найденного в результате поиска, содержанию информационного запроса. Пертинентность [pertinence] - Характеристика степени соответствия документа или данных, найденных в результате поиска, информационной потребности пользователя, выраженной в его запросе. Точность поиска, коэффициент точности поиска/выдачи [precision ratio, accuracy ratio, precision coefficient, accuracy coefficient] - Количественная характеристика результатов информационного поиска. Точность поиска определяется путем деления количества выданных в результате выполнения поиска релевантных (см. релевантность)документов на общее число выданных документов (релевантных и не релевантных). Данный показатель используется также для оценки качества информационно-поисковых систем. Коэффициент информационного шума, коэффициент шума [noise, noise ratio, noise coefficient] - Количественная характеристика информационного поиска. Коэффициент информационного шума (ИШ) определяется путем деления количества выданных в результате выполнения поиска нерелевантных документов (см. релевантность) на общее число выданных документов (релевантных и не релевантных). Будучи выраженным в процентах, ИШ = 100%;- ТП=0. Данный показатель используется также для оценки качества информационно-поисковых систем. Полнота поиска, коэффициент полноты поиска [recall, recall ratio, recall coefficient] - Количественная характеристика результатов информационного поиска, которая определяется путем деления количества выданных в результате выполнения поиска релевантных (см. релевантность) документов на общее число релевантных документов, имеющихся в информационно-поисковой системе (выданных и не выданных). Данный показатель используется также для оценки качества информационно-поисковых систем,
Коэффициент потерь [losses coefficent] - Количественная характеристика результатов информационного поиска. Коэффициент потерь (КП) определяется путем деления количества не выданных в результате выполнения поиска релевантных документов (см. релевантность) на общее число релевантных документов, имеющихся винформационно-поисковой системе (выданных и не выданных). Будучи выраженным в процентах, КП = 100% - полнота поиска. Данный показатель используется также для оценки качества информационно-поисковых систем. Оперативность (время) поиска [seek time] - 1. Время, затрачиваемое на выполнение поиска, с момента формирования задания и выдачи команды на производство поиска до момента получения его результатов; 2. В ЭВМ - Время, затрачиваемое головкой чтения/записи дисковода (накопителя), для того, чтобы достичь определенного элемента данных, записанного на диске, дискете или другом носителе данных внешней памяти ЭВМ. Процессы, завершающие поиск: Отбор [selection] - Процесс выделения из небольшого массива документов или данных, отвечающих дополнительным признакам, не учтенным или частично учтенным при информационном поиске. Отбор может составлять часть информационного поиска или выполняться как самостоятельная операция. В зависимости от степени участия в этом процессе человека различают: "автоматический" и "машинный" (т.е. с привлечением технических средств).или "ручной" отбор. Выдача/вывод информации [information output] - В автоматизированных системах - процесс выведения документов или данных на экран монитора ЭВМ или в виде твердойкопии при помощи печатающего устройства или планшетного графопостроителя (плоттерав. ОТОБРАЖЕНИЕ [display, imaging, mapping] - 1. Процесс визуального представления данных, например, на экране монитора ЭВМ: 2. Установление соответствия между элементами двух множеств; 3. Установление соответствия между двумя структурами;
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|