Полнотекстовой поиск (автоматический поиск по словам из текста документа) в СПС «Гарант» и «КонсультантПлюс»
Справочные Правовые Системы. Назначение, функции и структура СПС «Гарант» и «КонсультантПлюс» Рассмотрим справочно-правовые системы «Гарант» и «КонсультантПлюс», их назначение, функции, структуру. По своим функциям и структуре эти системы имеют много схожих черт: § они содержат довольно полно представленный банк данных по всем разделам законодательстваРФ; § являются открытыми и постоянно пополняются новыми документами; § базы данных пользователя обновляются с удобной для пользователя периодичностью, так как кроме привычных форм передачи информации (почта, курьер) сейчас многим доступны электронная почта и выход в Интернет; § как правило, все системы работают под управлением WINDOWS и хорошо документированы; § каждая из систем позволяет осуществлять поиск документов разными методами, используя карточку реквизитов и словари по каждому реквизиту; § в каждой системе предусмотрен набор операций для работы с отдельным документом и с текстом документа: просмотр документа строчка за строчкой от начала до конца; просмотр по разделам, главам и статьям; § просмотр фрагментов, содержащих поисковый контекст; § все системы позволяют извлекать фрагменты текста и перемещать их в редактор, работать с каждым документом не только в режиме просмотра, но и в режиме редактора; § существует возможность перехода от документа к документу по ссылкам (гипертекстам); § для путешествия по документам помимо ссылок предусмотрена еще и система закладок; § информационные банки хорошо структурированы по тематическим разделам, и такой подход позволяет пользователю приобретать только разделы, необходимые для дела. Например, только банковское и финансовое законодательство. Это заметно отражается на стоимости «приобретения» и на затратах, связанных с его сопровождением.
Семейство СПС «Гарант» включает девять универсальных и специализированных баз данных, содержащих актуальные документы с 1924 г., базы данных «Российское законодательство на английском языке», «Шестиязычный толковый словарь бизнеса и права», а также шестнадцать баз данных, посвященных законодательству субъектов федерации. СПС «Гарант» имеет мощную сегь распространения не только в России, но и за рубежом: в США, Великобритании, Израиле, а также через коммуникационную сеть Интернет. Информационно-правовая система «Кодекс» – это огромная правовая библиотека, содержащая десятки тысяч документов по законодательству России, Финляндии, Эстонии и стран СНГ, региональное законодательство Москвы, Санкт-Петербурга и Ленинградской области, Новосибирска и Новосибирской области и других регионов. «Кодекс» не ограничивается лишь законодательными базами данных. Это еще и электронные дайджесты газет и журналов. В том числе «Экономика и жизнь», «Хозяйство и право», «Адвокат», «Законодательство и экономика» и др. Основные нормативные акты России по разделам Правовое регулирование бизнеса в России и Типовые контракты и деловые документы переведены на английский язык. «КонсультантПлюс» содержит две группы разработок. Это системы по законодательству и системы поддержки принятия решений. Все они разработаны на основе единой программной оболочки. Баз данных по законодательству несколько. Это удобно в том смысле, что пользователь может выбрать необходимое: от основ законодательства до полного информационного банка законодательства РФ. Системы поддержки принятия решений ориентированы на конкретных специалистов, дополняя системы по законодательству. Например, «Консультант Бухгалтер» содержит еще и консультационную часть под названием «Вопросы и ответы». Система включает тысячи консультаций по применению законодательства в области налогообложения и бухгалтерского учета.
Основные поисковые возможности СПС «Гарант» и «КонсультантПлюс». Поиск по реквизитам документа Можно выделить три основных вида поиска в компьютерных справочных системах: • поиск по реквизитам документов, • полнотекстовой поиск, • поиск по специализированным классификаторам. Современные СПС предоставляют возможность эффективно работать с любым из этих видов поиска. Возможности мгновенного поиска с помощью комплекса поисковых инструментов – действительно совершенно новый уровень работы с информацией, который обеспечили компьютерные технологии. Важнейшее свойство программных технологий заключается в том, что они позволяют не просто в сотни раз быстрее искать конкретный фрагмент текста документа по тому или иному признаку, но и одновременно сочетать несколько поисковых инструментов. Это свойство позволяет прекратить споры о том, какой вид поиска более удобен и точен. В действительности каждый вид поиска имеет свои достоинства и недостатки, преимущества и ограничения при использовании. Оптимальный же результат может быть получен только при сочетании различных видов поиска и их параллельном использовании. Проанализируем каждый из этих видов поиска более подробно. Поиск по реквизитам документа Это наиболее простой, удобный и очевидный способ поиска. Под поиском по реквизитам понимается поиск по номеру, виду документа, принявшему органу, дате принятия и т.д. Удобство и простота реализации этого вида поиска обычно не вызывают ни у кого особых вопросов. Однако он применим только в тех ситуациях, когда точно известны реквизиты конкретного документа. Основная проблема заключается в том, что в большинстве реальных ситуаций чаще всего требуется поиск документов без заранее известных точных реквизитов, только на основании общего смысла проблемы. Полнотекстовой поиск (автоматический поиск по словам из текста документа) в СПС «Гарант» и «КонсультантПлюс»
Этот вид поиска основан на автоматической обработке текста. При запросе на поиск тех документов, где встречается конкретное слово, автоматически происходит перебор всего массива документов и выбор всех тех документов, где это слово встречается. Существуют быстрые алгоритмы такого поиска, когда при первоначальном вводе каждого документа все встречающиеся в нем слова вносятся в общий словарь, и в дальнейшем при поиске по любому слову из словаря можно мгновенно получить список всех документов, где оно встречается. Более того, на основе полнотекстового поиска могут быть реализованы различные способы формирования поисковых запросов. Простейшим запросом является следующий: найти все документы, содержащие одно слово, например БУХГАЛТЕР. Более сложным вариантом запроса является запрос на поиск всех документов, содержащих два слова, например ГЛАВНЫЙ и БУХГАЛТЕР. Если эти два слова соединены логическим условием И, то будут отобраны только те документы, где есть одновременно оба слова. Если указаны два слова, соединенные логическим условием ИЛИ, то будут отобраны документы, где есть хотя бы одно из этих слов. Такие логические выражения могут быть еще более сложными. При формировании сложных запросов дополнительно может использоваться признак близости слов. В запросе ГЛАВНЫЙ И БУХГАЛТЕР может быть указано, что слова должны находиться РЯДОМ, например в пределах 2 (или 3) строк. Основное преимущество полнотекстового поиска состоит в том, что он не зависит от субъективных мнений или ошибок специалистов-разработчиков и всегда по любому слову дает возможность получить полный и абсолютно точный список документов, где встречается искомое слово. Ничего не будет забыто и пропущено. Другими словами, на любой запрос можно получить ответ, подготовленный по понятному для пользователя правилу, не зависящему от субъективной позиции обработчика, Но, конечно, у полнотекстового поиска имеются и свои недостатки. Во-первых, полученный список будет содержать много «шума», то есть те документы, где искомое слово используется не в нужном контексте и т.п. Во-вторых, не будут найдены те документы, где встречаются синонимы данного термина. Так, задав поиск по слову НЕСОВЕРШЕННОЛЕТНИЙ, невозможно автоматически получить те документы, где используется выражение ЛИЦО, НЕ ДОСТИГШЕЕ ВОСЕМНАДЦАТИ ЛЕТ. Эта проблема частично решается усложнением задаваемых поисковых выражений, но все равно трудно во всех случаях добиться такой же точности, как при заранее проделанной «вручную» экспертной обработке (см. следующий пункт).
Воспользуйтесь поиском по сайту: ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|