7.4. Информационно-аналитическая система «АРИОН»
7. 4. Информационно-аналитическая система «АРИОН» Система «АРИОН» разработана российской компанией SyTech. Система предоставляет пользователям возможности по сбору, обработке и анализу разнородных данных. Для сбора данных из разнородных источников в ИАС «АРИОН» используется специализированный модуль, позволяющий выполнять загрузку данных из следующих типов источников: массивы полнотекстовой информации; материалы Интернет-сайтов; формализованные документы; электронная почта; электронные архивы и системы документооборота; базы данных, структурированные источники. Система позволяет задать критерии отбора информации из источников и способы ее первичной фильтрации, а также организовать периодическое обновление и загрузку новой информации в соответствии с определенным регламентом [33]. Для хранения и обработки полнотекстовых документов в ИАС «АРИОН» используется специальное полнотекстовое хранилище, в котором предусмотрен набор следующих функций: извлечение и загрузка документов из массива; автоматическая рубрикация документов; составление дайджестов и рефератов документов; аннотирование текстов документов; подготовка аналитических подборок; полнотекстовый поиск с учетом морфологии; атрибутивный поиск документов; разметка текстов документов. Результатом выделения фактографической информации из текстов документа в лингвистическом процессоре является набор связанной фактографической информации – информационных объектов и связей между ними, в рамках которой можно осуществлять: поиск по атрибутам объектов; поиск цепочек связей; многокритериальный поиск; поиск связей между фактами. Среди набора аналитических функций ИАС «АРИОН» можно отметить следующие: слияние совпадающих объектов; поиск похожих объектов, фактов и ситуаций; определение незначимых объектов, фактов ситуаций; определение весов объектов, фактов ситуаций; поиск скрытых закономерностей; атрибутивный поиск объектов, фактов ситуаций; поиск цепочек связей между объектами, фактами, ситуациями; контекстный анализ; временной анализ; ситуативный анализ.
Информация из ИАС «АРИОН» может быть выведена в виде отчетов в табличном и графическом виде. Предусмотрены режимы агрегирования и подсчета статистики. Результаты статистической обработки представляются в системе в виде таблиц, графиков и гистограмм. Для представления данных пользователю предусмотрено 2 основных режима: табличный и графический (рис. 20).
Рис. 20. Пример интерфейса ИАС «АРИОН» В табличном режиме пользователю предлагается список объектов с указанием их характеристик. Графический режим является более наглядным, в нем информация представляется в виде графа, в котором вершины представляют объекты, а ребра – связи. Любой режим представления позволяет пользователю редактировать характеристики объектов и связей, а также удалять и создавать их. ИАС «АРИОН» базируется на открытых стандартах и имеет возможность взаимодействовать со смежными системами на разных уровнях. Вся информация в системе «АРИОН» имеет представление в формате xml и может быть выгружена в файл, в базу данных. 7. 5. Система анализа документов «RCO KAOT» «RCO КАОТ» – программный комплекс, разработанный компанией «RCO» и обеспечивающий автоматический анализ содержания полнотекстовых документов и поддержку рабочего места аналитика с возможностью работы в локальной сети по протоколам tcp-ip и http. В базовой поставке «RCO КАОТ» работает с документами, хранящимися в папках файловой системы, однако предполагает адаптацию к используемым хранилищам документов при необходимости [34].
В состав «RCO КАОТ» входит набор программных модулей, часть из которых может поставляться или адаптироваться к нуждам заказчика независимо от других. В полной поставке комплекс содержит следующие модули: RC Server – поисковая машина, обладающая возможностями как контекстного, так и реляционного поиска. Позволяет искать документы с учетом морфологии и стоп-слов русского и английского языков, используя SQL-подобный язык запросов и комбинируя поисковые ограничения на контекст с ограничениями на заданные атрибуты документов. Поддерживает упорядочение результатов как по соответствию запросу, так и по реляционным атрибутам. Необходима для работы всех остальных компонент. RCO TopSearch Win – расширенные возможности поиска. Контекстный поиск с применением морфологического анализа и тезауруса русского языка обеспечивает эффективный поиск документов по содержащимся в них словам и фразам. Нечеткий поиск позволяет отыскать требуемую информацию при наличии орфографических ошибок в документе или в запросе. Тематический поиск позволяет находить темы, связанные в тексте по смыслу с запросом, а также искать документы по темам (рис. 21). RCO TopTree Win – построение иерархических рубрикаторов для оперативного мониторинга и маршрутизации информационных потоков, а также систематизация результатов контекстного поиска. RCO TopNet Win – построение и визуализация семантических сетей для навигации в информационном пространстве с опорой на ключевые объекты документов и их взаимосвязи. Позволяет исследовать смысловое окружение интересующих объектов, выявлять цепочки и области связности объектов в коллекции документов. RCO TopSOM Win – представление содержания коллекции документов на плоскости в форме тематической карты, визуализация распределения результатов поиска на карте.
Рис. 21. Пример веб-интерфейса системы RCO «КАОТ»
RCO TopLine Win - визуализация изменений тематики потока документов. Позволяет исследовать смену ракурсов, в которых фигурирует целевая проблема, во времени.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|