7.3. Система управления досье «X-Files»
Система «X-Files» предназначена для решения задачи выделения достоверных фактов из различных источников, заполнения ими досье на объекты мониторинга и их последующей аналитической обработки [32]. Она используется для обеспечения процессов принятия решений при наличии большого объема «сырого» контента, что характерно для деятельности органов государственной власти, правоохранительных органов, крупных коммерческих компаний. Данный программный комплекс применяется и как аналитический инструмент, и как система поддержки корпоративной безопасности подразделений, занимающихся конкурентной разведкой. Система позволяет извлекать факты из Интернета, корпоративных источников документов, из учетных баз данных и других. В качестве источника документов и сообщений «X-Files» может эффективно использовать хранилище документов системы «Аналитический курьер».
Рис. 18. Просмотр документов в программе «Аналитический курьер» Для выделения из текста сущностей, отношений между ними (рис. 19) и других свойств фактов система использует оригинальные программы мультиязычного лингвистического, синтаксического и семантического анализа текста, общий и предметные тезаурусы. Система реализует поиск фактов на основе концепции семантически самоопределенного предложения (Semantic Self Defined Sentence, SSDS). Концепция определяет метод идентификации смысловых элементов предложения и отношений между ними. После обработки текста документа он состоит из самоопределенных семантически независимых предложений. На основании проводимого анализа формируется хранилище фактов, что позволяет вырабатывать и хранить гипотезы о вероятных связях объектов при отсутствии фактов об этих связях. Система порождает такие гипотезы, либо при наличии у каждого из пары объектов устойчивых связей с третьими общими для них объектами, либо при наличии для каждого из объектов фактов с общими местами совершения фактов в общем интервале времени. Также наличие эффективного хранилища позволяет анализировать факты в динамике и осуществлять ассоциативный поиск фактов путем самообучения правил идентификации объектов (аббревиатуры, SMS, E-mail, телефон, адрес и др. ), что позволяет программам-автоматам находить больше фактов.
Рис. 19. Снимок экрана программы «X-Files» Система «X-Files» структурирует смысл документов, автоматически выявляя факты нужного типа, связанные с объектами, на которых системой автоматически ведётся досье. Структурированные факты позволяют находить скрытые причины событий или спрогнозировать поведение объектов в будущем. Взаимосвязи объектов визуально представляются в виде карты связей. Понятие факт системы «X-Files» характеризуется рядом возможных свойств: тип значения факта; объект-владелец факта; место действия факта; объект-участник факта; время длительности факта; значение факта (например, «продажа бизнеса»); свойства факта. А также несколько типов связей между фактами: прямые связи, косвенные связи, связи по месту и времени. С помощью программ-автоматов, допускающих параллельную работу, система «X-Files» осуществляет выявление фактов из документов и заполняет досье поставленных на мониторинг объектов. В дальнейшем система предоставляет доступ к накопленной фактографической информации через Web-интерфейс для решения следующих аналитических задач: · автоматическое выявление прямых и косвенных связей объекта; · автоматическое выявление связей объектов по месту и времени; · типизация связей, представленных различной лексикой;
· формирование групп объектов, связанных между собой общностью фактов (например, место, время, содержание факта); · построение и анализ временных рядов групп объектов. Определение динамики миграции ядер групп; · построение карт связей объектов для различных типов связей, визуализация и фильтрация связей; · многовариантная визуализация карт связей с масштабированием, навигация по обзорной карте; · поиск оптимальных связей между заданными объектами; · определение несвязанных между собой областей карты связей объектов (локальные сообщества); · построение многомерных частотных распределений фактов; · анализ последовательностей фактов, циклов; · построение и анализ временных рядов карт связей объектов; · определение динамики изменения характера связей и состава объектов; · регламентная генерация и доставка аналитических отчетов и информационных подборок. Архитектура информационно-аналитической системы предусматривает взаимодействие с конечным пользователем через портал, использование Web-сервисов для взаимодействия с другими информационными системами, выгрузку данных в формате XML для имеющихся унаследованных приложений Заказчика. Системы «X-Files» и «Аналитический курьер» допускают работу в оффлайн-режиме, в котором результат представляется аналитику, не имеющему постоянного подключения к Web-серверу, в виде отчёта. Существуют различные формы представления информации в пакетном режиме, в том числе в формате XML. Система имеет широкий спектр методов аналитической обработки фактов. К ним относятся анализ временных рядов, анализ кластерной структуры, частотный анализ нечетких связей, поиск кратчайших связей между объектами и многие другие. «X-Files» имеет развитые средства самообучения на примерах семантических шаблонов ситуаций, которые затем используются ею для выделения фактов. Также система использует векторную графику для визуализации взаимосвязей объектов и содержит инструменты для визуального анализа сетей объектов.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|