Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

7.3. Система управления досье «X-Files»




Система «X-Files» предназначена для решения задачи выделения достоверных фактов из различных источников, заполнения ими досье на объекты мониторинга и их последующей аналитической обработки [32]. Она используется для обеспечения процессов принятия решений при наличии большого объема «сырого» контента, что характерно для деятельности органов государственной власти, правоохранительных органов, крупных коммерческих компаний.

Данный программный комплекс применяется и как аналитический инструмент, и как система поддержки корпоративной безопасности подразделений, занимающихся конкурентной разведкой. Система позволяет извлекать факты из Интернета, корпоративных источников документов, из учетных баз данных и других. В качестве источника документов и сообщений «X-Files» может эффективно использовать хранилище документов системы «Аналитический курьер».

 

 

Рис. 18. Просмотр документов в программе «Аналитический курьер»

Для выделения из текста сущностей, отношений между ними (рис. 19) и других свойств фактов система использует оригинальные программы мультиязычного лингвистического, синтаксического и семантического анализа текста, общий и предметные тезаурусы.

Система реализует поиск фактов на основе концепции семантически самоопределенного предложения (Semantic Self Defined Sentence, SSDS). Концепция определяет метод идентификации смысловых элементов предложения и отношений между ними. После обработки текста документа он состоит из самоопределенных семантически независимых предложений. На основании проводимого анализа формируется хранилище фактов, что позволяет вырабатывать и хранить гипотезы о вероятных связях объектов при отсутствии фактов об этих связях. Система порождает такие гипотезы, либо при наличии у каждого из пары объектов устойчивых связей с третьими общими для них объектами, либо при наличии для каждого из объектов фактов с общими местами совершения фактов в общем интервале времени. Также наличие эффективного хранилища позволяет анализировать факты в динамике и осуществлять ассоциативный поиск фактов путем самообучения правил идентификации объектов (аббревиатуры, SMS, E-mail, телефон, адрес и др. ), что позволяет программам-автоматам находить больше фактов.

 

 

Рис. 19. Снимок экрана программы «X-Files»

Система «X-Files» структурирует смысл документов, автоматически выявляя факты нужного типа, связанные с объектами, на которых системой автоматически ведётся досье. Структурированные факты позволяют находить скрытые причины событий или спрогнозировать поведение объектов в будущем. Взаимосвязи объектов визуально представляются в виде карты связей.

Понятие факт системы «X-Files» характеризуется рядом возможных свойств: тип значения факта; объект-владелец факта; место действия факта; объект-участник факта; время длительности факта; значение факта (например, «продажа бизнеса»); свойства факта. А также несколько типов связей между фактами: прямые связи, косвенные связи, связи по месту и времени.

С помощью программ-автоматов, допускающих параллельную работу, система «X-Files» осуществляет выявление фактов из документов и заполняет досье поставленных на мониторинг объектов. В дальнейшем система предоставляет доступ к накопленной фактографической информации через Web-интерфейс для решения следующих аналитических задач:

· автоматическое выявление прямых и косвенных связей объекта;

· автоматическое выявление связей объектов по месту и времени;

· типизация связей, представленных различной лексикой;

· формирование групп объектов, связанных между собой общностью фактов (например, место, время, содержание факта);

· построение и анализ временных рядов групп объектов. Определение динамики миграции ядер групп;

· построение карт связей объектов для различных типов связей, визуализация и фильтрация связей;

· многовариантная визуализация карт связей с масштабированием, навигация по обзорной карте;

· поиск оптимальных связей между заданными объектами;

· определение несвязанных между собой областей карты связей объектов (локальные сообщества);

· построение многомерных частотных распределений фактов;

· анализ последовательностей фактов, циклов;

· построение и анализ временных рядов карт связей объектов;

· определение динамики изменения характера связей и состава объектов;

· регламентная генерация и доставка аналитических отчетов и информационных подборок.

Архитектура информационно-аналитической системы предусматривает взаимодействие с конечным пользователем через портал, использование Web-сервисов для взаимодействия с другими информационными системами, выгрузку данных в формате XML для имеющихся унаследованных приложений Заказчика. Системы «X-Files» и «Аналитический курьер» допускают работу в оффлайн-режиме, в котором результат представляется аналитику, не имеющему постоянного подключения к Web-серверу, в виде отчёта. Существуют различные формы представления информации в пакетном режиме, в том числе в формате XML.

Система имеет широкий спектр методов аналитической обработки фактов. К ним относятся анализ временных рядов, анализ кластерной структуры, частотный анализ нечетких связей, поиск кратчайших связей между объектами и многие другие. «X-Files» имеет развитые средства самообучения на примерах семантических шаблонов ситуаций, которые затем используются ею для выделения фактов. Также система использует векторную графику для визуализации взаимосвязей объектов и содержит инструменты для визуального анализа сетей объектов.

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...