Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

7. Современные информационно-аналитические системы ведения конкурентной разведки




7. Современные информационно-аналитические системы ведения конкурентной разведки

Для реализации активного и достоверного процесса ведения конкурентной разведки необходимо оперативное получение своевременной информации в определенном структурированном виде. Очевидно, что в настоящее время одним из основных источником получения информации является Интернет. Для ведения конкурентной разведки с использованием Интернета применяются специализированные информационно-аналитические системы.

 

7. 1. Виды информационных систем для ведения конкурентной разведки

 

Большинство современных информационно-аналитических систем (ИАС) имеют схожий базовый функционал, однако при этом различаются по качеству анализа и степени применимости для конкретных задач в рамках конкурентной разведки. Информационные системы (ИС), используемые для ведения конкурентной разведки, могут быть разделены по следующим признакам:

· ИС различаются по используемым информационным источникам. Принципиально различаются системы, работающие с открытой информацией из сети Интернет и узкоспециализированные системы, работающие с конкретными хранилищами данных, имеющих закрытый доступ.

· ИС могут быть классифицированы по типу анализируемой информации и как следствие решаемым в них задачам. Подавляющее большинство современных ИАС работают с текстовой информацией и решают задачи в рамках NLP.

· Современные ИС имеют наибольшие различия по решаемым задачам и применяемым методам анализа информации, в зависимости от которых определяется качество работы ИАС для ведения конкурентной разведки. Среди таких задач могут быть выделены следующие:

o поиск, мониторинг и доставка сообщений с сайтов Интернета и социальных медиа;

o извлечение различных типов сущностей (персоны, компании, даты, бренды и др. ) и отношений между ними (онтологии);

o автоматическое создание аннотаций отдельных документов, тематических рефератов коллекций документов;

o тематическое рубрицирование документов;

o определение тональной окраски документов и отдельных объектов;

o построение взаимосвязей тем коллекции документов в виде семантической сети;

o исследование динамики развития проблем, представленных в сообщениях;

o составление аналитических отчетов;

o составление досье на пользователей сети Интернет.

Рассмотрим основные компании и их продукты, направленные на решения задач конкурентной разведкой и бизнес аналитики.

 

7. 2. Система извлечения знаний «Аналитический курьер»

Компания «Ай-Теко» – российский поставщик информационных технологий и сервисов для корпоративных заказчиков, предоставляет услуги по системной интеграции, консалтингу, информационной безопасности, сервисной поддержке и аутсорсингу, реализует комплексные интегрированные решения в области ИТ-инфраструктуры и информатизации крупных государственных структур, промышленных и телекоммуникационных предприятий, банков, инвестиционно-финансовых и страховых учреждений, организаций малого и среднего бизнеса. Имеет множество продуктов, направленных на интеллектуальный анализ данных, среди которых наиболее применимыми для задач конкурентной разведки являются: «Аналитический курьер» и «X-Files».

«Аналитический курьер» является инструментом аналитической разведки, который позволяет быстро погружаться в новые предметные области [31]. Особенностью системы является совместное применение различных методов извлечения знаний в одном сценарии, например, сначала производится кластерный анализ подборки сообщений, затем строится семантическая сеть тем для выбранного кластера (рис. 16), после чего делается частотный анализ временного ряда сообщений по взаимосвязанным проблемам (рис. 17).

В программе «Аналитический курьер» реализованы следующие функции:

· поиск, мониторинг и доставка сообщений с сайтов Интернет и социальных медиа. Обработка социальных медиа производится оригинальными программами, возможно получение сообщений из следующих источников: социальные сети, блоги, микроблоги Twitter, форумы на платформах phpBB;

· извлечение различных типов сущностей (персоны, компании, даты, бренды и др. ) и отношений между ними (онтологии);

· многоязычный семантический поиск с использованием современных тезаурусов русского и других языков;

· обработка запросов на естественном языке и в форме логических высказываний;

· кросс-языковой поиск (автоматический перевод запроса на различные языки);

· персонализированный поиск (ранжирование документов поисковой выдачи с учетом истории запросов пользователя);

· автоматическое создание аннотаций отдельных документов, тематических рефератов коллекций документов, рефератов цепочек обсуждений различных тем в блогах и форумах (наиболее энергетические высказывания авторов сообщений);

 

 

Рис. 17. Пример рабочего экрана программы «Аналитический курьер»

 

· тематическое рубрицирование документов;

· определение тональной окраски документов и отдельных объектов;

· определение субъектов, объектов, тематики и тональности мнений, высказываний;

· автоматическое выделение тематических групп внутри поисковой выдачи документов (кластерный анализ публикаций);

· выявление ключевых тем документа, облака тегов коллекции документов;

· построение взаимосвязей тем коллекции документов в виде семантической сети;

· построение дайджеста (обзора высказываний) по объекту или теме документа;

· многомерный частотный анализ тем, высказываний, сообщений;

· исследование динамики развития проблем, представленных в сообщениях;

· ведение персональных библиотек пользователей и поиск в них;

· оповещение пользователей о доставке новых профильных документов и сообщений;

· выпуск аналитических отчетов по расписанию;

· администрирование процесса выделения знаний и автоматической доставки новой информации.

Система имеет многослойную архитектуру взаимодействующих с «тонким клиентом» сервисов и предоставляет пользователям веб-интерфейс. Такая архитектура предполагает, что система состоит из относительно независимых звеньев: сервера данных, сервера приложений, веб-сервера и самих приложений. Система может функционировать в современных центрах обработки данных, предоставляющих услуги «облачных вычислений» [31].

«Аналитический курьер» предусматривает различные сценарии использования:

· Аналитические подразделения и службы безопасности банка: анализ кредитоспособности клиента, выявление объектов, осуществляющих подозрительные платежи, выявление случаев распространения конфиденциальной информации и т. д.

· Страховые компании: обнаружение мошенников, неоднократно причинивших ущерб, недобросовестных объектов-страхователей, их связей, а также закономерностей событий (по месту и времени), происходящих с клиентами страховой компании.

· Аналитические подразделения производственных компаний: анализ наиболее частых неполадок; анализ реакции рынка на качество товаров, помощь в принятии решений.

· Подразделения маркетинга предприятий (анализ рынка лекарств, изделий): обеспечение лиц, принимающих управленческие решения, информацией для выработки оптимального варианта решения стоящей проблемы.

· Специальные службы, правоохранительные органы: мониторинг событий, объектов, проблем и анализ взаимосвязей исследуемых сущностей.

Для повышения достоверности кластерного анализа используется метод иерархического бикластерного анализа (объектно-признаковый, концептуальный кластерный анализ). Система поддерживает следующие основные уровни обработки естественного языка: лексический анализ, морфологический анализ, синтаксический анализ, постсинтаксический анализ (выделение типизированных сущностей), орфографический корректор ошибок и вариативной лексики в тексте (рис. 18).

Последующий семантический анализ текста производит типизацию сущностей (физические, юридические лица; одушевленные предметы; даты; регионы и многие другие типы), а также их нормализацию. Для идентификации ссылочно-представленных сущностей (местоимения) используются различные эвристические методы: разрешение анафорических ссылок; разрешение аббревиатур; идентификация географических объектов; поиск наиболее полного наименования персоны; выделение многих других типов сущностей (адреса, телефоны и т. д. ) производится с помощью расширяемых (в том числе и пользователем) правил.

В системе используется тезаурус русского языка, совместимого со стандартом WordNet 3. 0, имеющий значительный объем. В его составе более 160 тысяч групп синонимов, 700 тысяч связей между ними, 170 тысяч лексем и 13 типов семантических отношений. Имеется возможность одновременной работы как с общим, так и с тематическими тезаурусами заказчика. В поставку программного компонента входит инструмент для создания нового или редактирования существующего тезауруса.

Система «Аналитический курьер» является одной из ведущих аналитических информационных систем, работающих с русским языком.

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...