Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

7.6. Платформа создания систем извлечения знаний «Deductor»




7. 6. Платформа создания систем извлечения знаний «Deductor»

 

Компания «BaseGroup Labs» специализируется на разработке систем для глубокого анализа данных, охватывающих вопросы сбора, консолидации, очистки данных, построения моделей и визуализации. Основным программным продуктом компании является «Deductor».

«Deductor» является платформой, на базе которой создаются законченные аналитические решения. Платформа ориентирована на применение экспертами в различных предметных областях, позволяет обрабатывать любую структурированную табличную информацию [35]. Основной целью создания «Deductor» является решение задач Knowledge Discovery in Databases, позволяющая провести все нижеописанные шаги.

1. Подготовка исходного набора данных. В состав системы входит Deductor Warehouse – многомерное хранилище данных, ориентированное на решение задач консолидации информации из разнородных источников и быстрого извлечения интересующего набора данных. Deductor Warehouse поддерживает семантический слой, позволяющий конечному пользователю оперировать бизнес-терминами для получения интересующих данных. Кроме собственного хранилища «Deductor» поддерживает работу и с другими источниками имеющими интерфейсы взаимодействия через ODBC и ADO. Для обеспечения максимального быстродействия Deductor поддерживает прямой (direct) доступ к большинству наиболее популярных баз данных.

2. Предобработка. «Deductor» содержит большой набор механизмов предобработки и очистки данных: заполнение пропусков, редактирование аномалий, очистка от шумов, сглаживание, фильтрация и множество других с возможностью комбинирования методов предобработки.

3. Трансформация, нормализация данных. «Deductor» включает большой набор механизмов трансформации данных, позволяющих провести всю подготовительную работу для последующего анализа. Кроме этого, система содержит широкий спектр механизмов нормализации для всех типов данных: числовых, строковых, дата/время и логических.

4. Data Mining. В состав пакета включены алгоритмы, реализующие популярные и эффективные методы Data Mining: нейронные сети, деревья решений, самоорганизующиеся карты Кохонена, ассоциативные правила и прочее.

5. Постобработка данных. Результаты любой обработки могут быть отображены при помощи большого набора механизмов визуализации: OLAP, таблицы, диаграммы, деревья и множество других. Для некоторых механизмов предусмотрены специализированные визуализаторы, обеспечивающие легкость интерпретации результатов. Результаты могут быть экспортированы для последующей обработки при помощи других приложений.

Среди достоинств можно отметить следующее:

· все операции производятся при помощи «мастер» форм, благодаря которым снижаются требования к знанию экспертом математического аппарата;

· возможность произвольного комбинирования любых методов обработки;

· большой набор методов визуализации полученных результатов;

· пакетное выполнение всей действий по обработке данных.

Также «Deductor» содержит специальное приложение – Deductor Viewer для конечных пользователей, позволяющее им получить конечные результаты, без необходимости углубленных знаний по методам анализа данных. Для получения результата пользователю достаточно выбрать нужный отчет, все остальное будет выполнено автоматически.

 

7. 7. Поисковый сервис по официальным документам «Web Insight»

Компания «Р-Техно» предоставляет широкий спектр услуг в области конкурентной разведки и аналитических услуг для бизнеса в целом. Имеет несколько собственных решений в виде интернет- сервисов.

Web Insight – поисковый сервис по невидимой части сети Интернет, а именно, по документам ФНС, ФССП, Пенсионного фонда, ФАС, Трудовой инспекции, ФРС, МЧС, Арбитражного суда, МВД, ФСБ, а также по документам правоохранительных, контрольных и надзорных органов стран СНГ: Украины, Узбекистана, Казахстана, Белоруссии, Молдовы, Приднестровья, Таджикистана, Азербайджана, Киргизии, Абхазии и т. п. [36]

Среди информации, содержащейся в документах можно выделить:

· списки должников перед государственными службами;

· списки правонарушителей;

· списки организаций, заключавших договора с государственными службами и организациями;

· списки организаций, имеющих государственные лицензии;

· международные списки FATF и прочих антикриминальных структур.

 Для того, чтобы поиск принес максимальный результат, необходимо учитывать некоторые особенности хранящейся в архиве информации, а именно – все файлы создавались разными людьми, и соответственно имеют свой формат, стиль, оформление, форму подачи информации и т. п.

Для поиска по указанным источникам информации предлагается заполнение полной информации о юридическом или физическом лице, такой как полное наименование лица; сокращенное наименование юридического лица; ИНН; ОГРН; юридический адрес; варианты наименования на английском языке, а также в латинской транслитерации.

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...