Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Филиал УдГУ в г. Воткинске




 

«Введение в технологии Online Analytical Processing»

Всем известно, что в ходе своего исторического развития человечество, общество, общественные и экономические отношения постепенно развиваются и усложняются. Ни для кого не секрет, что в наше с Вами время существует огромное количество накопленной человечеством за долгие века своего существования различной информации. Эта информация может касаться самых различных нюансов нашей с Вами жизни таких, например, как медицина, философия, религия, техника, физика, математика, экономика. Именно информация сегодня является одним из основных факторов, жизненно важным для ведения какого-либо бизнеса в состоянии современной экономики. Но так как процессы экономики постепенно усложнялись в результате исторического развития человечества, объемы информации связанной с ней постепенно возросли до огромных размеров. Данная проблема усугубляется тем, что информация может быть очень разнородной и находиться по крупицам в самых разных источниках.

Для того чтобы собрать всю эту информацию в какую-то единую совокупность и дать возможность её проанализировать было предложено использовать компьютерные технологии, а в частности так называемую технологию «OLAP». Целью данной статьи является познакомиться с основными ключевыми пунктами технологии OLAP и прояснить для чего может понадобиться данная технология.

«OLAP» (англ. «OnLine Analytical Processing») – аналитическая обработка в реальном времени. Это подход к аналитической обработке данных, который основан на представлении их в виде многомерно-иерархической структуры.«OLAP»широко применяется в таком направлении деятельности, как «бизнес-аналитика». Существуют также специальные технологии и приложения бизнес-анализа, в русскоязычной терминологии называемые системами поддержки принятия решений. Основоположником термина OLAP является Эдгар Кодд (Edgar Codd), который предложил в 1993 году «12 законов аналитической обработки в реальном времени»[1].

Основным элементом OLAP технологии является OLAP-куб. Он представляет собой многомерный массив данных, как правило, разрежённый и долговременно хранимый.

Разрежённый массив – это такое представление обычного массива данных, в котором последние представлены не непрерывно, а фрагментарно; большинство элементов его принимают одно и то же значение (значение по умолчанию обычно 0 или null).

«OLAP» – это технология обработки данных, которая заключается в подготовке суммарной (агрегированной – то есть вычисленной на основе каких-либо исходных значений данных, например «итог за месяц») информации на основе больших массивов данных, которые структурированы по многомерному принципу [1]. Технология OLAP чем-то схожа с базами данных в плане выполнения запросов, но в сравнении с ними обладает преимуществом – скоростью. Происходит это потому, что реляционные базы данных хранят свои сущности в виде отдельных таблиц, обычно хорошо нормализованных, что, безусловно, удобно для таких систем, как OLTP (англ. «Online Transaction Processing») – обработка транзакций в реальном времени, но многотабличные запросы в ней выполняются не очень быстро.

В 1995 году Найджел Пендс (Nigel Pendse) предложил использовать вместо предложенных Коддом двенадцати правил OLAP тест «FASMI» (так как некоторые эксперты посчитали термин «OLAP» слишком широким). Термин «FASMI» является одновременно и набором требований к этим системам и расшифровывается как «Fast Analysis of Shared Multidimensional Information», что в переводе с английского – быстрый анализ распределенной многомерной информации.

Рассмотрим отдельные требования к системе OLAP(по Н. Пендсу):

«Fast» в переводе с английского означает «быстрый»– это требование к скорости реакции системы, которое гласит, что время ожидания с момента начала запроса до получения результата должно измеряться секундами. Данное требование особенно актуально в случае использования системы как инструмента для оперативного представления данных в аналитике, так как длительное время ожидания запрашиваемой информации может негативно повлиять на сделанные на её основе выводы. «Analysis» в переводе с английского «анализ». Система на основе технологии OLAP должна давать пользователю возможность анализа полученных данных. «Shared» с английского переводится как «разделенный». Смысл данного требования сводится к тому, что система должна предоставлять доступ к работе с информацией нескольким пользователям одновременно. «Multidimensional» в переводе означает «многомерный». Система должна уметь представлять данные в многомерном виде. «Information» в переводе «информация». Система должна предоставить пользователю нужную ему информацию.

Существует множество способов реализации хранения данных в OLAP, но мы рассмотрим некоторые основные из них:

«ROLAP» расшифровывается как «Relational OLAP» и переводится «реляционный OLAP» – подход, при котором исходные данные остаются в реляционной базе данных (в дальнейшем БД) в которой они находились изначально, а агрегатные данные помещаются в специальные служебные таблицы в той же БД. «MOLAP» расшифровывается как «Multidimensional OLAP» а в переводе означает «многомерный OLAP». В данном подходе и исходные и агрегатные данные хранятся в многомерной БД, что позволяет оперировать ими как многомерной структурой. «HOLAP» в расшифровке «Hybrid OLAP» а в переводе «гибридный OLAP». В отличие от других подходов, в HOLAP исходные данные остаются в той же реляционной БД, а агрегатные данные хранятся уже в многомерной БД. Таким образом, HOLAP сочетает в себе идеи MOLAP и ROLAP.

Каждый подход к организации систем OLAP обладает своими преимуществами и недостатками.

В наши дни, когда компьютерные технологии постепенно перестали быть опциональным средством для решения бизнес задач и превратились де-факто в обязательный атрибут решения сложных управленческих процессов на предприятии, каждая уважающая себя организация стремится использовать высокие технологии для повышения своей конкурентоспособности на фоне остальных. Сегодня уже не возникает вопроса о необходимости использования различных информационных систем в бизнесе – в данный момент это уже скорее единственный путь к выживанию организации.

Как известно, спрос порождает предложение, а в данном случае спрос на аналитические компьютерные системы породил всевозможные их вариации. Для того чтобы быть конкурентоспособными на рынке, компании должны обладать не только сильной производственной базой либо высококачественной базой услуг, но и, самое важное, обладать актуальной и достоверной информацией.

На данный момент уже невозможно представить менеджера какой-либо более-менее крупной компании, который не основывает свои решения на актуальной и своевременной информации. Принимать такие важные решения помогают системы, построенные на технологии OLAP, такие, например, как: Microsoft Analysis Services, Oracle Essbase, IBMTM1, Pentaho Mondrianи большое множество других менее известных продуктов.

Таким образом, все семейство продуктов и технологий «Business Intelligence» («бизнес-анализ», «бизнес-аналитика»), в том числе и OLAP-технологии, приобретают очень значимый статус, и, несомненно, будут развиваться и в дальнейшем. Из вышеизложенного можно сделать вывод о том, что данное направление деятельности является очень актуальным и перспективным для дальнейшего его изучения и использования на практике.

 

Литература

1. Википедия [Электронный ресурс]. Режим доступа: http://ru.wikipedia.org/wiki/OLAP [Дата обращения: 14.04.13].

2. Классификация OLAP-систем вида xOLAP, А. Н. Андреев [Электронный ресурс]. Режим доступа: http://citforum.ru/consulting/BI/ [Дата обращения: 22.03.13]

3. Информация об OLAP-продуктах [Электронный ресурс]. Режим доступа: http://www.bi-verdict.com [Дата обращения: 14.03.13].

Мальцев Андрей, Батакова Наталья,

Группа ТО БЖД

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...