Тема 7. Сховища даних та оперативний аналіз даних (OLAP)

1. Поняття про OLAP-системи

Кількість даних у глобальних мережах стрімко зростає практично щодня. На початку сучасної комп’ютерної ери файлові сховища задовольняли усі потреби людей щодо зберігання інформації. Потужності таких сховищ вистачало для того, аби обробляти інформацію з відносно високою швидкістю. Але уже через декілька років цей метод був неприйнятним. Створення систем керування базами даних (СКБД) свого часу стало значним проривом у галузі зберігання і обробки інформації. СКБД дали можливість оперувати величезними масивами даних, задовольняючи прийнятні часові обмеження. Навіть сьогодні СКБД залишаються основним напрямом розвитку сфери зберігання даних. В основі традиційних СКБД лежали таблиці рядкової структури. Рядкова база серіалізує всі значення одного рядка, потім значення іншого і так далі. Цей підхід вважається досить практичним, якщо мова йде про вставлення чи оновлення даних. Такі бази, оптимізовані для оновлення, називають операційними базами даних, і викорисовують у системах оперативної обробки транзакцій (OLTP). Бази, оптимізовані для читання, називають сховищами даних. Вони застосовуються у системах оперативного аналізу (OLAP) (Табл. 1).

Таблиця 1

Порівняння систем OLAP та OLTP

7.1

On-Line Analytical Processing (OLAP) - технологія оперативної аналітичної обробки даних, що використовує методи і засоби для збору, зберігання та аналізу багатовимірних даних з метою підтримки процесів прийняття рішень.

Бази даних онлайнової аналітичної обробки (OLAP) полегшують запити на бізнес-аналітики. OLAP – це технологія баз даних, оптимізована для запитів і звітування, а не для обробки транзакцій. Вихідні дані для OLAP – це онлайнова база даних для обробки транзакцій (OLTP), які зазвичай зберігаються в складських приміщеннях. Дані OLAP походять від цих історичних даних і агрегуються в структури, які дають можливість складного аналізу. Дані OLAP також упорядковано ієрархічно та зберігатимуться в кубах, а не в таблицях. Це складна технологія, яка використовує багатовимірні структури, щоб забезпечити швидкий доступ до даних для аналізу. Ця організація спрощує звіт зведеної таблиці або звіту зведеної діаграми, щоб відобразити зведення на високому рівні, наприклад підсумки збуту в усій країні або регіоні, а також відображати відомості про сайти, у яких збут особливо сильний або слабкий.

Бази даних OLAP призначені для прискорення отримання даних. Оскільки сервер OLAP, а не Microsoft Office Excel, обчислює підсумкові значення, менші дані потрібно надсилати до Excel, коли ви створюєте або змінюєте звіт. Цей підхід дає змогу працювати з великою кількістю вихідних даних, ніж у випадку, якщо дані було організовано в традиційній базі даних, де Excel завантажує всі окремі записи, а потім обчислює підсумкові значення.

База даних OLAP містить два основних типи даних: міри, числові дані, кількість і середні значення, які використовуються, щоб приймати обґрунтовані бізнес-рішення та розміри, які є категоріями, які використовуються для впорядкування цих заходів. Бази даних OLAP допомагають впорядкувати дані за багатьма рівнями деталізації, використовуючи ті самі категорії, які ви знайомі з аналізом даних.

OLAP куб – багатовимірне відображення даних (наприклад, продукти переглядаються за регіоном, поділом чи групою покупців). Це підхід полягає у відображенні даних у вигляді кубу, де кожна грань відповідає єдиному виміру (регіон, поділ, група).

Аналітик може зрозуміти значення, що містяться в базі даних, використовуючи багатовимірний аналіз. При зіставленні змісту даних з власною ментальною моделлю ймовірність непорозуміння чи неправильного трактування інформації значно знижується. Аналітик може переміщуватися базою, здійснювати пошук певної підмножини даних, змінюючи їх орієнтацію і виконуючи певні обчислення. Процес пошуку даних, ініційований користувачем, з використанням поворотів, проникнення вглиб і вгору часом називають «Slice and Dice».

Стандартні операції включають зріз (slice), багатошаровий зріз (dice), проникнення вглиб (drill down), згортку (roll up), а також вісь повороту (pivot) [3]:

зріз: це підмножина багатовимірного масиву, що відповідає одному значенню для одного чи кількох членів вимірів, які не потрапили до підмножини;

багатовимірний зріз: операція багатовимірного зрізу – це зріз по більше, ніж двох вимірах кубу даних;

проникнення вглиб/вгору: ця операція є спеціальним аналітичним методом, за якого користувач проглядає різні рівні даних, починаючи з найбільш загального і закінчуючи найбільш деталізованим (згори донизу), або навпаки;

згортка: при згортці обчислюються всі відношення між даними для одного або декількох вимірів. Для цього може бути наперед визначена формула;

вісь повороту: використовується для зміни орієнтації виміру.

Accessibility

Шрифти

Розмір шрифта

1

Колір тексту

Колір тла