Робоча програма
Методичні вказівки до вивчення дисципліни
Дейтамайнінг (інтелектуальний аналіз даних) – це процес виявлення у первинних даних раніше невідомих, доступних, практично корисних і нетривіальних інтерпретацій знань, необхідних для прийняття рішень у різних сферах людської діяльності.
Метою викладання навчальної дисципліни «Дейтамайнінг» є вивчення методів сучасної обробки даних – інтелектуального аналізу даних (Data Mining, Knowledge Discovery in Data), аналітичного дослідження великих масивів інформації з метою виявлення нових раніше невідомих, практично корисних знань і закономірностей, необхідних для прийняття рішень; огляд методів, програмних продуктів і різних інструментальних засобів, які використовуються Data Mining; розгляд практичних прикладів застосування Data Mining; підготовка студентів до самостійної роботи з вирішення задач засобами Data Mining і розробки інтелектуальних систем.
Data Mining – мультидисциплінарна область, яка виникла і розвивається на базі таких наук як прикладна статистика, розпізнавання образів, штучний інтелект, теорія баз даних та ін.
Основними завданнями вивчення дисципліни «Дейтамайнінг» є:
− опанувати базові принципи побудови моделей даних;
− ознайомитися з концепцією Knowledge Discovery in Data (виявлення знань в даних) и Data Mining («видобування» знань);
− навчитися ефективно використовувати методи здобуття знать з великих масивів даних;
− ознайомитися з основними типами задач, що можуть бути вирішені за допомогою методів інтелектуального аналізу даних;
− отримати практичні навички з використання інструментальних засобів інтелектуального аналізу даних при вирішенні прикладних задач та навчитися інтерпретувати отримані результати.
Згідно з вимогами освітньо-професійної програми студенти повинні: знати :
− основні поняття, задачі та стадії інтелектуального аналізу даних;
− підходи до збереження, представлення та обробки інформації в сучасних інформаційних системах;
− методи побудови моделей та аналізу взаємозв’язків у великих масивах даних;
− сучасні програмні засоби для проектування i розробки систем інтелектуального аналізу даних;
− концепції сховищ даних, їх оперативної аналітичної обробки для практичного використання.
вміти :
− обґрунтовувати вибір конкретного типу моделі та методу інтелектуального аналізу даних при вирішенні поставленої практичної задачі;
− проводити необхідну попередню обробку даних, визначати тип задачі аналізу, вирішувати її адекватно з обраним методом та оптимально визначеними параметрами, оцінювати результати, робити змістовні висновки та інтерпретацію;
− використовувати сучасні програмні засоби для проектування та дослідження систем інтелектуального аналізу даних;
− застосовувати технології роботи зі сховищами даних, здійснювати їх аналітичну обробку та інтелектуальний аналіз для забезпечення надійної роботи інформаційних систем;
− проектувати інформаційне забезпечення (логічну та фізичну структури баз даних) інформаційних систем.
МОДУЛЬ 1. СУТНІСТЬ ТА АЛГОРИТМИ ДЕЙТАМАЙНІНГУ
1. Концепція дейтамайнінгу
Визначення Data Mining і область застосування. Задачі, моделі та методи Data Mining. Поняття Business Intelligence. Цикл одержання, попередньої обробки, аналізу даних, інтерпретації результатів та їхнього використання. Етапи процесу Data Mining, пов’язані з побудовою, перевіркою, оцінкою, вибором и корекцією моделей. Методи первісної обробки даних. Методи дослідження структури даних: візуалізація та автоматичне групування даних.
Тема 2. Алгоритми Data Mining: класифікація і регресія
Постановка задачі класифікації та представлення результатів. Методи побудови правил класифікації. Методи побудови математичних функцій. Класифікація об’єктів у випадку невідомих розподілень даних. Методи оцінювання помилок класифікації. Методи вирішення задач регресії.
Тема 3. Інтелектуальний аналіз часових рядів
Поняття нечітких часових рядів. Методи моделювання часових рядів. Методи аналізу та прогнозування поведінки часових рядів.
Тема 4. Алгоритми Data Mining: кластеризація
Постановка задачі кластеризації та представлення результатів. Види кластерів. Міри близькості, засновані на відстанях. Базові алгоритми кластеризації. Адаптивні методи кластеризації.
МОДУЛЬ 2. Моделювання бізнес-економічних систем із складними взаємозв’язками
Тема 5. Технології нейронних мереж та генетичні алгоритми
Визначення та еволюція нейронних мереж. Математична модель штучного нейрона. Програмне забезпечення нейромереж. Апаратне забезпечення нейромереж. Діапазон застосування нейромереж, їх переваги та недоліки.
Тема 6. Дерева рішень як метод дейтамайнінгу
Сутність дерев рішень, особливості їх використання та побудови. Дерева рішень для дослідження альтернатив. Сутність класифікації альтернативних варіантів та методи її проведення. Загальний опис дерев класифікації. Способи побудови класифікаційних дерев рішень.
Тема 7. Сховища даних та оперативний аналіз даних (OLAP)
Визначення сховища даних, порівняння з базами даних, використання.. Архітектура сховища даних. ETL-процеси (добування, перетворення й завантаження даних). Вітрини даних, куби даних, багатомірна модель даних. Архітектура OLAP-систем: MOLAP, ROLAP, HOLAP.
Шрифти
Розмір шрифта
Колір тексту
Колір тла