Модульний контроль 1
Модульний контроль 1
Виконати модульну контрольну роботу. Максимальна кількість балів - 30
Варіант1.
Теоретична частина (12 балів - правильна повна відповідь на кожне питання оцінюється максимально 4 бали)
- Поясніть значення попередньої обробки даних у процесі створення систем штучного інтелекту. Які наслідки можуть виникати у випадку її відсутності?
- Порівняйте підходи масштабування числових ознак: стандартизація, нормалізація та робастне масштабування.
- Обґрунтуйте важливість виявлення викидів. Які методи застосовуються найчастіше і чому?
Практична частина (18 балів - правильно виконане та описане кожне завдання оцінюється максимально 6 бали)
- Завантажте обраний датасет (наприклад, Titanic, Iris або інший з відкритих джерел). Виконайте його початковий аналіз: визначте кількість змінних, їх типи, наявність пропусків.
- Виконайте масштабування числових ознак за допомогою StandardScaler та MinMaxScaler. Побудуйте графіки розподілу значень до та після трансформації.
- Виявите викиди у двох числових ознаках за допомогою методу інтерквартильного розмаху (IQR). Продемонструйте результати на графіках (boxplot).
Варіант2.
Теоретична частина (12 балів - правильна повна відповідь на кожне питання оцінюється максимально 4 бал
- Охарактеризуйте основні типи пропусків у даних (MCAR, MAR, MNAR) та методи їх обробки.
- Дайте визначення категоріальних змінних та наведіть приклади методів їхнього кодування.
- Поясніть роль балансу класів у задачах класифікації. Які наслідки може мати дисбаланс?
Практична частина (18 балів - правильно виконане та описане кожне завдання максимально 6 бали)
- Реалізуйте обробку пропущених значень трьома різними способами: видаленням рядків, заміною середнім/медіаною та за допомогою алгоритму KNNImputer. Порівняйте отримані результати.
- Проведіть кодування категоріальних змінних двома способами: One-Hot Encoding та Label Encoding. Поясніть відмінності між підходами та їх вплив на подальше навчання моделей.
- Побудуйте кореляційну матрицю для числових ознак і виконайте її візуалізацію у вигляді теплової карти. Поясніть, які ознаки можуть виявитися надлишковими.
Шрифти
Розмір шрифта
Колір тексту
Колір тла
Кернінг шрифтів
Видимість картинок
Інтервал між літерами
Висота рядка
Виділити посилання
Вирівнювання тексту
Ширина абзацу