Модульний контроль 1
Модульний контроль 1
Виконати модульну контрольну роботу. Максимальна кількість балів - 30
Варіант1.
Теоретична частина (12 балів - правильна повна відповідь на кожне питання оцінюється максимально 4 бали)
- Поясніть значення попередньої обробки даних у процесі створення систем штучного інтелекту. Які наслідки можуть виникати у випадку її відсутності?
- Порівняйте підходи масштабування числових ознак: стандартизація, нормалізація та робастне масштабування.
- Обґрунтуйте важливість виявлення викидів. Які методи застосовуються найчастіше і чому?
Практична частина (18 балів - правильно виконане та описане кожне завдання оцінюється максимально 6 бали)
- Завантажте обраний датасет (наприклад, Titanic, Iris або інший з відкритих джерел). Виконайте його початковий аналіз: визначте кількість змінних, їх типи, наявність пропусків.
- Виконайте масштабування числових ознак за допомогою StandardScaler та MinMaxScaler. Побудуйте графіки розподілу значень до та після трансформації.
- Виявите викиди у двох числових ознаках за допомогою методу інтерквартильного розмаху (IQR). Продемонструйте результати на графіках (boxplot).
Варіант2.
Теоретична частина (12 балів - правильна повна відповідь на кожне питання оцінюється максимально 4 бал
- Охарактеризуйте основні типи пропусків у даних (MCAR, MAR, MNAR) та методи їх обробки.
- Дайте визначення категоріальних змінних та наведіть приклади методів їхнього кодування.
- Поясніть роль балансу класів у задачах класифікації. Які наслідки може мати дисбаланс?
Практична частина (18 балів - правильно виконане та описане кожне завдання максимально 6 бали)
- Реалізуйте обробку пропущених значень трьома різними способами: видаленням рядків, заміною середнім/медіаною та за допомогою алгоритму KNNImputer. Порівняйте отримані результати.
- Проведіть кодування категоріальних змінних двома способами: One-Hot Encoding та Label Encoding. Поясніть відмінності між підходами та їх вплив на подальше навчання моделей.
- Побудуйте кореляційну матрицю для числових ознак і виконайте її візуалізацію у вигляді теплової карти. Поясніть, які ознаки можуть виявитися надлишковими.
Шрифти
Розмір шрифта
Колір тексту
Колір тла
Кернінг шрифтів
Видимість картинок
Інтервал між літерами
Висота рядка
Виділити посилання