Лабораторна робота №7. Метод найближчих сусідів (KNN)
Задача прогнозування відтоку клієнтів (Churn prediction) полягає у визначенні, які клієнти компанії можуть припинити користуватися її послугами або продуктами протягом певного часу.
Факт відтоку зазвичай кодується міткою (0 або 1) та позначає клієнтів, які припинять користуватися продуктом або послугою протягом певного періоду часу. Клієнти відмовляються від користування послугами з різних причин, таких як погане обслуговування, незадоволення продуктом, чутливість до ціни, кращі альтернативи та зміни обставин, наприклад переїзд. Аналітики даних знаходять ознаки, що можуть впливати на відтік, та будуть відповідні прогнозні моделі машинного навчання.
Для набору даних https://www.kaggle.com/datasets/fridrichmrtn/user-churn-dataset
1. Виконати описовий аналіз даних.
2. На основі описового аналізу даних зробити висновки про необхідні процедури обробки даних та виконати попередню обробку даних.
3. Побудувати моделі класифікації: KNN, Random Forest, SVM, Gradient Boosting.
4. Оцінити якість побудованих моделей за допомогою кросвалідації із використанням метрики https://scikit-learn.org/1.5/modules/generated/sklearn.metrics.matthews_corrcoef.html