Лабораторна робота №5. Дерева розв'язків у задачах класифікації та регресії

Для набору даних https://www.kaggle.com/datasets/uciml/iris

1. Виконати описовий аналіз даних. Візуалізувати дані у вигляді гістограм та точкових діаграм
2. Виконати побудову дерев розв'язків для класифікації. 
3. Визначити точність побудованої моделі за такими метриками: Confusion matrix, Accuracy, Precision, Recall, F1 Score, застосувати крос-валідацію.

Для набору даних Boston House Prices https://www.kaggle.com/vikrishnan/boston-house-prices виконати такі завдання:

1. Виконати описовий аналіз даних

2. Підготувати дані для моделювання, використовуючи розділення даних на вибірку для навчання та тренування (https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html)

3. Побудувати лінійну регресійну модель (https://scikit-learn.org/stable/modules/linear_model.html#ordinary-least-squares) залежності ціни від параметрів нерухомості із використанням дерев розв'язків регресії. 

4. Побудувати нелінійну регресійну модель (https://scikit-learn.org/stable/modules/generated/sklearn.neighbors.KNeighborsRegressor.html) залежності ціни від параметрів нерухомості

5. Використати крос-валідацію (https://scikit-learn.org/stable/modules/cross_validation.html) для остаточного визначення точності побудованих моделей 

6. Порівняти отримані результати. Яка модель (лінійна або нелінійна) точніше наближає дані?

7. Які метрики використовуються для визначення точності моделей регресії?