Przegląd sekcji

    • Для набору даних https://www.kaggle.com/datasets/uciml/iris

      1. Виконати описовий аналіз даних. Візуалізувати дані у вигляді гістограм та точкових діаграм
      2. Виконати побудову дерев розв'язків для класифікації. 
      3. Визначити точність побудованої моделі за такими метриками: Confusion matrix, Accuracy, Precision, Recall, F1 Score, застосувати крос-валідацію.

      Для набору даних Boston House Prices https://www.kaggle.com/vikrishnan/boston-house-prices виконати такі завдання:

      1. Виконати описовий аналіз даних

      2. Підготувати дані для моделювання, використовуючи розділення даних на вибірку для навчання та тренування (https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html)

      3. Побудувати лінійну регресійну модель (https://scikit-learn.org/stable/modules/linear_model.html#ordinary-least-squares) залежності ціни від параметрів нерухомості із використанням дерев розв'язків регресії. 

      4. Побудувати нелінійну регресійну модель (https://scikit-learn.org/stable/modules/tree.html ) залежності ціни від параметрів нерухомості

      5. Використати крос-валідацію (https://scikit-learn.org/stable/modules/cross_validation.html) для остаточного визначення точності побудованих моделей 

      6. Порівняти отримані результати. Яка модель (лінійна або нелінійна) точніше наближає дані?

      7. Які метрики використовуються для визначення точності моделей регресії?