Лабораторна робота № 6

1. Оберіть згідно варіанту у методичних вказівках два набори даних. Файли наведено у архіві regression.zip. Виконайте для них наступні завдання.

2. Завантажте дані та за необхідності виконайте попередню обробку даних.

3. Вирішіть задачу регресії за допомогою наступних методів:

o Linear regression;

o SMOreg;

o M5P (model trees and regression trees) з наступними параметрами налаштування:

build regression tree: True, unpruned: True, useUnsmoothed: True;

build regression tree: True, unpruned: False, useUnsmoothed: True;

build regression tree: False, unpruned: True, useUnsmoothed: True;

build regression tree: False, unpruned: False, useUnsmoothed: True;

o kNN.

4. Запишіть отримані моделі і порівняйте їхню ефективність (точність передбачення).

5. Наведіть результати прогнозування для 5 довільних екземплярів.

6. Які з атрибутів є найбільш значущими для передбачення значень цільового атрибуту, судячи з побудованих моделей? Чому? Як зміниться точність передбачення, якщо залишити лише значущі атрибути?