Життєвий цикл проектів з аналізу даних CRISP DM. Розвідувальний аналіз даних. 

Статистичні розподілення. Кореляційно-регресійний аналіз: метод найменших квадратів, коефіцієнти кореляції, діаграма розсіювання. 

Основи класифікації: логістична регресія, наївний класифікатор Баєса, дерева рішень, метод k найближчих сусідів, метод опорних векторів. 

Основи кластеризації: метод k середніх. Метрики оцінки якості регресії, класифікації, кластеризації. Метод кросвалідації. Засоби мови програмування Python розв’язання задач кореляції, класифікації, кластеризації: бібліотека sklearn. 

У практичній частині курсу розв'язуються наступні задачі: класифікація на наборі даних Iris, Mnist. Регресія на наборі даних цін на нерухомість. Навчання з вчителем, без вчителя, з підкріпленням.


Кредити: 3
Семестр: 123