Стислий опис курсу
ОПИС КУРСУ
Метою вивчення навчальної дисципліни «Математичні моделі обробки великих даних» є оволодіння системними знаннями з основних теоретичних положень та методів й моделей обробки та видобування високо-вимірних, велико-об¢ємних, швидко-змінюваних різноформатних даних, а також вироблення навичок застосування сучасних інформаційних систем та технологій обробки великих даних у практичній діяльності.
Основними завданнями вивчення
дисципліни «Математичні моделі обробки великих даних» є:
● оволодіння студентами базовими теоретичними знаннями стосовно методів, алгоритмів та моделей інструментальних засобів обробки великих даних;
● набуття вмінь та практичних навичок обробки великих даних за допомогою технологій Hadoop, Spark;
● набуття вмінь та навичок щодо створення коллаборативної фільтрації в MapReduce;
● оволодіння студентами знаннями щодо використання алгоритмів пошуку нечітких дублікатів та асоціативних правил;
● оволодіння знаннями та набуття навичок з проведення аналізу потоків даних та web-посилань;
● набуття навичок використання методів зменшення розмірності простору даних.
ОЧІКУВАНІ
РЕЗУЛЬТАТИ НАВЧАННЯ
У разі успішного завершення курсу студент зможе:
знати:
- основні поняття, сутність, характерні риси та види великих даних;
- концепції роботи з великими даними;
- основні компоненти, особливості та шляхи використання систем обробки великих даних;
- методи видобування даних, які застосовуються для хешування та потокової обробки даних;
- особливості та шляхи використання моделей розподілених файлових систем;
- сутність, умови використання та етапи основних алгоритмів пошуку нечітких дублікатів, методів й моделей аналізу потоків даних, моделей ранжирування web-посилань;
- основні методи й алгоритми зменшення розмірності простору даних;
- основні рекомендаційні моделі та алгоритми;
вміти:
- використовувати сучасні методи обробки великих даних;
- обирати алгоритми й методи обробки даних для вирішення професійних задач аналізу великих даних;
- застосовувати спеціалізовані алгоритми обробки потокових даних для аналізу швидкозмінних даних;
- поєднувати існуючі алгоритми обробки великих даних для вирішення комплексних задач;
- використовувати моделі і методи рекомендаційних систем;
- проводити аналіз потоків даних, web-посилань, здійснювати пошук схожих об’єктів у web-документах та пошук асоціативних правил з виявленням частих предметних наборів в потоці даних при розв’язанні конкретних задач.
Згідно з вимогами освітньо-професійної програми студенти повинні досягти таких компетентностей:
КЗ 1 Здатність до абстрактного мислення, аналізу та синтезу.
КЗ 2 Здатність застосовувати знання у практичних ситуаціях.
КЗ 5 Здатність вчитися і оволодівати сучасними знаннями.
КС 6 Здатність використовувати сучасні інформаційні системи та технології (виробничі, підтримки прийняття рішень, інтелектуального аналізу даних та інші), методики й техніки кібербезпеки під час виконання функціональних завдань та обов’язків.
КС 12 Здатність управляти та користуватися сучасними інформаційно-комунікаційними системами та технологіями (у тому числі такими, що базуються на використанні Інтернет).
Програмні результати
навчання:
ПР 2 Застосовувати знання фундаментальних і природничих наук, системного аналізу та технологій моделювання, стандартних алгоритмів та дискретного аналізу при розв’язанні задач проєктування і використання інформаційних систем та технологій.
ПР 6 Демонструвати знання сучасного рівня технологій інформаційних систем, практичні навички програмування та використання прикладних і спеціалізованих комп’ютерних систем та середовищ з метою їх впровадження у професійній діяльності.
ПР 15 Розробляти та використовувати моделі машинного навчання для обробки даних і прогнозування в інформаційних системах.