Salta al contenido principal

Bloques

Salta Navegación

Navegación

  • Área personal

    • Página principal del sitio

    • Páginas del sitio

      • Mis cursos

      • Marcas

      • ArchivoІнструкція для здобувачів освіти до вибору дисципл...

      • URLВибір дисциплін на 2025-2026 навчальний рік

      • URLВибір дисциплін на 2024-2025 навчальний рік

      • ForoНовини сайту

      • URLІнструкція - основи роботи з системою Moodle

      • URLЦИВІЛЬНИЙ ЗАХИСТ

      • CarpetaНормативна база СЕЗН

      • URLВідновлення пароля

      • ArchivoПам’ятка для користувача системи Moodle

      • ArchivoСистема оцінки курсу

      • EncuestaОцінка якості курсу

    • Mis cursos

    • Cursos

      • Факультети, кафедри

        • Біологічний факультет

        • Економічний факультет

        • Журналістики факультет

        • Інженерний навчально-науковий інститут ім. Ю.М. По...

        • Іноземної філології факультет

        • Математичний факультет

          • Кафедра загальної математики

          • Кафедра загальної та прикладної фізики

          • Кафедра комп'ютерних наук

            • archive

            • Комп’ютерна графіка

            • Системи управління базами даних

            • Методика позашкільної роботи з інформатики

            • Інноваційні методи викладання комп’ютерних дисциплін

            • Системи виявлення вторгнень (Кудін О.В.)

            • Курсова робота з дисципліни "Об`єктно-орієнтоване ...

            • Методи тестування на проникнення та моделювання атак

            • Інтернет сервіси в освітній діяльності

            • Кібербезпека штучного інтелекту

            • Управління ризиками інформаційної безпеки

            • Штучний інтелект у кібербезпеці: захист і атаки

            • Python для аналізу даних

              • General

              • Теоретичні матеріали

              • Лабораторні роботи

              • Контроль знань

                • Cuestionario01 Основні операції з даними (3)

                • Cuestionario02 Перевірка статистичних гіпотез (3)

                • Cuestionario03. Очищення даних (3)

                • Cuestionario04. Візуалізація (3)

                • Cuestionario05. Робота з часовими послідовностями (3)

                • Cuestionario06. NLTK (3)

                • Cuestionario07 Scraping (3)

                • Cuestionario08 Робота з графами (3)

                • CuestionarioПідсумковий контроль (20)

                • TareaІндивідуальне завдання

          • Кафедра прикладної математики і механіки

          • Кафедра програмної інженерії

          • Кафедра фундаментальної та прикладної математики

          • Практична підготовка математичного факультету

          • Інформація, Статистика Математичного факультету

        • Менеджменту факультет

        • Соціальної педагогіки та психології факультет

        • Соцiологiї та управлiння факультет

        • Факультет історії та міжнародних відносин

        • Факультет фізичного виховання, здоров'я та туризму

        • Філологічний факультет

        • Юридичний факультет

      • Аспірантура

      • Науково-технічна позашкільна освіта

      • Підготовчі курси до ЗНО

      • Адміністративний розділ

      • Центр післядипломної освіти та професійних кваліфі...

      • Школа педагогічної майстерності

  • Cerrar
    Selector de búsqueda de entrada
  • Español - Internacional ‎(es)‎
    • Русский ‎(ru)‎
    • Українська ‎(uk)‎
    • Deutsch ‎(de_old)‎
    • English ‎(de)‎
    • English ‎(en)‎
    • Español - Internacional ‎(es)‎
    • Français ‎(fr)‎
    • Italiano ‎(it)‎
    • Polski ‎(pl)‎
  • Entrar

Python для аналізу даних

Cerrar
Selector de búsqueda de entrada
Вибір дисциплін Colapsar Expandir
Вибір дисциплін Colapsar Expandir
Обрати дисципліни Статистика вибору дисциплін ВМУ Результати вибору дисциплін
  1. Inicio
  2. Cursos
  3. Факультети, кафедри
  4. Математичний факультет
  5. Кафедра комп'ютерних наук
  6. Python для аналізу даних
  7. Контроль знань
  8. Індивідуальне завдання

Індивідуальне завдання

Requisitos de finalización

Завдання

Проведіть аналіз клієнтської бази компанії за неповним або зашумленим датасетом (наприклад, у 30% записів відсутня стать, а 10% — з явно помилковим віком). Оцініть вплив відновлення даних різними методами (медіана, kNN, моделі прогнозування) на результати класифікації.

Оцініть вплив різних стратегій імпутації (median, KNN, регресійна модель тощо) для age, gender, income.

Побудуйте класифікаційну модель (наприклад, логістичну регресію або Random Forest), яка прогнозує purchase_made.

Проведіть порівняння результатів метрик класифікації (accuracy, F1-score, ROC‑AUC) між різними методами відновлення даних.

Дані для аналізу кожен студент отримує окремо від викладача.

Етапи виконання

1. Завантаження даних: pandas.read_csv()
2. Відновлення пропусків:
    - median для age і income;
    - KNN Imputer для числових і категоріальних полів (scikit-learn);
    - регресійна модель для прогнозу income, наприклад RandomForestRegressor.

3. Обробка категорій: заміна gender на найчастіше, або через KNN/імовірнісний спосіб.
4. Навчання моделі на декількох варіантах імпутації.
5. Порівняння результатів з графіками або таблицями.


Запитання

1. Які метрики класифікації слід обрати — і чому їх використовують окрім accuracy?
2. Як тип відсутності (MCAR, MAR, MNAR) може вплинути на вибір методу імпутації?
3. Який метод дав найстабільніші результати на ваших даних та чому?

Actividad previa
Підсумковий контроль (20)
Resumen de retención de datos
Descargar la app para dispositivos móviles