Лабораторна робота №5. Класифікація текстових даних
1. Ознайомитись з набором даних Spooky Author Identification (https://www.kaggle.com/c/spooky-author-identification).
2. Виконати описовий аналіз даних.3. Використовуючи приклад https://www.kaggle.com/avk256/lab1-ex провести попередню обробку даних.
4. Використовуючи приклад https://www.kaggle.com/avk256/lab2-ex виконати векторизацію набору даних
5. Застосувати метод Word2vec з прикладу до набору даних df[‘text’].
6. Побудувати модель класифікації текстів та порівняти ефективність використання різних підходів до векторизації тексту.