Лабораторна робота №5. Класифікація текстових даних

1. Ознайомитись з набором даних Spooky Author Identification (https://www.kaggle.com/c/spooky-author-identification). 

2. Виконати описовий аналіз даних.

3. Використовуючи приклад https://www.kaggle.com/avk256/lab1-ex провести попередню обробку даних.

4. Використовуючи приклад https://www.kaggle.com/avk256/lab2-ex  виконати векторизацію набору даних 

5. Застосувати метод Word2vec з прикладу до набору даних df[‘text’].

6. Побудувати модель класифікації текстів та порівняти ефективність використання різних підходів до векторизації тексту.