Автоматизація інформаційного пошуку у просторі Google Scholar

Опис завдання

З огляду на значний обсяг наукових даних, що постійно публікуються в академічних джерелах, ефективний пошук релевантної інформації стає критично важливим для наукових досліджень, зокрема у соціології. Виконання цього завдання вимагає від студентів автоматизованого пошуку та завантаження наукових статей з Google Scholar за допомогою Python. Такий підхід значно полегшує процес збору наукових першоджерел і дозволяє швидко отримувати доступ до релевантних документів без необхідності вручну здійснювати запити та переглядати великі обсяги результатів.

Автоматизація пошуку наукових статей у Google Scholar надає кілька важливих переваг для науковців:

  1. Автоматизація процесу. Використовуючи Python, ви можете зекономити час і зусилля, адже код самостійно здійснює пошук, завантажує статті та зберігає результати у вигляді таблиць і PDF-файлів.
  2. Ефективність. Код дозволяє знаходити до 1000 результатів для кожного запиту, що значно перевищує можливості ручного пошуку. Це дає змогу отримати більш повну вибірку для аналізу.
  3. Масштабованість. За допомогою Python можна легко змінювати кількість ключових слів або параметри пошуку, щоб охопити більше даних для подальшого аналізу та узагальнення.
  4. Відсутність необхідності використання API ключів. На відміну від попередніх методів, де потрібно було використовувати ключі API, у Google Scholar таких вимог немає. Це спрощує процес налаштування.

Для успішної роботи коду вам знадобляться:

  • Файл коду “search_scholar.py”, доступний для завантаження у спільній папці на Dropbox.
  • Файл із ключовими словами (keywords.txt), де кожне ключове слово для пошуку буде записане на новому рядку.

Всі результати роботи (виконання) коду (завантажені файли та файли з результатами пошуку) повинні бути збережені у спільній папці на Dropbox, доступ до якої потрібно отримати зазделегіть від викладача.

N.B.

Мінімальна кількість результатів для кожного ключового слова — 100 результатів. Google Scholar дозволяє виконати до 1000 запитів на день, що значно полегшує пошук у порівнянні з іншими сервісами. Якщо у вас декілька ключових слів, система зможе ефективно опрацювати всі запити за один день.

Для кожного ключового слова створюються окремі папки, де зберігаються всі знайдені PDF-файли. Результати також автоматично збираються в Excel-файл, що спрощує їх подальший аналіз.

Відео-інструкція щодо налаштування та запуску коду - (для перегляду відео необхідно попередньо отримати доступ за відповідним зверненням до викладача).