Автоматизація інформаційного пошуку у просторі Google Scholar
Опис завдання
З огляду на значний обсяг наукових даних, що постійно публікуються в академічних джерелах, ефективний пошук релевантної інформації стає критично важливим для наукових досліджень, зокрема у соціології. Виконання цього завдання вимагає від студентів автоматизованого пошуку та завантаження наукових статей з Google Scholar за допомогою Python. Такий підхід значно полегшує процес збору наукових першоджерел і дозволяє швидко отримувати доступ до релевантних документів без необхідності вручну здійснювати запити та переглядати великі обсяги результатів.
Автоматизація пошуку наукових статей у Google Scholar надає кілька важливих переваг для науковців:
- Автоматизація процесу. Використовуючи Python, ви можете зекономити час і зусилля, адже код самостійно здійснює пошук, завантажує статті та зберігає результати у вигляді таблиць і PDF-файлів.
- Ефективність. Код дозволяє знаходити до 1000 результатів для кожного запиту, що значно перевищує можливості ручного пошуку. Це дає змогу отримати більш повну вибірку для аналізу.
- Масштабованість. За допомогою Python можна легко змінювати кількість ключових слів або параметри пошуку, щоб охопити більше даних для подальшого аналізу та узагальнення.
- Відсутність необхідності використання API ключів. На відміну від попередніх методів, де потрібно було використовувати ключі API, у Google Scholar таких вимог немає. Це спрощує процес налаштування.
Для успішної роботи коду вам знадобляться:
- Файл коду “search_scholar.py”, доступний для завантаження у спільній папці на Dropbox.
- Файл із ключовими словами (keywords.txt), де кожне ключове слово для пошуку буде записане на новому рядку.
Всі результати роботи (виконання) коду (завантажені файли та файли з результатами пошуку) повинні бути збережені у спільній папці на Dropbox, доступ до якої потрібно отримати зазделегіть від викладача.
N.B.
Мінімальна кількість результатів для кожного ключового слова — 100 результатів. Google Scholar дозволяє виконати до 1000 запитів на день, що значно полегшує пошук у порівнянні з іншими сервісами. Якщо у вас декілька ключових слів, система зможе ефективно опрацювати всі запити за один день.
Для кожного ключового слова створюються окремі папки, де зберігаються всі знайдені PDF-файли. Результати також автоматично збираються в Excel-файл, що спрощує їх подальший аналіз.
Відео-інструкція щодо налаштування та запуску коду -