Curso: Новітні наукові дослідження в сфері штучного інтелекту

Perfilado de sección

Seleccionar sección General

Colapsar Expandir
General

Colapsar todo Expandir todo
Дисципліна «Новітні наукові дослідження в сфері штучного інтелекту» знайомить студентів із визначними сучасними науковими публікаціями з різних напрямів штучного інтелекту, формує навички читання статей, критичного аналізу та відтворення результатів: реалізація фрагментів методів, або тестування готових моделей з GitHub / Hugging Face.

Метою вивчення навчальної дисципліни «Новітні наукові дослідження в сфері штучного інтелекту» є формування уявлення про ключові напрями сучасного ШІ та їх еволюцію; навчити читати наукові статті та визначати основні структурні елементи (постановка задачі → метод → експерименти →обмеження); надати практику відтворення/перевірки результатів на відкритих коді та моделях.
У результаті вивчення навчальної дисципліни «Новітні наукові дослідження в сфері штучного інтелекту» студент зможе:

знаходити та аналізувати наукові статті (мета, вклад, новизна, експерименти);

запускати/адаптувати репозиторії пов’язані з науковими публікаціями;

обирати та обґрунтовувати методи машинного навчання в залежності від специфіки задачі;

порівнювати підходи та робити висновки за метриками й протоколами оцінювання.

Компетентності, отримані під час вивчення дисципліни «Новітні наукові дослідження в сфері штучного інтелекту», є необхідними для виконання кваліфікаційної роботи магістра.

Лекційні та лабораторні заняття:

професор кафедри програмної інженерії Кудін Олексій Володимирович

e-mail: alexkudin@znu.edu.ua, avk256@gmail.com

Альтернативне посилання для лекцій:
https://meet.google.com/qot-jhyw-onv
- Seleccionar actividad Оголошення
  
  Оголошення Foro
- Seleccionar actividad Силабус
  
  Силабус Archivo
- Seleccionar actividad Інформаційні ресурси
  
  Інформаційні ресурси Archivo
- Seleccionar actividad Список рекомендованої літератури
  
  Список рекомендованої літератури Archivo
- Seleccionar actividad Система накопичення балів
  
  Система накопичення балів Archivo
- Seleccionar actividad Конференція АПМІ
  
  Конференція АПМІ Archivo
- Seleccionar actividad Міжнародна конференція ICTERI (Scopus)
  
  Міжнародна конференція ICTERI (Scopus) URL
- Seleccionar actividad ARC-AGI
  
  ARC-AGI URL
Seleccionar sección Змістовий модуль 1. Великі та малі мовні моделі (LLM) і NLP

Colapsar Expandir
Змістовий модуль 1. Великі та малі мовні моделі (LLM) і NLP
- Seleccionar actividad Тема 1. Базові принципи LLM: трансформери, масштабування, instruction-tuning
  
  Тема 1. Базові принципи LLM: трансформери, масштабування, instruction-tuning Lección
  
  Transformer як базова архітектура сучасних LLM: self-attention, позиційні кодування, обчислювальні компроміси. Розвиток від pretraining до instruction-tuning. Малі мовні моделі (SLM) та сценарії їх використання.
- Seleccionar actividad Тема 2. RAG, tool-use, довгий контекст і якісне оцінювання
  
  Тема 2. RAG, tool-use, довгий контекст і якісне оцінювання Lección
  
  https://docs.google.com/presentation/d/1Th6-pGFKYPr37eqDL4ZkDXjIz6bNkVRc/edit?usp=sharing&ouid=100057449056685372414&rtpof=true&sd=true
- Seleccionar actividad Лабораторна робота №0
  
  Лабораторна робота №0 Tarea
- Seleccionar actividad Лабораторна робота 1. Базові принципи LLM
  
  Лабораторна робота 1. Базові принципи LLM Tarea
  
  Публікація (Scopus) + код
  
  Hu, E. J., Shen, Y., Wallis, P., Allen-Zhu, Z., Li, Y., Wang, S., Wang, L., & Chen, W. (2022). LoRA: Low-Rank Adaptation of Large Language Models. International Conference on Learning Representations (ICLR). (https://openreview.net/forum?id=nZeVKeeFYf9)
  Код (офіційний репозиторій): microsoft/LoRA (https://github.com/microsoft/LoRA)
  
  Шаблон розв'язку https://colab.research.google.com/drive/1posZxSoLlrPi-RkdweDc_Vx8_BMW54p1?usp=sharing
  
  Завдання для самостійної роботи, провести обчислювальні експерименти на новому наборі даних.
  
  https://www.kaggle.com/datasets/abhinavnayak/catsvdogs-transformed
- Seleccionar actividad Fine-Tuning Large Language Models Made Easy: A Practical Guide to LoRA, QLoRA & PEFT
  
  Fine-Tuning Large Language Models Made Easy: A Practical Guide to LoRA, QLoRA & PEFT URL
Seleccionar sección Змістовий модуль 2. Генеративні моделі (GAN/VAE, дифузійні моделі)

Colapsar Expandir
Змістовий модуль 2. Генеративні моделі (GAN/VAE, дифузійні моделі)
- Seleccionar actividad Тема 3. Сучасна генерація зображень і сигналів: дифузійні моделі, керування результатом, редагування
  
  Тема 3. Сучасна генерація зображень і сигналів: дифузійні моделі, керування результатом, редагування Lección
  
  Ідея дифузійних моделей: навчання відновлювати сигнал із шуму. Генерація за текстовим описом: загальна схема та ключові компоненти. Керування процесом генерації: за умовами, за структурою, за зразком. Практика: запуск готової моделі; порівняння режимів генерації та редагування.
- Seleccionar actividad Лабораторна робота 2. RAG, tool-use, довгий контекст
  
  Лабораторна робота 2. RAG, tool-use, довгий контекст Tarea
  
  Публікація (Scopus) + код
  
  Lewis, P., Perez, E., Piktus, A., Petroni, F., Karpukhin, V., Goyal, N., Küttler, H., Lewis, M., Yih, W.-T., Rocktäschel, T., Riedel, S., & Kiela, D. (2020). Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. Advances in Neural Information Processing Systems (NeurIPS). (https://proceedings.neurips.cc/paper/2020/file/6b493230205f780e1bc26945df7481e5-Paper.pdf)
  
  Код для відтворення практики RAG:
  
  Dense Passage Retrieval (DPR) — facebookresearch/DPR (https://github.com/facebookresearch/DPR)
  
  Реалізація RAG у Transformers — huggingface/transformers (модуль RAG) (https://github.com/huggingface/transformers/blob/main/src/transformers/models/rag/modeling_rag.py)
Seleccionar sección Змістовий модуль 3. Агентні системи та автономні робочі процеси

Colapsar Expandir
Змістовий модуль 3. Агентні системи та автономні робочі процеси
- Seleccionar actividad Тема 4. Побудова агентів: планування кроків, пам’ять, робота з інструментами, розв’язання багатокрокових задач
  
  Тема 4. Побудова агентів: планування кроків, пам’ять, робота з інструментами, розв’язання багатокрокових задач Lección
  
  Агент як система, що діє поетапно: постановка підзадач, перевірка, уточнення. Пам’ять: короткочасна та довготривала; зберігання важливої інформації та підсумків. Зменшення помилок через перевірку фактів, використання зовнішніх джерел та контроль кроків. Практика: реалізація простого агента для задачі “пошук-перевіркапідсумок”.
- Seleccionar actividad Лабораторна робота 3. Сучасна генерація зображень і сигналів
  
  Лабораторна робота 3. Сучасна генерація зображень і сигналів Tarea
  
  Публікація (Scopus) + код
  
  Ho, J., Jain, A., & Abbeel, P. (2020). Denoising Diffusion Probabilistic Models. Advances in Neural Information Processing Systems (NeurIPS). (https://proceedings.neurips.cc/paper/2020/file/4c5bcfec8584af0d967f1ab10179ca4b-Paper.pdf)
  Код (офіційний репозиторій авторів): hojonathanho/diffusion (https://github.com/hojonathanho/diffusion)
Seleccionar sección Змістовий модуль 4. Комп’ютерний зір та обробка звуку

Colapsar Expandir
Змістовий модуль 4. Комп’ютерний зір та обробка звуку
- Seleccionar actividad Тема 5. Універсальні моделі для зображень і звуку: трансформери, навчання без розмітки, розпізнавання мовлення
  
  Тема 5. Універсальні моделі для зображень і звуку: трансформери, навчання без розмітки, розпізнавання мовлення Lección
  
  Трансформери у комп’ютерному зорі: поділ зображення на фрагменти та увага. Навчання без розмітки для зображень і звуку: як отримують корисні ознаки без ручного маркування. Розпізнавання мовлення: сучасні підходи, робота з шумами, різними мовами та умовами запису. Практика: тестування готових моделей; аналіз помилок і причин зниження якості.
- Seleccionar actividad Лабораторна робота 4. Побудова агентів
  
  Лабораторна робота 4. Побудова агентів Tarea
  
  Публікація (Scopus) + код
  
  Yao, S., Zhao, J., Yu, D., Du, N., Shafran, I., Narasimhan, K., & Cao, Y. (2023). ReAct: Synergizing Reasoning and Acting in Language Models. International Conference on Learning Representations (ICLR). (https://openreview.net/forum?id=WE_vluYUL-X)
  Код (репозиторій авторів): ysymyth/ReAct (https://github.com/ysymyth/ReAct)
Seleccionar sección Змістовий модуль 5. ШІ для науки та інженерії (AI4Science, PINNs)

Colapsar Expandir
Змістовий модуль 5. ШІ для науки та інженерії (AI4Science, PINNs)
- Seleccionar actividad Тема 6. Моделі для задач науки й техніки: фізично узгоджене навчання, прискорення розрахунків, приклади з біології та матеріалознавства
  
  Тема 6. Моделі для задач науки й техніки: фізично узгоджене навчання, прискорення розрахунків, приклади з біології та матеріалознавства Lección
  
  Фізично узгоджені нейронні мережі: включення рівнянь і законів у процес навчання. Нейромережі для прискорення розрахунків і наближення розв’язків рівнянь. Приклади проривних застосувань у природничих науках (структури білків, матеріали тощо). Практика: демонстраційна реалізація для простої задачі з рівняннями або готовий приклад із відкритого коду: Hugging Face, GitHub.
Seleccionar sección Індивідуальне завдання

Colapsar Expandir
Індивідуальне завдання
- Seleccionar actividad ІДЗ
  
  ІДЗ Tarea
  
  Базова публікація (Scopus) + репозиторій
  
  Rombach, R., Blattmann, A., Lorenz, D., Esser, P., & Ommer, B. (2022). High-Resolution Image Synthesis with Latent Diffusion Models. CVPR 2022. (https://openaccess.thecvf.com/content/CVPR2022/html/Rombach_High-Resolution_Image_Synthesis_With_Latent_Diffusion_Models_CVPR_2022_paper)
  Офіційний код: CompVis/latent-diffusion (https://github.com/CompVis/latent-diffusion)
Seleccionar sección Підсумковий контроль

Colapsar Expandir
Підсумковий контроль
- Seleccionar actividad Тест
  
  Тест Cuestionario

Perfilado de sección

Публікація (Scopus) + код

Публікація (Scopus) + код

Публікація (Scopus) + код

Публікація (Scopus) + код

Базова публікація (Scopus) + репозиторій