Застосування методів оптимізації для навчання нейронних мереж із великим обсягом параметрів

Автор(и)

  • В. В. Яценко Донецький національний університет імені Василя Стуса
  • І. О. Сеник Донецький національний університет імені Василя Стуса

Анотація

Метою дослідження стане аналіз алгоритмів оптимізації. Під час дослідження необхідно розглянути методи оптимізації, їх особливості, переваги та обмеження, які впливають на навчання великих нейронних мереж, надати ідею комбінованого методу і підсумувати відповідну інформацію.

Біографії авторів

В. В. Яценко , Донецький національний університет імені Василя Стуса

здобувач вищої освіти

І. О. Сеник , Донецький національний університет імені Василя Стуса

асистент кафедри інформаційних технологій

Посилання

What is Deep Learning? URL: https://cloud.google.com/discover/what-is-deep-learning (дата звернення: 28.11.2024).

What Is a Transformer Model? URL: https://blogs.nvidia.com/blog/what-is-a-transformermodel/ (дата звернення: 28.11.2024).

What’s a loss function? URL: https://www.datarobot.com/blog/introduction-to-loss-functions/ (дата звернення: 28.11.2024).

Wu T., Zeng P., Song An C. optimization Strategy for Deep Neural Networks Training. URL: https://ieeexplore.ieee.org/document/10009665 (дата звернення: 28.11.2024).

Understanding RMSprop – faster neural network learning. URL: https://towardsdatascience. com/understanding-rmsprop-faster-neural-network-learning-62e116fcf29a (дата звернення: 28.11.2024).

##submission.downloads##

Опубліковано

2025-11-02

Номер

Розділ

СЕКЦІЯ 3 ЕКСПЕРТНІ, РЕКОМЕНДАЦІЙНІ СИСТЕМИ ТА СИСТЕМИ ПІДРИМКИ ПРИЙНЯТТЯ РІШЕНЬ