Застосування методів оптимізації для навчання нейронних мереж із великим обсягом параметрів

В. В. Яценко; І. О. Сеник

Автор(и)

В. В. Яценко Донецький національний університет імені Василя Стуса
І. О. Сеник Донецький національний університет імені Василя Стуса

Анотація

Метою дослідження стане аналіз алгоритмів оптимізації. Під час дослідження необхідно розглянути методи оптимізації, їх особливості, переваги та обмеження, які впливають на навчання великих нейронних мереж, надати ідею комбінованого методу і підсумувати відповідну інформацію.

Біографії авторів

В. В. Яценко , Донецький національний університет імені Василя Стуса

здобувач вищої освіти

І. О. Сеник , Донецький національний університет імені Василя Стуса

асистент кафедри інформаційних технологій

Посилання

What is Deep Learning? URL: https://cloud.google.com/discover/what-is-deep-learning (дата звернення: 28.11.2024).

What Is a Transformer Model? URL: https://blogs.nvidia.com/blog/what-is-a-transformermodel/ (дата звернення: 28.11.2024).

What’s a loss function? URL: https://www.datarobot.com/blog/introduction-to-loss-functions/ (дата звернення: 28.11.2024).

Wu T., Zeng P., Song An C. optimization Strategy for Deep Neural Networks Training. URL: https://ieeexplore.ieee.org/document/10009665 (дата звернення: 28.11.2024).

Understanding RMSprop – faster neural network learning. URL: https://towardsdatascience. com/understanding-rmsprop-faster-neural-network-learning-62e116fcf29a (дата звернення: 28.11.2024).

Застосування методів оптимізації для навчання нейронних мереж із великим обсягом параметрів

Автор(и)

Анотація

Біографії авторів

В. В. Яценко , Донецький національний університет імені Василя Стуса

І. О. Сеник , Донецький національний університет імені Василя Стуса

Посилання

##submission.downloads##

Опубліковано

Номер

Розділ

Інформація

Мова