Методи боротьби з дисбалансом класів в датасетах для навчання нейронних мереж
Анотація
На сьогодні все частіше використовуються нейронні мережі в всіх сферах життя людини, проєкти на їх основі дають можливість автоматизувати чи полегшити ті задачі, які вважались недоступними для комп’ютера і були прерогативою виключною людини. Але часто перешкодою в створення якісної моделі нейромережі є поганий вибір даних для навчання, одною з проблем в даних є дисбаланс класів який представляє собою значну різницю представлених класів яка виникає через внутрішні фактори, такі як природній розподіл даних, а саме медичні діагнози, коли більшість пацієнтів здорові, або ж зовнішні, що виникають через процедури збору чи зберігання даних.
Посилання
Survey on deep learning with class imbalance [Електронний ресурс]. Режим доступу до ресурсу: https://journalofbigdata.springeropen.com/articles/10.1186/s40537-019-0192-5
Japkowicz N. The class imbalance problem: Significance and strategies. In: In proceedings of the 2000 international conference on artificial intelligence (ICAI). 2000;111–7.
Ships in Satellite Imagery [Електронний ресурс] // Online Journal for Research and Education. – 2021. – Режим доступу до ресурсу: https://www.kaggle.com/datasets/rhammell/ships-in-satellite-imagery