Класифікація наявності раку грудей
Abstract
Мета роботи показати один з векторів аналізу даних, використовуючи мову програмування R. Досліджуючи кожну змінну: її значення, походження, кореляцію та вплив на інші змінні; обираючи одну модель при різних результатах точності, можна дійти до різних висновків. Оскільки тема датасету для аналізу – тема здоров’я, а власне найстрашнішої хвороби ХХІ століття – раку, необхідно бути дуже обачливим і з скрупульозністю приймати кожне рішення.
References
Wisconsin Breast Cancer Data. URL: https://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+(Diagnostic) (дата звернення: 04.12.2021)
Too much covariates in a multivariable model may cause the problem of overfitting. URL: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4178069/ (дата звернення: 05.12.2021)
Principal Component Analysis. URL: https://en.wikipedia.org/wiki/Principal_component_analysis (дата звернення: 05.12.2021)
Оценка качества в задачах классификации. URL: http://neerc.ifmo.ru/wiki/index.php?title=%D0%9E%D1%86%D0%B5%D0%BD%D0%BA %D0%B0_%D0%BA%D0%B0%D1%87%D0%B5%D1%81%D1%82%D0%B2%D0%B0_ %D0%B2_%D0%B7%D0%B0%D0%B4%D0%B0%D1%87%D0%B0%D1%85_%D0%BA %D0%BB%D0%B0%D1%81%D1%81%D0%B8%D1%84%D0%B8%D0%BA%D0%B0% D1%86%D0%B8%D0%B8 (дата звернення: 05.12.2021)
Probability density function. URL: https://en.wikipedia.org/wiki/Probability_density_function (дата звернення: 05.12.2021)