Meme kanserinin erken aşamada teşhis edilmesi; tedavi yöntemlerinin sayısını, tedavinin başarıya ulaşma oranını ve hayatta kalma şansını arttırmaktadır. Gail Modeli, meme kanserinde temel faktörleri değerlendiren, kabul görmüş kanser riski değerlendirme modelidir. Bu çalışmada Gail Modeli baz alınarak makine öğrenmesi yöntemlerinin meme kanseri risk değerlendirmesinde karşılaştırılması amaçlanmıştır. İlk olarak veri setine Gail Modeli uygulanmış ve risk faktörü belirlenmiş, %70 eğitim %30 test ve %80 eğitim %20 test olmak üzere 2 ayrı eğitim test veri seti oluşturulmuştur. Daha sonra veri setlerine k-En Yakın Komşu, Yapay Sinir Ağları, Destek Vektör Makinesi ve Naive Bayes algoritmaları uygulanmış ve risk tahmin sonuçları karşılaştırılmıştır. Karşılaştırma sonuçlarına göre %70 eğitim %30 test veri seti için sınıflandırma performansı en düşükten en yükseğe doğru sırası ile k-NN (AUC=0.5375), NB (AUC=0.8542), SVM (AUC=0.9375) ve YSA(AUC=0.9875) şeklindedir. %80 eğitim %20 test veri seti için sınıflandırma performansı en düşükten en yükseğe doğru sırası ile k-NN (AUC=0.5892), SVM (AUC=0.9088), NB (AUC=0.9305) ve YSA (AUC=0.9718) şeklindedir
Early diagnosis of breast cancer increases the number of possible treatments, the success rate of the treatments and the chance of survival. The Gail Model is a well accepted cancer risk assessment model which evaluates the main factors in breast cancer. The aim of this work is compare machine learning methods in breast cancer risk assessment based on the Gail Model.SVM, k-NN, ANN, NB algorithm with the purpose of breast cancer risk assessment. Firstly, risk factor was determined using the Gail method on the dataset, then dataset was divided into training - testing sets using 70 - 30 and 80 - 20 splits which resulted in two seperate training and testing sets. Afterwards, on each set, k-NN, ANN, SVM and NB algorithms were applied and results were compared based on the classification performance. According to the comparison results, the classification performance for 70% training and 30% test data set was k-NN (AUC=0.5375), NB (AUC=0.8542), SVM (AUC=0.9375) and ANN (AUC=0.9875) directly from from lowest to highest. On the other hand, for 80% training and 20% test data set, classification performance wasis from lowest to highest, respectively, k-NN (AUC=0.5892), SVM (AUC=0.9088), NB (AUC=0.9305) and ANN (AUC=0.9718)