Bu tez çalışmasında sağlık alanında yapay zekâ (artificial intelligence,
AI) literatürüne ve bu alanda çalışma yapmak isteyen araştırmacılara ilgili teorik alt
yapıyı sunarak kalp yetersizliği mortalitesinin ML sınıflandırma algoritmalarıyla
tahminlenmesi konusunda uygulama çalışması ile katkı sağlamak amaçlanmıştır.
Yöntem: Makine Öğrenmesi (machine learning, ML) insan beyninin anlama
kapasitesini aşan verileri anlamlı bir şekilde işlemek için gerekli olan temel
teknolojidir. Geleneksel yaklaşımlar ile makine öğrenmi arasındaki temel fark, makine
öğreniminde bir modelin kurallarla programlanmak yerine örneklerden öğrenmesidir.
Tahmine dayalı doğruluğun kritik öneme sahip olduğu özellikle sağlık
uygulamalarında olduğu gibi yüzlerce değişken ve birimler arasında istatistiksel
modeller bulma işlemi ancak insanüstü bir performansla mümkün olabilmektedir.
Bununla birlikte, bu modeller yeni tedavilerin geliştirilmesinin önemli rol oynayan
temel tıbbi yöntemlerin veya risk faktörlerinin tanımlanmasına da yardımcı
olmaktalardır. Ayrıca, özelleştirilmiş makine öğrenmesi modelleri hekimlerin girdiği
tıp notları, tıbbi görüntüler, sensörlerden gelen izleme verileri ve yardımcı genomik
veriler gibi modern klinik bakımdan üretilen karmaşık ve heterojen veri türlerinden
öğrenmek için de çok uygundur. Kalp yetersizliği; kalbin, dokuların metabolik
ihtiyaçlarını karşılayacak ölçüde oksijen sağlayamamasına neden olan işlevsel veya
kardiyak yapısal bir bozukluk olarak tanımlanmaktadır. Kalpteki işlevsel ya da yapısal
bozukluk sebepli hastalarda görünen klinik bir sendromdur. Kalp yetersizliği hayatı
olumsuz etkileyen bir sağlık problemidir. Amerikan Kalp Birliği (American Heart
Association) 2012-2030 yılları arası akut kalp yetersizliğinde yaklaşık olarak %46’lık
bir artma öngörmüştür. Bu tez çalışmasında kalp yetersizliği mortalitesini tahmin
etmek amacıyla makine öğrenmesi sınıflandırma yöntemlerinden olan yapay sinir ağı,
destek vektör makinesi, naive bayes sınıflandırıcı, k en yakın komşuluk, lojistik
regresyon, karar ağacı ve rasgele orman algoritmaları kullanılmıştır. Veri sayısını
artırmak amacıyla sentetik veri türetme işlemi uygulanmıştır. Ayrıca model
iv
doğruluğunu artırma için çapraz doğrulama uygulanmıştır. Karmaşıklık matrisi ve
ROC AUC (Receiver Operating Characteristic, Area Under The Curve) skoru ile
model başarısı ölçülmüştür.
Bulgular: Yapılan uygulama çalışmasında kalp yetersizliği mortalitesinde risk
faktörlerinin hasta takip süresi, ejeksiyon fraksiyonu, serum kreatinin düzeyi ve
hastanın yaşı olduğu tespit edilmiştir. Uygulama sonucunda %85.0 doğruluk, %78.1
duyarlık, %88.2 özgüllük ve %83.1 ROC AUC değerlerine Rasgele Orman
algoritmasıyla ulaşılmıştır.
Sonuç: Sonuç olarak kalp mortalitesinin tahminlenmesinde makine öğrenmesi
sınıflandırma algoritmalarının kullanımı hekimlere karar destek mekanizması olarak
önemli bir katkı sunma potansiyeline sahip olduğu görülmüştür
In this thesis, it is aimed to contribute to the artificial intelligence
(AI) literature in the field of health and to the researchers who want to work in this
field, by presenting the relevant theoretical infrastructure, with an application study on
the estimation of heart failure mortality with ML classification algorithms.
Method: Machine Learning (ML) is the underlying technology needed to
meaningfully process data that exceeds the human brain's comprehension capacity.
The main difference between traditional approaches and machine learning is that in
machine learning, a model learns from examples rather than being programmed with
rules. Finding statistical models among hundreds of variables and units, especially in
healthcare applications where predictive accuracy is critical, is only possible with
superhuman performance. However, these models also help identify key medical
modalities or risk factors that play an important role in the development of new
treatments. In addition, customized machine learning models are well suited for
learning from complex and heterogeneous data types generated by modern clinical
care, such as physician-input medical notes, medical images, tracking data from
sensors, and ancillary genomic data. Heart failure is defined as a functional or cardiac
structural disorder that causes the heart to not be able to provide oxygen to meet the
metabolic needs of the tissues. It is a clinical syndrome that appears in patients with
functional or structural disorders in the heart. Heart failure is a health problem that
negatively affects life. The American Heart Association predicted an approximately
46% increase in acute heart failure between 2012 and 2030. In this thesis, artificial
neural network, support vector machine, naive bayes classifier, k nearest neighbor,
logistic regression, decision tree and random forest algorithms, which are machine
learning classification methods, were used to predict heart failure mortality. In order
to increase the number of data, synthetic data derivation was applied. In addition, cross
validation was applied to increase model accuracy. Model success was measured by
vi
confusion matrix and ROC AUC (Receiver Operating Characteristic, Area Under The
Curve) score.
Results: In the practice study, it was determined that the risk factors for heart
failure mortality were the duration of patient follow-up, ejection fraction, serum
creatinine level and age of the patient. As a result of the application, 85.0% accuracy,
78.1% sensitivity, 88.2% specificity and 83.1% ROC AUC values were reached with
Randım Forrest algorithm.
Conclusion: In conclusion, it has been seen that the use of machine learning
classification algorithms in the estimation of cardiac mortality has the potential to
provide an important contribution to physicians as a decision support mechanism