İstatistik biliminin önemli konularından birisi bağımlılık yapısının belirlenmesidir.
Doğrusal olmayan bağımlılıklarla ilgilenen kopulalar ise bağımlılık yapılarının tespiti için
kullanılan yeni ve popüler araçlardandır. Kopula temelli kümeleme tekniklerinden CoClust
ve kuyruk bağımlılığı ile kümeleme teknikleri bağımlılık yapıları gösteren değişkenlerin
kümelemesinde yardımcı olmaktadır. Bu tez çalışmasında, iki kümeleme tekniği
aracılığıyla değişkenler arasındaki bağımlılık yapısı incelenmiştir. Böylelikle, tekniklerden
elde edilen sonuçlar karşılaştırılarak, bağımlılık yapısı gösteren değişkenler birlikte
değerlendirilmiştir. Bağımlı olduğu belirlenen değişkenler mortalitenin tespitinde
kullanılmıştır. Mortalite tahmini, binlerce hasta hakkında bilgi içeren MIMIC veri
tabanının son versiyonu olan MIMIC-III kullanılarak modellenmiştir. Mortalitenin tespiti
bağımlı değişkenlerin Lojistik Regresyon Analizi ile modellenmesiyle sağlanmıştır.
Belirlenen modellerin geçerlilikleri hata matrisi, çapraz geçerlilik ölçütü ve ROC eğrisi ile
incelenmiştir. Her iki tekniğin de anlamlı ve geçerli modeller verdiği tespit edilmiştir
One of the important issues of statistical science is to determine the structure of
dependence. Copulas dealing with nonlinear dependencies are new and popular tools used
for the detection of addiction structures. CoClust and tail dependency and clustering
techniques, which are copula based clustering techniques, help clustering variables
showing dependency structures. In this thesis, the dependency structure between the
variables is examined through two clustering techniques. Thus, the results obtained from
the techniques are compared and the variables showing dependency structure are evaluated
together. Then, dependent variables were used to determine mortality. Mortality estimation
was modeled using MIMIC-III, the latest version of the MIMIC database, which contains
information about thousands of patients. The determination of mortality is provided by
modeling dependent variables with Logistic Regression Analysis. The validity of the
determined models was examined with error matrix, cross validity criterion and ROC
curve. Both techniques are found to provide meaningful and valid models