Araştırmacılar doğrusal olmayan örneklerde esnekliği elde etmek için
parametrik modellerin geliştirilmesine yönelmişlerdir. Veri modellemede parametrik
modeller çok boyutlu problemlere başarı ile uygulanırken esneklik varsayımlarını
sağlayamayıp, yanlı tahminler vermektedir. Parametrik olmayan yöntemler ise esnekliği
sağlar fakat yüksek boyutlarda güçlük çekmektedirler.
Esneklik varsayımlarını sağlayan GMR yöntemi, verideki heterojeniteyi
belirlemek ya da aşırı yayılmayı açıklamak için regresyon modellerinin sonlu karmaları
kullanılarak oluşturulur. Regresyon modeli oluşturulurken yoğunluk fonksiyonunu
modelleme amacıyla kullanılır, verinin bileşik yoğunluğu modellenir ve GMM’den
regresyon fonksiyonu türetilir.
Bu çalışmanın amacı, GMR yönteminin teorik temellerini açıklamak,
Doğrusal ve Karesel Ayırma Analizi ile Esnek Ayırma Analizi yöntemlerinden MARS
ve BRUTO Analizlerinin sonuçlarını karşılaştırmak, türetilmiş veriler kullanarak ayırma
problemlerinde kullanımını göstermek ve Model Tabanlı Kümeleme yöntemlerini
açıklamaktır.
Veri türetimi ve analizlerde; ortalama vektörleri, kovaryans matrisleri ve
grup gözlem sayıları değiştikçe ayırma yöntemlerinin doğruluk oranları arasındaki
değişiklikler, grup sayısının artışı ile birlikte ayırma yöntemlerinin doğruluk oranları
arasındaki değişimler ve GMM’e Model Tabanlı Kümeleme yöntemi uygulayarak en iyi
modelin belirlenmesi ve Poisson gürültü (Poisson noise) uygulandığındaki ayırma
yönteminin nasıl uygulandığı gösterilmiştir.
Sonuç olarak Kovaryans matrisinin parametrizasyonuna göre, grup ortalama
vektörleri arasındaki farka göre doğruluk oranlarının değiştiği, grup gözlem sayılarına
göre doğruluk oranlarının değişmediği, büyük gözlem sayılarında GMR’nin yüksek vi
doğruluk oranları verdiği gözlenmiştir. GMR parametrik olmayan regresyon
modellemede diğer yöntemlerin yerine kullanılabilir.
The analysts have gone towards to developing the parametric methods to get
flexibility in non linear samples. Parametric models could be applied in high dimensions
but could not supply the flexibility assumptions, this results in biassed forecasting. Non
parametric methods have problems in high dimensions.
GMR is a flexible method used to determine the heterogenity in data and
explain the overdispersion with Finite Mixtures. The GMM is used to model the density
function and the joint density of the data and derived the regression function.
The main goal of this research is to explain the theoretic basis of GMR and
to compare the analysis results with Lineer, Quadratic, MARS, BRUTO discriminant
analysis and to show how the analysis work in discrimination when the simulation data
is used and to explain the model-based DA.
For simulations and analysis; it is shown that, how the accuracy proportions
of the discriminant methods changed when the mean vector, covariance matrix and
group observation sizes are changed, how the accuracy proportions of discrimant
methods are changed when the groups are increased, what is the best model when the
model-based cluster method is applied to GMM, how the discriminant method works
after poisson noise added to the model.
Finally the accuracy ratios are changed due to the covariance matrix
parametrization and the difference between mean vectors, but the group observation
sizes. The GMR should be used in non parametric regression modeling instead of other
methods.