Gauss karma regresyon analizinin türetilmiş verilerde etkinliğinin araştırılması

Ana Sayfa
→
Enstitüler
→
Sağlık Bilimleri Enstitüsü
→
Biyoistatistik ve Tıbbi Bilişim A.B.D. Koleksiyonu
→
Öğe Göster

Gauss karma regresyon analizinin türetilmiş verilerde etkinliğinin araştırılması

Aydemir, Eylem Itır

Tarih: 2009

Özet:

Araştırmacılar doğrusal olmayan örneklerde esnekliği elde etmek için parametrik modellerin geliştirilmesine yönelmişlerdir. Veri modellemede parametrik modeller çok boyutlu problemlere başarı ile uygulanırken esneklik varsayımlarını sağlayamayıp, yanlı tahminler vermektedir. Parametrik olmayan yöntemler ise esnekliği sağlar fakat yüksek boyutlarda güçlük çekmektedirler. Esneklik varsayımlarını sağlayan GMR yöntemi, verideki heterojeniteyi belirlemek ya da aşırı yayılmayı açıklamak için regresyon modellerinin sonlu karmaları kullanılarak oluşturulur. Regresyon modeli oluşturulurken yoğunluk fonksiyonunu modelleme amacıyla kullanılır, verinin bileşik yoğunluğu modellenir ve GMM’den regresyon fonksiyonu türetilir. Bu çalışmanın amacı, GMR yönteminin teorik temellerini açıklamak, Doğrusal ve Karesel Ayırma Analizi ile Esnek Ayırma Analizi yöntemlerinden MARS ve BRUTO Analizlerinin sonuçlarını karşılaştırmak, türetilmiş veriler kullanarak ayırma problemlerinde kullanımını göstermek ve Model Tabanlı Kümeleme yöntemlerini açıklamaktır. Veri türetimi ve analizlerde; ortalama vektörleri, kovaryans matrisleri ve grup gözlem sayıları değiştikçe ayırma yöntemlerinin doğruluk oranları arasındaki değişiklikler, grup sayısının artışı ile birlikte ayırma yöntemlerinin doğruluk oranları arasındaki değişimler ve GMM’e Model Tabanlı Kümeleme yöntemi uygulayarak en iyi modelin belirlenmesi ve Poisson gürültü (Poisson noise) uygulandığındaki ayırma yönteminin nasıl uygulandığı gösterilmiştir. Sonuç olarak Kovaryans matrisinin parametrizasyonuna göre, grup ortalama vektörleri arasındaki farka göre doğruluk oranlarının değiştiği, grup gözlem sayılarına göre doğruluk oranlarının değişmediği, büyük gözlem sayılarında GMR’nin yüksek vi doğruluk oranları verdiği gözlenmiştir. GMR parametrik olmayan regresyon modellemede diğer yöntemlerin yerine kullanılabilir.

The analysts have gone towards to developing the parametric methods to get flexibility in non linear samples. Parametric models could be applied in high dimensions but could not supply the flexibility assumptions, this results in biassed forecasting. Non parametric methods have problems in high dimensions. GMR is a flexible method used to determine the heterogenity in data and explain the overdispersion with Finite Mixtures. The GMM is used to model the density function and the joint density of the data and derived the regression function. The main goal of this research is to explain the theoretic basis of GMR and to compare the analysis results with Lineer, Quadratic, MARS, BRUTO discriminant analysis and to show how the analysis work in discrimination when the simulation data is used and to explain the model-based DA. For simulations and analysis; it is shown that, how the accuracy proportions of the discriminant methods changed when the mean vector, covariance matrix and group observation sizes are changed, how the accuracy proportions of discrimant methods are changed when the groups are increased, what is the best model when the model-based cluster method is applied to GMM, how the discriminant method works after poisson noise added to the model. Finally the accuracy ratios are changed due to the covariance matrix parametrization and the difference between mean vectors, but the group observation sizes. The GMR should be used in non parametric regression modeling instead of other methods.

Tüm öğe kaydını göster