Alışveriş Sepeti

cart-img

Sepetiniz Boş

Kursları İncele

Genel Toplam:

0.00 ₺
Anasayfa Blog

Neden t-Testi Değil, Tukey Testi?

Neden t-Testi Değil, Tukey Testi?

09 Ekim 2021
<!-- wp:image {"id":2657,"sizeSlug":"full","linkDestination":"none"} -->

<!-- /wp:image --><!-- wp:heading {"level":4} -->

Çoklu Karşılaştırmalarda Tukey Testi'ni Uygulamak

<!-- /wp:heading --><!-- wp:paragraph -->

İstatistiksel analizlerimizde ortalama karşılaştırma testlerini hemen her sayısal veri için kullanıyoruz. Özellikle k>2 grubun ortalamalarını karşılaştırırken, ANOVA testi sonucunu anlamlı bulduğumuzda, Tukey testine sıklıkla başvuruyoruz.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Ünlü araştırmacı Tukey tarafından 1953 yılında kaleme alınmış "The Problem of Multiple Comparisons" isimli eserinde, kendi adını verdiği bu teste ilk kez rastlıyoruz.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Peki Tukey testini ne zaman uygulayabiliriz?

<!-- /wp:paragraph --><!-- wp:paragraph -->

Öncelikle, en az üç grup arasında, seçtiğimiz sayısal değişkenin ortalamalarını karşılaştırmak gibi istatistiksel bir amacımızın olması gerekiyor.

<!-- /wp:paragraph --><!-- wp:paragraph -->

O halde bu testi uygulamak için gerekli iki bileşenimiz şunlar olmalı:

<!-- /wp:paragraph --><!-- wp:paragraph -->

1) En az üç gruba sahip kategorik bir bağımsız değişken(X)

<!-- /wp:paragraph --><!-- wp:paragraph -->

2) Oransal veya aralıklı ölçme düzeyine sahip sayısal bir bağımlı değişken (Y)

<!-- /wp:paragraph --><!-- wp:paragraph -->

Ancak bu noktada da bir ön koşul var:

<!-- /wp:paragraph --><!-- wp:paragraph -->

Sayısal değişkenimizin normal dağılım varsayımını sağlaması gerekiyor.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Tabi bu normallik testini, kullandığımız bağımsız kategorik değişkenin gruplarına göre incelememiz gerekiyor.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Yani gruplara göre sayısal ölçümlerimizin normal dağılışlı olması gerekiyor. Sayısal değişkenin tamamı için normal dağılım varsayımına bakmıyoruz, bu noktaya özellikle dikkat!

<!-- /wp:paragraph --><!-- wp:paragraph -->

Örneğin; sağlık alanında bir araştırma yürütürken, üç farklı tansiyonun ilacı arasında kişilerde oluşan kan basıncındaki ortalamaları test etmek istiyoruz.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Amacımızın da üç farklı tansiyon ilacı arasında kan basıncı ortalamalarına göre istatistiksel açıdan anlamlı bir farkın olup olmadığını test etmek olsun.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Bu amacı gerçekleştirebilmek için, ilk aşamada her tansiyon ilacı için kan basıncı ölçümlerinin normal dağılıma uygunluklarını test etmeliyiz.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Eğer normal dağılım koşulu sağlanıyorsa, bu durumda varyans analizi (ANOVA) testi ile, artık ortalamaları karşılaştırabiliriz.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Farz edelim, F-istatistiğimize göre en az iki grup arasında anlamlı farkın olduğunu belirledik.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Artık sıra, çoklu karşılaştırmalara geldi.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Elbette, arada bir de varyans homojenliği varsayımı var; bu varsayımın da sağlanmış olduğunu saptadığımızda, artık Tukey testini kullanabiliriz.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Özetle, Tukey testini kullanabilmek için üç koşulun da sağlanmış olması gerekiyor:

<!-- /wp:paragraph --><!-- wp:list -->
  • Sayısal verilerin gruplara göre normal dağılıma sahip olması
  • Sayısal verilerin varyanslarının gruplar arasında homojen dağılması
  • ANOVA testi sonucunda gruplar arası anlamlı farkın bulunması
<!-- /wp:list --><!-- wp:image {"id":2661,"sizeSlug":"full","linkDestination":"none"} -->

<!-- /wp:image --><!-- wp:heading {"level":4} -->

Peki Neden t-testi Yerine Tukey Testini Tercih Ediyoruz?

<!-- /wp:heading --><!-- wp:paragraph -->

Anlamlı bulunan bir ANOVA testi sonucunda, doğal olarak aklımıza şu soru gelmektedir:

<!-- /wp:paragraph --><!-- wp:paragraph -->

Neden ayrı ayrı bağımsız örneklemler t-testi yerine Tukey testi kullanıyoruz?

<!-- /wp:paragraph --><!-- wp:paragraph -->

Evet, normalde ikili ikili t-testleri ile çoklu karşılaştırmaları gerçekleştirebiliriz.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Ancak bu durumda, istatistikte tip-1 hata olarak tanımladığımız bir hataya düşmüş olabiliriz.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Tip-1 hata, doğru olan bir Ho hipotezini reddetme hatası olarak tanımlanabilir.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Bizim Ho hipotezlerimiz, ortalama karşılaştırma testlerinde şu şekilde kuruluyor:

<!-- /wp:paragraph --><!-- wp:paragraph -->

Ho: Gruplar arası ortalamalara göre istatistiksel olarak anlamlı fark yoktur.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Hı: Gruplar arası ortalamalara göre istatistiksel olarak anlamlı fark vardır.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Bu hataya yakalandığımız takdirde, ortalamalar arası fark yokken fark varmış gibi yanlış bir sonuca erişebiliriz.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Peki ayrı ayrı t-testi yapmak, bizi neden bir hataya sürüklemektedir?

<!-- /wp:paragraph --><!-- wp:paragraph -->

Çünkü her bir testin, istatistiksel açıdan bir maliyeti vardır ve bu maliyet de hata olarak karşımıza çıkar.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Araştırmamızda hata payını alfa=0.05 alırsak (ki genelde bu değeri alırız) bunu aşağıdaki şekilde formülize edebiliriz:

<!-- /wp:paragraph --><!-- wp:image {"id":2662,"width":239,"height":31,"sizeSlug":"full","linkDestination":"none"} -->

<!-- /wp:image --><!-- wp:paragraph -->

Burada m, uyguladığımız test sayısını gösterir. Eğer tek adımda çoklu karşılaştırma gerçekleştirmek yerine ayrı ayrı t-testi uygularsak, m, yani test sayısına bağlı olarak hata olasılığımız da artacaktır.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Bu formülasyona göre m=3 test uyguladığımızda, P(Hata olasılığı) artık 0.05 değil; yaklaşık 0.143 olur.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Matematiksel denklemde de açıkça gördüğümüz üzere, ikişerli çok sayıda farklı t-testi uygulamak, tip-1 hata düzeyimizi artırıyor.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Çalışmamızdaki grup sayısı arttıkça tip-1 hata olasılığımız da üstel olarak artış gösterecektir, bu kesin.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Örneğin; grup sayımızın k=6 olduğunu düşündüğümüzde, ortaya çıkacak anlamlı fark sonuçlarının da doğruluğundan şüphe etmemiz kaçınılmaz olacaktır.

<!-- /wp:paragraph --><!-- wp:paragraph -->

İşte Tukey testinin istatistiksel formülasyonu, bizi bu tür bir hata olasılığından koruyor ve bu nedenle çok sayıda t-testi uygulamak yerine, Tukey testini kullanıyoruz.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Kuşkusuz Tukey testinden farklı olarak bizi tip-1 hataya düşmekten kurtaracak farklı hipotez testleri de mevcut. Alternatif olarak Scheffe, Duncan, Tamhane, Games-Howell gibi çok sayıda hipotez testine başvurabilir ve çoklu karşılaştırmalarımızı gerçekleştirebiliriz.

<!-- /wp:paragraph --><!-- wp:paragraph -->

R, SPSS, Minitab, SAS gibi istatistiksel programlar sayesinde bu testleri kolaylıkla uygulayabiliyoruz.

<!-- /wp:paragraph --><!-- wp:paragraph -->

Gelecek yazılarımızda çoklu karşılaştırma testleri üzerinde durmaya devam edeceğiz.

<!-- /wp:paragraph -->
Paylaş :

Bunları beğenebilirsiniz.

02 Ekim 2021

Tez İstatistiklerinde Analiz Hataları

Emre Dünder
30 Ekim 2021

Kaplan Meier Analizi Nedir?

Emre Dünder