İstatistiksel analizlerimizde ortalama karşılaştırma testlerini hemen her sayısal veri için kullanıyoruz. Özellikle k>2 grubun ortalamalarını karşılaştırırken, ANOVA testi sonucunu anlamlı bulduğumuzda, Tukey testine sıklıkla başvuruyoruz.
<!-- /wp:paragraph --><!-- wp:paragraph -->Ünlü araştırmacı Tukey tarafından 1953 yılında kaleme alınmış "The Problem of Multiple Comparisons" isimli eserinde, kendi adını verdiği bu teste ilk kez rastlıyoruz.
<!-- /wp:paragraph --><!-- wp:paragraph -->Peki Tukey testini ne zaman uygulayabiliriz?
<!-- /wp:paragraph --><!-- wp:paragraph -->Öncelikle, en az üç grup arasında, seçtiğimiz sayısal değişkenin ortalamalarını karşılaştırmak gibi istatistiksel bir amacımızın olması gerekiyor.
<!-- /wp:paragraph --><!-- wp:paragraph -->O halde bu testi uygulamak için gerekli iki bileşenimiz şunlar olmalı:
<!-- /wp:paragraph --><!-- wp:paragraph -->1) En az üç gruba sahip kategorik bir bağımsız değişken(X)
<!-- /wp:paragraph --><!-- wp:paragraph -->2) Oransal veya aralıklı ölçme düzeyine sahip sayısal bir bağımlı değişken (Y)
<!-- /wp:paragraph --><!-- wp:paragraph -->Ancak bu noktada da bir ön koşul var:
<!-- /wp:paragraph --><!-- wp:paragraph -->Sayısal değişkenimizin normal dağılım varsayımını sağlaması gerekiyor.
<!-- /wp:paragraph --><!-- wp:paragraph -->Tabi bu normallik testini, kullandığımız bağımsız kategorik değişkenin gruplarına göre incelememiz gerekiyor.
<!-- /wp:paragraph --><!-- wp:paragraph -->Yani gruplara göre sayısal ölçümlerimizin normal dağılışlı olması gerekiyor. Sayısal değişkenin tamamı için normal dağılım varsayımına bakmıyoruz, bu noktaya özellikle dikkat!
<!-- /wp:paragraph --><!-- wp:paragraph -->Örneğin; sağlık alanında bir araştırma yürütürken, üç farklı tansiyonun ilacı arasında kişilerde oluşan kan basıncındaki ortalamaları test etmek istiyoruz.
<!-- /wp:paragraph --><!-- wp:paragraph -->Amacımızın da üç farklı tansiyon ilacı arasında kan basıncı ortalamalarına göre istatistiksel açıdan anlamlı bir farkın olup olmadığını test etmek olsun.
<!-- /wp:paragraph --><!-- wp:paragraph -->Bu amacı gerçekleştirebilmek için, ilk aşamada her tansiyon ilacı için kan basıncı ölçümlerinin normal dağılıma uygunluklarını test etmeliyiz.
<!-- /wp:paragraph --><!-- wp:paragraph -->Eğer normal dağılım koşulu sağlanıyorsa, bu durumda varyans analizi (ANOVA) testi ile, artık ortalamaları karşılaştırabiliriz.
<!-- /wp:paragraph --><!-- wp:paragraph -->Farz edelim, F-istatistiğimize göre en az iki grup arasında anlamlı farkın olduğunu belirledik.
<!-- /wp:paragraph --><!-- wp:paragraph -->Artık sıra, çoklu karşılaştırmalara geldi.
<!-- /wp:paragraph --><!-- wp:paragraph -->Elbette, arada bir de varyans homojenliği varsayımı var; bu varsayımın da sağlanmış olduğunu saptadığımızda, artık Tukey testini kullanabiliriz.
<!-- /wp:paragraph --><!-- wp:paragraph -->Özetle, Tukey testini kullanabilmek için üç koşulun da sağlanmış olması gerekiyor:
<!-- /wp:paragraph --><!-- wp:list -->Anlamlı bulunan bir ANOVA testi sonucunda, doğal olarak aklımıza şu soru gelmektedir:
<!-- /wp:paragraph --><!-- wp:paragraph -->Neden ayrı ayrı bağımsız örneklemler t-testi yerine Tukey testi kullanıyoruz?
<!-- /wp:paragraph --><!-- wp:paragraph -->Evet, normalde ikili ikili t-testleri ile çoklu karşılaştırmaları gerçekleştirebiliriz.
<!-- /wp:paragraph --><!-- wp:paragraph -->Ancak bu durumda, istatistikte tip-1 hata olarak tanımladığımız bir hataya düşmüş olabiliriz.
<!-- /wp:paragraph --><!-- wp:paragraph -->Tip-1 hata, doğru olan bir Ho hipotezini reddetme hatası olarak tanımlanabilir.
<!-- /wp:paragraph --><!-- wp:paragraph -->Bizim Ho hipotezlerimiz, ortalama karşılaştırma testlerinde şu şekilde kuruluyor:
<!-- /wp:paragraph --><!-- wp:paragraph -->Ho: Gruplar arası ortalamalara göre istatistiksel olarak anlamlı fark yoktur.
<!-- /wp:paragraph --><!-- wp:paragraph -->Hı: Gruplar arası ortalamalara göre istatistiksel olarak anlamlı fark vardır.
<!-- /wp:paragraph --><!-- wp:paragraph -->Bu hataya yakalandığımız takdirde, ortalamalar arası fark yokken fark varmış gibi yanlış bir sonuca erişebiliriz.
<!-- /wp:paragraph --><!-- wp:paragraph -->Peki ayrı ayrı t-testi yapmak, bizi neden bir hataya sürüklemektedir?
<!-- /wp:paragraph --><!-- wp:paragraph -->Çünkü her bir testin, istatistiksel açıdan bir maliyeti vardır ve bu maliyet de hata olarak karşımıza çıkar.
<!-- /wp:paragraph --><!-- wp:paragraph -->Araştırmamızda hata payını alfa=0.05 alırsak (ki genelde bu değeri alırız) bunu aşağıdaki şekilde formülize edebiliriz:
<!-- /wp:paragraph --><!-- wp:image {"id":2662,"width":239,"height":31,"sizeSlug":"full","linkDestination":"none"} -->Burada m, uyguladığımız test sayısını gösterir. Eğer tek adımda çoklu karşılaştırma gerçekleştirmek yerine ayrı ayrı t-testi uygularsak, m, yani test sayısına bağlı olarak hata olasılığımız da artacaktır.
<!-- /wp:paragraph --><!-- wp:paragraph -->Bu formülasyona göre m=3 test uyguladığımızda, P(Hata olasılığı) artık 0.05 değil; yaklaşık 0.143 olur.
<!-- /wp:paragraph --><!-- wp:paragraph -->Matematiksel denklemde de açıkça gördüğümüz üzere, ikişerli çok sayıda farklı t-testi uygulamak, tip-1 hata düzeyimizi artırıyor.
<!-- /wp:paragraph --><!-- wp:paragraph -->Çalışmamızdaki grup sayısı arttıkça tip-1 hata olasılığımız da üstel olarak artış gösterecektir, bu kesin.
<!-- /wp:paragraph --><!-- wp:paragraph -->Örneğin; grup sayımızın k=6 olduğunu düşündüğümüzde, ortaya çıkacak anlamlı fark sonuçlarının da doğruluğundan şüphe etmemiz kaçınılmaz olacaktır.
<!-- /wp:paragraph --><!-- wp:paragraph -->İşte Tukey testinin istatistiksel formülasyonu, bizi bu tür bir hata olasılığından koruyor ve bu nedenle çok sayıda t-testi uygulamak yerine, Tukey testini kullanıyoruz.
<!-- /wp:paragraph --><!-- wp:paragraph -->Kuşkusuz Tukey testinden farklı olarak bizi tip-1 hataya düşmekten kurtaracak farklı hipotez testleri de mevcut. Alternatif olarak Scheffe, Duncan, Tamhane, Games-Howell gibi çok sayıda hipotez testine başvurabilir ve çoklu karşılaştırmalarımızı gerçekleştirebiliriz.
<!-- /wp:paragraph --><!-- wp:paragraph -->R, SPSS, Minitab, SAS gibi istatistiksel programlar sayesinde bu testleri kolaylıkla uygulayabiliyoruz.
<!-- /wp:paragraph --><!-- wp:paragraph -->Gelecek yazılarımızda çoklu karşılaştırma testleri üzerinde durmaya devam edeceğiz.
<!-- /wp:paragraph -->