Örneklem Büyüklüğü Hesaplama ve İstatistik Açısından Önemi
Araştırmalara başlamadan önce kaç birimlik örneklem ile çalışacağımızı, istatistik biliminin öngördüğü ölçütlere göre belirlememiz gerekiyor. Örneklem büyüklüğü hesaplama işlemleri için istatistiğin bizlere sunduğu
alternatif çözüm yolları bulunuyor.
Bu yazımızda, örneklem büyüklüğü hesaplama yaklaşımlarını
istatistiksel bir bakış açısı ile değerlendireceğiz.
İlk aşamada örneklem büyüklüğüne ilişkin genel bilgilere göz atalım.
Örneklem, bir anakütle içerisinden seçtiğimiz bir alt kümedir. Bilimsel araştırmalarımızda anakütlenin tamamına erişemediğimiz için örneklemler üzerinden çıkarımlar yapıyoruz.
Diyabet hastalığı üzerine bir araştırma kurguladığımızı düşünelim. Türkiye'de kabaca 7 milyon diyabet hastasının var olduğu biliniyor. Araştırmamızın güvenilir olması için tüm hastalar
(yani 7 milyon kişi!) üzerinden veri toplamak son derece cazip.
Gönül ister ki, tüm diyabet hastalarına ulaşalım ve bu hastalar üzerinden araştırmamızı sürdürelim.
Peki bu mümkün mü? Elbette değil. 7 milyon hastanın tamamına ulaşmak ne zamanımız, ne de paramız yeter.
Her bir dakikada bir hasta bulsak (ki pek mümkün değil) yaklaşık 13.5 yıl durmaksızın (sürekli hasta bularak) hastalara ulaşmamız gerekir.
Bu yüzden bütün hastalar ile çalışmak yerine araştırma amacımıza uygun olacak şekilde bir
örneklem üzerinden genel sonuçlar bulmaya çalışıyoruz.
Burada kaç birimlik bir örneklem ile çalışacağımızı çok iyi belirlememiz şart.
Gerektiğinden az sayıda bir örneklem, çalışmamızın
yetersiz ve
genellenebilir olmaktan uzak olmasına yol açacaktır. Ayrıca çalışmanın istatistiksel gücünü azaltacağı için de
anlamsız sonuçların ortaya çıkmasına sebep olacaktır.
Bu durumda gerektiğinden düşük örneklem sayıları ile çalıştığımızda ortalamalar arası farklılıkların, korelasyon katsayılarının, regresyon katsayılarının istatistiksel olarak anlamsız olduğu sonuçlara hazır olalım!
Bir de tam tersini düşünelim.
Örneklem büyüklüğü hesaplama süreci sonunda gerektiğinden fazla bir örneklem seçtiğimizde, bu durum bize para ve zaman maliyeti olarak geri dönecektir. Bir hastanın verisine erişebilmek için 5$ harcasak (ki bu rakam çok iyimser) ek 100 gözlem bize 500$ olarak yansıyacaktır.
Bu durumda yapmamız gereken basit:
Ne az, ne çok; optimum örneklem büyüklüğünü hesaplamamız gerekiyor.
Örneklem Büyüklüğü Hesaplamaya Yönelik 3 Temel Strateji
Örneklem büyüklüğünü belirleyebilmemiz için kullanabileceğimiz üç temel yaklaşım var:
1) İstatistiksel güç analizi (diğer deyişle power analizi)
2) Örnekleme formülleri
3) Genel kabul gören örnekleme kuralları
İstatistiksel güç analizi
İstatistiksel
güç analizi klinik araştırmalarında ve sağlık çalışmalarında en sık başvurduğumuz örnekleme tekniklerinin başında geliyor. Etik kurul raporlarında örneklem büyüklüğü hesaplamak için öngördüğümüz güç değerinin verilmesi, raporumuzun bilimsel açısından önem taşıyor. En az %80 güç değerine ulaşmamız bekleniyor.

Bu aşamada farklı örneklem büyüklükleri üzerinden güç değerlerini hesaplayarak bir sayı belirleyebiliyoruz. Güç analizi sırasında referans bir çalışma,
pilot çalışma verileri ya da
hazır etki değerlerinden (Cohen-d) yararlanıyoruz.
Örnekleme formülleri
Örneklem büyüklüğü hesaplama aşamasında tanımlayıcı istatistiklere ya da test istatistiklerine dayalı örnekleme formüllerini de kullanabiliriz. Bu noktada araştırmaya ilişkin bir hata payı
(alfa, z-değeri) ve duyarlılık
(d) değerlerini mutlaka belirlemeliyiz. Tanımlayıcı istatistiklerden de referans bir çalışmadan alınan
oran ya da
standart sapma (s) ölçüsünü kullanabiliyoruz.
Aşağıda en sık kullanılan iki örnekleme formülleri gösterilmektedir:

Bu formüllerde eğer anakütle hacmini (N) biliyorsak, 2. formüle geçiş yapıyoruz. Standart sapma için oran değeri kullandığımızda
s=p(1-p) eşitliğini ikame ediyoruz.
Deney hayvanlarına yönelik düşük örneklemli çalışmalarda ise alternatif örnekleme formüllerine başvurabiliriz.
Aşağıda
tek grup için klinik
deney hayvanlarına yönelik araştırmalarda kullanabileceğimiz elverişli bir formülü gösterelim:

Bu formülde
β istenilen güç değerini,
p ise araştırılan oran değerini gösterir.
Deney hayvanları üzerinde kanser araştırması yaptığımızı düşünelim. Kanserli hasta oranını
%40 olacak şekilde
%90 güç değerine ulaşmak için en az 4.51=~5 gözlem ile çalışmamız gerekir.
Bu formül deney hayvanlarının kullanıldığı bilimsel araştırmalarında
minimum maliyet özelliği sayesinde tercih edilebilir.
Bu tür örnekleme formülleri diğer istatistiksel analiz yöntemlerine göre de değişk
enlik gösterir. Yapısal eşitlik modellemesi, kümeleme analizi gibi çeşitli istatistiksel analiz tekniklerinde yöntemlere özgü formülasyonlar mevcuttur.
Genel örnekleme kuralları
Bu kategoriye giren örneklem büyüklüğü hesaplama yaklaşımları genel literatürde kabul görmüş referans sayılara dayanmaktadır. Bu tür kurallar, araştırmacıların kendi simülasyon çalışmalarından ya da deneysel bulgularından hareketle ortaya atılmıştır.
En çok kabul gören yaklaşım, anket araştırmalarında bir soruya karşılık beş, on ya da yirmi gözlem toplama kuralıdır. Yani bu kurala göre
soru sayısının en az 5 katı, 10 katı ya da 20 katı kadar örneklem elde edilmelidir.
Genel kabule göre
en az 1:5 oranında örneklem ile çalışılması beklenmektedir.
Bazı araştırmacılar doğrudan
en az 300 ya da 400 gözlem ile çalışılabileceğini öngörmektedir.
Genel örnekleme kuralları bazında istatistik literatüründe çok sayıda farklı subjektif yaklaşımın var olduğunu belirtelim.
Örneklem büyüklüğü hesaplam
a yaklaşımlarını G*Power, Minitab, Stata, R-Project gibi istatistik yazılımları aracılığı ile uygulayabiliriz. Gelecek yazılarımızda bu konuyu derinlemesine inceleyeceğiz.