Belirtme Katsayısı ve Genel Tanımı
Belirtme katsayısı istatistik analizi uygulamalarında regresyon analizi aşamalarında sıkça karşılaştığımız bir istatistiksel ölçüdür. Dilimize doğrudan
coefficient of determination teriminin çevirisi şeklinde giriş yapmıştır. Bu ölçüyü genelde
R-kare şeklinde görmekteyiz. Şimdi bu ölçünün genel yapısına bir göz atalım.
Öncelikle regresyon analizine ait bazı aşamalardan bahsetmekte fayda var.
Regresyon analizinde bir ya da birden çok bağımlı ve bağımsız değişkenler ile çalışmaktayız. Burada sezgilerimiz bize hemen şu soruyu sorduruyor: Acaba seçtiğimiz bağımsız değişkenler, bağımlı değişkenimizi
ne ölçüde temsil etmektedir? Seçtiğimiz bu değişkenler gerçekten
uygun mudur? Kurduğumuz model gerçekten
elverişli midir?
Bu sorularımızı yanıtlayabilmemiz için bazı ölçütlere ihtiyacımız olacağı açıktır. Tıpkı günlük hayatta kullandığımız ölçütlerde olduğu gibi. Örneğin; kan şekerimizin 70'in üzerinde ve 110'un altında olmasının da bir ölçüt olması gibi, bizim de regresyon analizi kapsamında bir takım ölçütlere ihtiyacımız var.
Bu ölçütlerin başında
belirtme katsayısı, yani
R-kare gelmektedir.
Belirtme katsayısı, bağımsız değişkenlerin açıklama oranını göstermektedir. Bir diğer ifade ile, bağımlı değişkenin bağımsız değişkenler tarafından
açıklanan varyans oranını temsil etmektedir.
Değer Aralığı ve Yorumlanışı
R-kare ölçüsü,
[0,1] aralığında yer almaktadır. Regresyon modellerinde
çoklu korelasyon katsayısının karesi biçiminde hesaplanıyor. R-kare değeri her ne kadar bir ifadenin karesi olarak tanımlansa da, bazı özel durumlarda
negatif çıkabilmektedir.
Belirtme katsayısının sıfır olması bağımsız değişkenlerin bağımlı değişkeni hiç açıklayamadığını; bir olması ise tam olarak açıklayabildini gösterir. Burada sıfır olması modelin
%0, bir olması da modelin
%100 açıklayıcılığa sahip olduğuna işaret etmektedir. Hesaplanan R-kare değerine göre bağımsız değişkenlerin bağımlı değişkeni yüzde kaç düzeyinde açıklayabildiğini söyleyebiliriz.
Bu değerin
1'e yakın olması istenen bir durumdur. Ancak kesin bir sınır olmamakla birlikte, R-kare değerinin en az
0.40 olması beklenmektedir.
Belirtme katsayısını kullanabileceğimiz biricik alan,
lineer regresyon analizidir. Ancak yaln
ızca lineer regresyon analizinde değil; panel veri analizi, lojistik regresyon analizi, Poisson regresyon analizi gibi çok sayıda modelleme tekniği içerisinde de kullanabiliriz. Yine de teorik özellikler açısından R-kare,
normal dağılıma uygunluk varsayımı altında kurulan lineer regresyon modellerinde kesin olarak yorumlanabilme özelliğine sahiptir.
İstatistiksel analiz ve ekonometrik modelleme dahilinde, diğer birçok farklı regresyonda alışıldığı şekilde yorumlanamaz ve kullanılamaz. Bunun için
sahte (Pseudo) R-kare ölçüleri önerilmiştir.
Belirtme katsayısına dair söylenecek çok şey var. Model karşılaştırma, düzeltilmiş versiyonları, sahte versiyonları gibi farklı konular üzerinde duracağız.