Korelasyon ve Regresyon Analizi Kavramlarını İnceleyelim
Korelasyon ve regresyon analizi, istatistiksel analiz raporlarımızda ilişkileri sınamak ve bağımlı değişkenimizi modellemek için kullandığımız tekniklerin başında geliyor. Her iki tekniğin birbirine yakın yönlerinin olması,
araştırmacılarda zihin karışıklığı yaratabiliyor.
Bu yazımızda korelasyon ve regresyon analizi arasındaki farklılıkları ve benzerlikleri ele alacağız.
Önce tekniklerin
en temelinden başlayalım. Esasen
geçmiş yazılarımızda her iki tekniğin üzerinde fazlası ile durduk; ama farklı ve benzer olguları şimdi inceleyeceğiz.
Korelasyon analizi dediğimizde ilk aklımıza gelecek olan şey, araştırma değişkenlerimizin arasındaki ilişkilerin sınanmak ve bu ilişkilerin anlamlılıklarını test etmek olacaktır.
İster sayısal, ister kategorik olsun. Her tür veri için korelasyon analizini uygulayabiliyoruz. Yeter ki
doğru değişken tipi için doğru korelasyon katsayısını kullanalım.
Korelasyon analizi ile birlikte (kimi durumlar için) değişkenler arasındaki ilişkilerimizin
yönünü ve ilişkilerin
gücünü ölçebiliyoruz.
Regresyon analizinde ise durum biraz daha farklı. Regresyon analizinde de
değişkenler arası ilişkilere yönelik çıkarımlarda bulunabiliyoruz. Yani bağımlı değişkenimizi etkileyen bağımsız değişkenlerin etkilerini test edebiliyoruz.
Peki korelasyon ve regresyon analizi arasındaki farklar nelerdir?
En temel farkların başında
ilişkilerin nedensellik durumu geliyor.
Korelasyon analizinde değişkenler arasındaki ilişkilerin nedensellik durumları ile ilgilenmiyoruz. İlgilendiğimiz konular değişkenler arası ilişkilerin
anlamlılığı,
yönü ve
derecesi. Dolayısı ile bağımlı-bağımsız değişken gibi tanımlamalar korelasyon analizi için yapılmıyor. Nedensellik olgusunu korelasyon analizi için dikkate alamıyoruz. Korelasyon analizi bize yalnızca değişkenler arasındaki ilişkinin yönünü ve derecesini verebilir. Hangi değişkenin hangi değişken üzerinde etkisi olabileceğine, alan deneyimlerimize göre ancak biz araştırmacılar karar verebiliriz.
Örneğin; bir beslenme uzmanı, vücut kitle indeksinin kandaki lipit değerleri üzerinde etkisi olduğunu baştan bilmektedir.
Regresyon analizinde durum biraz daha farklı. Artık bağımlı-bağımsız değişken kavramları devreye giriyor ve amacımız bizim için önemli rol oynayan bir bağımlı değişken ile onun üzerinde etkisi olduğu düşündüğümüz bağımsız değişkenleri
bir arada modellemek haline dönüşüyor!
Yani
ilişkilerin nedensel açıdan yönünü, regresyon analizinde dikkate almamız gerekiyor.
Regresyon analizini uygularken bağımlı değişkenimiz ile bağımsız değişken(ler)imiz arasında
nedensellik bağının olması da şart değil. Amacımız, bağımlı değişkenimizi bağımsız değişken(ler)imizden hareketle tahmin edecek bir model oluşturmak.
Oldukça teknik gibi gözükse de ayrım oldukça basit. Korelasyon analizinde değişkenlerin yönüne bakmaksızın salt ilişkilere bakarız, regresyon analizinde ise ilişkilerin yönü çoğunlukla bellidir. Nedensellik olmasa bile, bağımsız değişkenlerimizi kullanarak bağımlı değişkenimizi tahmin edebiliyoruz.
Bu olguyu şöyle örneklendirelim:
Babası akciğer kanseri olmuş bir yetişkinin akciğer kanseri olma olasılığı, kuşkusuz genetik faktörlerden etkilenir. Biz de bu gözlemlerimizden hareketler annesi ya da babası akciğer kanseri olan bir yetişkinin de akciğer kanseri olabileceğini söyleyebiliriz.
Burada
nedensellik anne ya da babadan çocuğa doğrudur.
Çocuğun akciğer kanseri olması anne ya da babanın akciğer kanseri olmasını etkiler mi? Elbette etkilemez!
Peki çocuğun akciğer kanseri olmasından hareketle annesi ya da babasını görmeden akciğer kanseri olabilecekleri hakkında bir fikir yürütebilir miyiz? Tabi ki yapabiliriz.
Gördüğümüz gibi, nedensellik olmasa bile
tahmin yapabiliyoruz.
Dünya ekonomilerine yönelik faiz ve enflasyon arasındaki ilişkiyi modellemek için şöyle bir regresyon modeli kurduğumuzu düşünelim:
ENFLASYON = 0.01 + 1.2 x FAİZ
Bu modelden hareketle faiz oranı belli olduğu durumlar için enflasyon oranını tahmin edebiliriz. Mesela faiz oranı %10 olan bir ülkenin enflasyon oranı da %12.1 olarak kolayca tahmin edilebilir.
Korelasyon analizinde tahmin yapmak gibi bir amacımız yoktur. Yaptığımız tek şey, ilişkiler hakkında genel bir değerlendirmede bulunmaktır.
Ayrıca regresyon analizinde değişken seçimi, modelin lineer-nonlineerliği gibi pek çok farklı olguyu dikkate almamız gerekirken, korelasyon analizinde böyle bir zorunluluğumuz da yoktur.

Peki korelasyon ve regresyon analizinin benzer yönleri yok mu? Tabi ki var.
Öncelikle ilişkilerin anlamlılığı noktasında bu iki analiz uzlaşırlar.
Hem korelasyon, hem de regresyon analizinde de değişkenler arası ilişkilerin anlamlılığını test edebiliriz. Regresyon analizinde bağımsız değişkenlerin bağımlı değişkenler üzerinde anlamlı etkisinin olup olmadığı incelenirken, korelasyon analizinde tüm değişkenler için ilişkilerin anlamlılığına bakılır.
Burada bir nüans farkı olmasına rağmen, her iki analiz de bu noktada birbirine hizmet eder.
Korelasyon analizi sayesinde bağımsız değişkenler arasındaki ilişkileri inceleyerek
çoklu bağlantı probleminin varlığını araştırabiliyoruz. Ayrıca
değişken seçimi için de bir ön adım olarak korelasyon analizini kullanabiliyoruz.
Korelasyon ve regresyon katsayılarının işaretleri konusunda da iki analiz ortak bir noktada buluşurlar.
Korelasyon analizinde
negatif çıkan katsayılar, regresyon analizinde elde edilen beta katsayıları için de
negatif çıkar. Benzer şekilde pozitif olan korelasyon katsayıları için de regresyon katsayıları pozitif olmalıdır.
Bu durum her zaman sağlanmayabilir ve bunun ilk sebeplerinin başında da yine çoklu bağlantı belası gelir!
Ancak korelasyon ve regresyon analizinin bu birlikteliği sayesinde yine potansiyel problemleri teşhis edebiliyoruz.
Korelasyon ve regresyon analizi hem paket programlarda, hem de ücretsiz açık kaynak kodlu yazılımlarda da uygulanabilir.
Örneğin; SPSS programında farklı korelasyon ve regresyon analizi teknikleri uygulanabilmektedir. R yazılımında da, Minitab programında da, Stata yazılımında da her iki tekniğe yönelik çözümler mevcuttur.
Ancak analizlerin uygulama menüleri ve kodlamaları birbirlerinden oldukça farklıdır. Bu olgu hem menü, hem de kod tabanlı istatistiksel programlar için geçerlidir.
SPSS'de regresyon analizi için
Analyze -> Regression adımlarını seçerken, korelasyon analizi için
Analyze -> Correlate adımlarını kullanıyoruz.
R yazılımında da lineer regresyon analizi için
lm() fonksiyonunu kullanırken, korelasyon analizi için de
cor() fonksiyonunu kullanıyoruz.
Korelasyon ve regresyon analizinin kullandığı teknikler de oldukça farklıdır. Mesela iki ordinal kategorik değişken arası ilişkiler korelasyon için
Spearman korelasyon katsayısı ile değerlendirilebilirken, regresyon için de
ordinal lojistik regresyon analizi ile değerlendirilebilir.
Özetle
nedensellik, tahmin ve modelleme açısından korelasyon ve regresyon analizi arasında ciddi farklılıklar varken;
değişkenler arası ilişkilerinin sınanması noktasında ortak yönler bulunmaktadır.