2 Haziran 2014 Pazartesi

Korelasyon nedir?

Latincede Correlacion. 

Karşılıklı ilişki anlamına gelen bu kelime, hayatımızı ‘’sağlığa zararlıdır’’ ibaresi ile durmaksızın karışır. Sağlığa zararlıdır denilen şeylerle sağlıklı olmak arasındaki ilişki korelasyonel bir ilişkidir.

Şöyle açıklayalım; bütün hayatı boyunca 20 kere ayağı kayıp düşen Ali’nin yanında her düşüşünde Ayşe vardır ve Ali düşüşünün 10’unda hava yağmurludur. Ali’nin düşüşüyle Ayşe’nin varlığı arasında 1’e 1 bir korelasyon vardır. Havanın yağmurlu olmasıyla ise 2’e 1 bir korelasyon vardır. Genelde araştırmacılar bu ilişkiyi Alinin Ayşe ile dolaşması sağlığına zararlıdır diye ilan ederler. Bu istatiksel ilişki her zaman bir neden sonuç ilişkisine işaret etmez. Bize sadece hangi şeylerin hangi şeylerle birlikte bulunduklarını söyler. 

İstatistik açısından Alinin düşüşü, Ayşenin varlığı, yağmurun yağması, birer değişkendir. İstatistik bu değişkenler arasındaki ilişkiyi incelerken farklı teknikler kullanır. Her hangi bir değişkenin aldığı değerlerin başka bir veya bir çok değişkenin aldığı değerlerle ilişkisinin analizine korelasyon analizi denir.
Daha doğrusu korelasyon incelemelerinde araştırılan şey bu değişkenlerin aldıkları değerlerin arasındaki bağların yoğunluğudur. Bir çok üniversite hocası korelasyon konusunu anlatırken bağımlı bağımsız değişken terimlerini kullanmaktadır(1) ve lakin bu çok vahim bir hatadır çünkü araştırma konumuzun doğrusu hipotezlerimizin bağımlı değişkenlerinin aldıkları değerler arasında korelasyon analizi yapmamız mümkündür. 

Bazı yazarlar, doğrusu üniversite hocaları, ‘’doğrusal ilişki’’ terimini kullanacaklardır(2). Korelasyonu iki değişken arasındaki doğrusal  ilişkiyi inceleyen istatistiksel yöntem olarak tanımayacaklardır (ki bu tanım yanlıştır). Bazı yazarlar da doğrusal ve doğrusal olmayan ilişki diyeceklerdir ve öğrencinin işin içinden çıkmasını bekleyeceklerdir. Tabi ki matematik yetimi sosyalbilimcilerin uydurma bir Türkçe(3) ile bu işin içinden çıkmalarına imkan yoktur.  ‘’ Doğrusal’’ diye çevrilen şeyin liner olduğunu ve bunun cebirin bir alanı olduğunu düşünürseniz; bir şeyin hem nasıl doğru hem nasıl eğri olduğunu düşünmekten kurtulabilirsiniz belki.

Zamanında (1896) Karl Pearson’a Ali ile Ayşe'nin hikayesini veya benzer hikayeleri benim anlattığım gibi anlatmak yetmemiş bu ilişkinin hangi derecede olduğunu açıklamak için matematik bir formül önermiş; korelasyon katsayısı icat etmiş tabi ki Pearsonun icadının çok sorunlu olduğunu pek bir şeyi açıklayamadığını iddia edenler olmamış değil ( Maurice Fréchet gibi). Pearson’un korelasyon coeficianı yada katsayısı aşağıdaki tabloda görülebileceği gibi hem yön hem kuvvet açısından bir değerlendirmeye sahiptir. (Acaba korelasyonda doğrusal ilişkiden söz ettiğimizde korelasyonun pozitif yönde olduğundan mı söz ediyoruz?)

Korelasyon
Negatif
pozitif
Zayıf
−0.5 ‘ten  0.0’ a
0.0 ‘dan  0.5’e
Güçlü
−1.0’den  −0.5’ e
0.5’ten 1.0’e

Katsayı 1.00 veya -1.00 tam bir ilişkiyi gösterir. Negatif veya pozitif olması bu ilişkinin hangi doğrultuda olduğunu gösterir. 0.0 olması ise ilişkinin olmadığını gösterir. Zayıf /düşük/ orta/ güçlü/yüksek olan ifade edilen bu değerlerin aralıklarını tablodan  farklı yorumlayanlarda vardır. Pearson korelasyon değerlerini sadece pozitif yönde şöyle değerlendirirler; 
0.00-0.29 arası ise düşük güç

0.30-0.49 arası ise orta güç

0.50-0.69 arası ise yüksek güç

0.70-1.00 arası ise yüksek güç


Şimdi korelasyon mevzusunu biraz daha iyi anlamak için bir adım daha atalım.
Elimizde X ve Y olarak, gözlemlenmiş niceliksel istatistik iki değer ya da büyüklük var diyelim.
Korelasyon analizinin amacı şunlardır:
1. X ve Y arasında bir ilişkinin olup olmadığını tanımlamak
2. X ve Y arasındaki ilişkinin (bağın) biçiminin özelliklerini (karakteristiklerini; yani pozitif mi/negatif mi, liner mi/liner olmayan mı, monoton mu/ monoton olmayan mı) belirlemek
3. Bağın istatiksel açıdan anlamlı olup olmadığını test etmek
4. Sayısal olarak bu bağın yoğunluğunu göstermek
5. Tespit edilmiş ilişkinin geçerliliğinin ispat etmek yani verilerimiz, gözlemlerimiz sadece bir artefactın ürünü mü sorusuna yanıt vermek.

Zurnanın zırt dediği yer 5. maddedir. Bu sonradan yasaklanacak veya kullanımdan kaldırılacak bir takım ilaçların binlerce hekim tarafından nasıl iyileştirmek amacı ile hastalara verildiğini ve hastaların aslında nasıl zehirlenmiş olduğunu açıklar.

X ve Y arasındaki yani niceliksel iki değişken arasındaki bağın karakteristiklerini grafik bir şekilde görelim:


Liner pozitif bağ
X

Liner negatif bağ

Bu iki grafikte hocaların doğrusal dediği şeyin nasıl eğri buğru bir şey olduğunu görebiliriz. Söz konusu olan yoğunluğun doğrultusudur.


Monoton liner olmayan pozitif bağ


Monoton ve liner olmayan bağ

Bağ yok

Bağ yok




Notlar:
1. Sosyal bilimler için istatistik, Şener Büyüköztürk ve ark., Pagem akademi , 2013 
2.Yrd. Doç. Dr. Kemal DOYMUŞ, Korelasyon analizi, kemaldoymus.files.wordpress.com/2009/12

3. Kimsenin kimseyi anlamadığı şizofren bir dil ortamında yaşamak istemiyorsak bu uydurmalara son vermeli artık.

Hiç yorum yok:

Yorum Gönder