Karşılıklı ilişki anlamına gelen bu kelime, hayatımızı
‘’sağlığa zararlıdır’’ ibaresi ile durmaksızın karışır. Sağlığa zararlıdır
denilen şeylerle sağlıklı olmak arasındaki ilişki korelasyonel bir ilişkidir.
Şöyle açıklayalım; bütün hayatı boyunca 20 kere ayağı kayıp
düşen Ali’nin yanında her düşüşünde Ayşe vardır ve Ali düşüşünün 10’unda hava
yağmurludur. Ali’nin düşüşüyle Ayşe’nin varlığı arasında 1’e 1 bir korelasyon
vardır. Havanın yağmurlu olmasıyla ise 2’e 1 bir korelasyon vardır. Genelde
araştırmacılar bu ilişkiyi Alinin Ayşe ile dolaşması sağlığına zararlıdır diye
ilan ederler. Bu istatiksel ilişki her zaman bir neden sonuç ilişkisine işaret
etmez. Bize sadece hangi şeylerin hangi şeylerle birlikte bulunduklarını
söyler.
İstatistik açısından Alinin düşüşü, Ayşenin varlığı, yağmurun yağması, birer değişkendir. İstatistik bu değişkenler arasındaki ilişkiyi incelerken farklı teknikler kullanır. Her hangi bir değişkenin aldığı değerlerin başka bir veya bir çok değişkenin aldığı değerlerle ilişkisinin analizine korelasyon analizi denir.
İstatistik açısından Alinin düşüşü, Ayşenin varlığı, yağmurun yağması, birer değişkendir. İstatistik bu değişkenler arasındaki ilişkiyi incelerken farklı teknikler kullanır. Her hangi bir değişkenin aldığı değerlerin başka bir veya bir çok değişkenin aldığı değerlerle ilişkisinin analizine korelasyon analizi denir.
Daha doğrusu korelasyon incelemelerinde araştırılan şey bu
değişkenlerin aldıkları değerlerin arasındaki bağların yoğunluğudur. Bir çok
üniversite hocası korelasyon konusunu anlatırken bağımlı bağımsız değişken
terimlerini kullanmaktadır(1) ve lakin bu çok vahim bir hatadır çünkü araştırma
konumuzun doğrusu hipotezlerimizin bağımlı değişkenlerinin aldıkları değerler
arasında korelasyon analizi yapmamız mümkündür.
Bazı yazarlar, doğrusu üniversite hocaları, ‘’doğrusal ilişki’’ terimini kullanacaklardır(2). Korelasyonu iki değişken arasındaki doğrusal ilişkiyi inceleyen istatistiksel yöntem olarak tanımayacaklardır (ki bu tanım yanlıştır). Bazı yazarlar da doğrusal ve doğrusal olmayan ilişki diyeceklerdir ve öğrencinin işin içinden çıkmasını bekleyeceklerdir. Tabi ki matematik yetimi sosyalbilimcilerin uydurma bir Türkçe(3) ile bu işin içinden çıkmalarına imkan yoktur. ‘’ Doğrusal’’ diye çevrilen şeyin liner olduğunu ve bunun cebirin bir alanı olduğunu düşünürseniz; bir şeyin hem nasıl doğru hem nasıl eğri olduğunu düşünmekten kurtulabilirsiniz belki.
Bazı yazarlar, doğrusu üniversite hocaları, ‘’doğrusal ilişki’’ terimini kullanacaklardır(2). Korelasyonu iki değişken arasındaki doğrusal ilişkiyi inceleyen istatistiksel yöntem olarak tanımayacaklardır (ki bu tanım yanlıştır). Bazı yazarlar da doğrusal ve doğrusal olmayan ilişki diyeceklerdir ve öğrencinin işin içinden çıkmasını bekleyeceklerdir. Tabi ki matematik yetimi sosyalbilimcilerin uydurma bir Türkçe(3) ile bu işin içinden çıkmalarına imkan yoktur. ‘’ Doğrusal’’ diye çevrilen şeyin liner olduğunu ve bunun cebirin bir alanı olduğunu düşünürseniz; bir şeyin hem nasıl doğru hem nasıl eğri olduğunu düşünmekten kurtulabilirsiniz belki.
Zamanında (1896) Karl Pearson’a Ali ile Ayşe'nin hikayesini
veya benzer hikayeleri benim anlattığım gibi anlatmak yetmemiş bu ilişkinin
hangi derecede olduğunu açıklamak için matematik bir formül önermiş; korelasyon
katsayısı icat etmiş tabi ki Pearsonun icadının çok sorunlu olduğunu pek bir
şeyi açıklayamadığını iddia edenler olmamış değil ( Maurice Fréchet gibi).
Pearson’un korelasyon coeficianı yada katsayısı aşağıdaki tabloda
görülebileceği gibi hem yön hem kuvvet açısından bir değerlendirmeye sahiptir. (Acaba
korelasyonda doğrusal ilişkiden söz ettiğimizde korelasyonun pozitif yönde
olduğundan mı söz ediyoruz?)
Korelasyon
|
Negatif
|
pozitif
|
Zayıf
|
−0.5 ‘ten 0.0’ a
|
0.0 ‘dan 0.5’e
|
Güçlü
|
−1.0’den −0.5’ e
|
0.5’ten 1.0’e
|
Katsayı 1.00 veya -1.00 tam bir ilişkiyi gösterir. Negatif
veya pozitif olması bu ilişkinin hangi doğrultuda olduğunu gösterir. 0.0 olması
ise ilişkinin olmadığını gösterir. Zayıf /düşük/ orta/ güçlü/yüksek olan ifade
edilen bu değerlerin aralıklarını tablodan farklı yorumlayanlarda vardır. Pearson korelasyon değerlerini sadece pozitif yönde şöyle
değerlendirirler;
0.00-0.29 arası ise düşük güç
0.30-0.49 arası ise orta güç
0.30-0.49 arası ise orta güç
0.50-0.69 arası ise yüksek güç
0.70-1.00 arası ise yüksek güç
Şimdi korelasyon mevzusunu biraz daha iyi anlamak için bir
adım daha atalım.
Elimizde X ve Y olarak, gözlemlenmiş niceliksel istatistik
iki değer ya da büyüklük var diyelim.
Korelasyon analizinin amacı şunlardır:
1. X ve Y arasında bir ilişkinin olup olmadığını
tanımlamak
2. X ve Y arasındaki ilişkinin (bağın) biçiminin
özelliklerini (karakteristiklerini; yani pozitif mi/negatif mi, liner mi/liner
olmayan mı, monoton mu/ monoton olmayan mı) belirlemek
3. Bağın istatiksel açıdan anlamlı olup olmadığını test
etmek
4. Sayısal
olarak bu bağın yoğunluğunu göstermek
5. Tespit edilmiş ilişkinin geçerliliğinin ispat
etmek yani verilerimiz, gözlemlerimiz sadece bir artefactın ürünü mü sorusuna
yanıt vermek.
Zurnanın zırt dediği yer 5. maddedir. Bu sonradan
yasaklanacak veya kullanımdan kaldırılacak bir takım ilaçların binlerce hekim
tarafından nasıl iyileştirmek amacı ile hastalara verildiğini ve hastaların
aslında nasıl zehirlenmiş olduğunu açıklar.
X ve Y arasındaki yani niceliksel iki değişken arasındaki
bağın karakteristiklerini grafik bir şekilde görelim:
Monoton ve liner olmayan bağ
1. Sosyal bilimler için istatistik, Şener Büyüköztürk ve
ark., Pagem akademi , 2013
2.Yrd. Doç. Dr. Kemal DOYMUŞ, Korelasyon analizi, kemaldoymus.files.wordpress.com/2009/12
3. Kimsenin kimseyi anlamadığı şizofren bir dil ortamında
yaşamak istemiyorsak bu uydurmalara son vermeli artık.
Hiç yorum yok:
Yorum Gönder