Yanılsamalı Korelasyon

Şüphesiz istatistik sıkça başvurduğumuz yöntemlerden birisi. Dünya’daki her olgu ya da her kişiyi tek tek değerlendirmek mümkün olmadığı gibi bir yargıya varmak için istisnasız kaideler elde etmeye çalışmak da mümkün değildir.

Bazı soruların kesin yanıtları yoktur. Bazı yanıtlar ise kesinlikle bir sorunun getirisi değildir.

Günlük düşünme alışkanlıklarımız içerisinde de istatistik yola başvururuz. İstatistik -ki aslında deneyimleme olarak da adlandırabilinir- bizlerin öğrenme mekanizmalarından en önemlisidir. Doğduğumuz günden bu yana deneyimleme sayesinde dünyayı kavrar ve yargılar oluştururuz. İlk bilgilerimiz teorik değil, pratiktir.

Aslında bir çok bebek, bilişsel bir sürece ihtiyaç duymadan yer çekimi ve bazı başka dinamik / kinematik etkilerin bilgisi ile doğar. Örneğin bir deneyde hareket eden bir nesne patikasının belli bir kısmını bir perdenin arkasında kaydetmektedir. Durumu izleyen bebek, sabit hızla seyir halindeyken perde arkasına giren cisim, aynı hızla yol alarak perdenin arkasından çıktığında şaşırmamaktadır. Ancak çıkmazsa, ya da daha yavaş çıkarsa, ya da daha hızlı çıkarsa şaşırma anlamına gelen hareketlerde bulunmaktadır.

Ancak bilgiyi üst bilince taşıyıp onu meta olmaktan kurtarmak için -ki buna öğrenim / eğitim adı veriliyor- gözlem ve teyit gerekiyor. Bu gözlemlerin bilgi oluşturmada kullanılması için herhangi bir etkinin belli bir durumu olumlayıp olumlamadığını ya da tetikleyip tetiklemediğini düşünmek ve bunu doğru bilgi olarak algılamak standart davranıştır.

Örnek olarak birlikte bir test yapalım. Lütfen aşağıdaki yargılara bir göz atınız ve sizin için doğru olup olmadığını belirtiniz:

Önerme 1:Bir sınıfta notu 4’ün üzerinde olan çocukların oturma planına bakılıyor ve ön sıralarda oturan 10 kişinin 8’inin notunun 4’ün üzerinde olduğu düşünülüyor. O halde ön sıralarda oturanların daha başarılı olduğu söylenebilir mi?

Önerme 2:Bir doktor hastanede bir hastalığın belirtileri konusunda araştırma yapıyor ve bakıyor ki X hastalığını taşıyan 50 kişiden 40’ı Y’den şikayetçi. O halde “Y, X hastalığının bir belirtisidir” denebilir mi?

Bir çoğunuz muhtemelen bu soruların yanıtlarına “evet” demiştir ya da bir hinlik olduğunu düşünerek ama nedenini bilmeden “hayır” demiştir. Kararsız kalanlarınız olduğu gibi, mantıksal düşünmeye daha yatkın olanlarınızdan gerçeğin “hayır” olduğunu nedenleriyle de bulmuş olan olabilir.

Cevabın niçin “hayır” olduğuna bakalım.

Önerme 1’deki sonuçlara göre ön sıralarda oturanların %80’i başarılı. Ancak önerme içerisinde arka sıralarda oturan öğrencilerle ilgili bir bilgi yok. Ya arka sıralarda oturan 8 kişiden 7’si başarılıysa?

Önerme 2’de de benzer şekilde, hastalık üzerinden değil de, şikayet üzerinden gidilseydi belki başka bir sonuç elde edilebilirdi. Mesela, yukarıdaki önermeye göre X hastalığına sahip kişilerin %80’i Y’den şikayetçi. Ancak Y şikayeti olanların kaçının X hastası olduğuna bakılırsa? Diyelim ki Y’şikayetine sahip 200 kişiden 40’ı X hastasıydı ve 160’ı da değil… Aynı oranda tam ters bir istatistik olmaz mıydı?

İşte bu her iki soruya “evet” diye yanıt verdiyseniz ya da aklınız evete kaydıysa “yanılsamalı korelasyon” hatası yapmışsınız demektir.

Bu hatadan kaçınmanın bir yolu, mantıksal tablolar oluşturmaktır. Tablonun mantıksal formu aşağıdaki gibidir:

P=1 ve Q=1

P=1 ve Q=0

P=0 ve Q=1

P=0 ve Q=0

Önerme 1 için revize edelim:

4’ün altında 4’ün üstünde Toplam
Ön Sırada 2 8 10
Arka Sırada 1 7 8

Önerme 1’deki hatayı yapan araştırmacı örnek gruplarını doğru almamıştır.

Önerme 2 için revize edelim:

X Hastası X Hastası Değil Toplam
Y Belirtisi var 40 160 100
Y Belirtisi yok 10 20 30

Önerme 2’deki hatayı yapan araştırmacı araştırmayı tek yönlü gerçekleştirmiştir.

Bu örneklerin de gösterdiği gibi, hepimiz algılarında bazı kalıp düşüncelere inanmakla yanlışlık konusunda ısrar ediyor olabiliriz.

Bazı kişilik ya da stres bozuklukları da yanlış öğrenme biçimimizin sonuçlarıdır.

Örneğin, bir araçta kaza geçiren kimselerin travmatik stres bozukluğu yaşayıp o araca tekrar binmekte sıkıntı yaşamalarının sebebi, kendi deneyimlerimizin istatistiğini tutmak, önerme 1’de olduğu gibi örnek gruplarını doğru almamaktır. Söz gelimi yaşadığı bir otomobil kazası sebebiyle otombil kullanamayan kişi, otomobil kullanırken kaza yapmayan milyonlarca kişiyi değil, otomobil kullanırken kaza yapan bir kişiyi hesaba katarak kaza yapmanın %100’lük bir ihtimal dahilinde olması gibi bir yanılsamaya sahiptirler.

Benzer şekilde duygusal ilişkilerinde yara alan kimseler de önerme 2’deki hatayı yaparlar ve “telefona akşamları cevap vermemek” gibi bir belirtiyi, aldatma olgusunun kanıtı sayarlar. Oysa herhangi bir nedenle telefona cevap veremeyen ama aldatmayan kişilerin istatistiği daha yüksektir.

Yanılsamalı korelasyon hatasının bir diğer türü de parametre eksikliğidir. Muhtemelen elde kalan aşıları pazarlamak isteyen resmi ya da özel kurum ve kuruluşların yaptırdığı maksatlı haberlerden birinde ya da belki de sadece haberi hazırlayan muhabirin istatistiğin temelleri konusundaki zayıf bilgisi yüzünden büyük bir yanlış yapıldı. Gazetedeki haber; ülkeleri “domuz gribi nedeniyle hayatını kaybedenler sayısı”na göre sıralamıştı.

Listede X,Y,Z,T,W ülkeleri, a,b,c,d,e ölü sayılarıyla sıralanarak listelenmişti.

70 milyonluk Türkiye’de X kadar insanın hayatını kaybetmesiyle, sadece 1000 kişilik nüfusu olan Vatikan ülkesinde aynı sayıda insanın hayatını kaybetmesi arasında oldukça büyük bir fark var. “En çok ölüm Çin’de gerçekleşti” demek muhtemelen Çin’in süreci iyi yönetememesi anlamına da gelmemektedir. Lüksemburg’un %10’luk nüfusunu kırabilecek bir salgının yarattığı bilanço, Çin’deki her sene kızamık kaynaklı çocuk ölümlerinden daha az bile olabilir. Bu yüzden herhangi benzer bir olayda ülkelerdeki ölü sayıları, ülkelerin nüfuslarıyla oranlı olarak verilmelidir.

Bir başka örnek de demiryollarının karayollarına göre daha güvenli olduğu iddiası… Böyle bir istatistik, sadece yılda gerçekleşen kaza sayısı ya da ölüm sayısı ile ifade edilirse, yanılsama yaratır. Demiryolu ve karayolu güvenlik açısından karşılaştırılacaksa kaza / kilometre, kaza / sefer sayısı, ölüm / kilometre gibi oranlar kullanılmalıdır.

O halde:

Kendimiz bir yargıya varmadan önce onun için geçerli bir deney / deneyim dizisinden faydalanıp faydalanmadığımızı sorgulamamız (Önerme 1) veya yargımızı geçersiz kılabilecek ters bir durum söz konusu olup olmadığını gözden geçirmemiz (Önerme 2) gerekiyor. Rakamsal karşılaştırmalarda ise sadece rakamın bir şey ifade etmeyebileceğini de aklımızdan çıkarmamamız gerekiyor.


Yorumlar

“Yanılsamalı Korelasyon” için bir yanıt

  1. Duran Serkan KILIÇ avatarı
    Duran Serkan KILIÇ

    Sayın Tevfik Uyar,

    Yayınladığınız bu yazı için çok teşekkür ediyorum. Hayatımızın her alanında ve neredeyse çıkmaza düşen her tartışmada yapılan bir hatayı çok akıcı, anlaşılabilir ve güzel bir üslupla yazmışsınız. Sizi takip ediyorum ve emin olun sizden öğreneceğim çok şey var. Kinetiğe dönüştürdüğünüz emeği çok takdir ediyorum ama söylemeden de edemeyeceğim bundan çok daha büyük bir potansiyel taşıyorsunuz. Yazdığınız her yazı anlam ve beğenilirlik açısından okuyucuyu doyuruyor. Yazılarınızı çok daha geniş kitlelere ulaşmasını dilerim.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir