8 Mart 2013 Cuma

Yanlış Analiz Yapmanın Bedeli

     Bir istatistikçi için bir veri seti ile karşılaşıldığında ilk akla gelen soru doğal olarak şu olacaktır: hangi analizi uygulamayalım? İlk bakışta çok basit bir soruymuş gibi dursa da, araştırmanın sonucu için bu soru hayati önem taşımaktadır. Bunun için ilk yapılması gereken işlem, değişkenlerin türünü incelemektir. Değişkenlerin türleri belirlendikten sonra hangi analizleri kullanılacağının belirlenmesi gerekir. Geriye kalan, analizin amacına göre bir istatistiksel yöntemi uygulamaktır.

     Bu noktada en sık yapılan hatalar varsayımların yeteri kadar incelenmemesi ve doğru analizi belirleyememektir. Öyleyse bu konuda birkaç örnek vermekte yarar var. Farz edelim normal dağılıma uymayan ve gözlem sayısı 30' dan küçük olan bir veriye sahibiz. Burada kesinlikle parametrik bir yöntemden söz edilemez. Örneğin ortalama karşılaştırması yapılacaksa t-testi yapılamaz. Güven sınırı oluşturulacaksa Student-t tablosuna bakılamaz. Bunun gibi birçok farklı konuda bilgi ve tecrübe eksikliği nedeniyle bariz hatalar sürekli olarak yapılmaktadır. Hem de "bilimsel" adını verdiğimiz birçok makalede bu tarz analizler bol bol yer almaktadır. Hatta işin en kötüsü, çeşitli Proflardan oluşan jüriler dahi bu hataları görmezden gelerek, yanlış analizlerle dolu çalışmaları kabul etmektedir. Velhasıl kelam, durum tam manasıyla facia...

     Doğru analiz belirleyememekten söz ettik. Bunu konuyu da örneklendirelim. Regresyon analizi bilindiği üzere en yaygın kullanılan tekniklerin başında geliyor. Bağımlı değişkenin türü, analizin selameti açısından çok çok çok çok önemli. Çünkü regresyon yöntemi buna göre şekilleniyor. Bir oran, bir sayım verisi gibi normal dağılıma uymayan bağımlı değişken için en küçük kareler (E.K.K) yöntemi uygulanırsa, saçma sapan bir sonuç elde edilecektir. Bu da günümüzde birçok alanda sıkça yapılmaktadır. Hatta bazı kongrelerde bu tarz hatalara dolu çalışmalar sunulmaktadır.

     Bu saymış olduğum hatalar elbetteki her zaman vücut bulacak değildir. Gerekli istatistiksel donanıma sahip olan uzman hocalarımız, bu hataları şiddetle eleştirmekte, bu tarz hataların bulunduğu çalışmaları da saniyesinde reddetmektedir. Hepsinin ellerine sağlık. Bu hususta tek çözüm ya çok iyi bilgisayar ve istatistik bilgisine sahip olmak, ya da bu bilgiye sahip olan bir bireyden yardım almaktır. Yardım alınmadığı takdirde iki şıktan birisi muhakkak gerçekleşecektir: Ya bu çalışma günahıyla sevabıyla kabul edilip kişinin üzerinde hayatı boyunca kara bir leke gibi yapışıp kalacak, ya da (elleri dert görmesin) işinin ehilleri tarafından okkalı bir red alacaktır. Çözüm belli: ya kendinizi geliştirin, ya da bu işin ehlinden yardım isteyin.




2 Mart 2013 Cumartesi

Ölümcül Hata: Neden İstatistiksel Analizler İstatistikçilere Yaptırılmaz?

      Günümüzde istatistiğin önemi birçok farklı bilim dalınca kabul görmektedir. Tıp, biyoloji, kimya, psikoloji, işletme vs gibi farklı alanlarda istatistiksel analiz teknikleri yaygın olarak kullanılmaktadır. Bu alanlarda çalışan bireylerin çoğunluğu doğal olarak istatistik noktasında yetkin olmadıkları için bir uzmandan yardım alma ihtiyacı duyar. Ancak bu noktada korkunç bir hata ve yanılgı hüküm sürmektedir: o da istatistiksel analizlerin istatistikçilerin dışındaki bireylere yaptırılmasıdır.Bu konuda yanılmadığını, bu analizleri istatistikçilerin dışındaki uzman bireylerin yapabileceğini düşünen bireyler ise hemen şu soruyu sorabilirler: İstatistikçilere analiz yaptırmaya mecbur muyuz? Yanıt: Kesinlikle evet. Peki neden?

     Bu konuda şöyle bir örnek verelim. Farzedelim dişinizde korkunç bir ağrı var ve üç dişiniz çürümeye başlamış. Acil müdahale edilmesi gerek, acıdan yerinizde duramıyorsunuz, yediğiniz her lokma midenize oturuyor. Böyle bir halde iken veterinere gidip derdinize derman arıyorsunuz. Bir veteriner normal bir insanın diş ağrısına ne ölçüde çare bulabilir? Bunun yanıtını saygı değer okuyucularıma bırakıyorum.

     İşte istatistiksel analiz konusunda istatistikçinin haricinde bir kişiden yardım almak, diş ağrısı çeken bir kişinin veterinere gitmesine benzer. Bu noktada yapılacak en doğru şey işi kendi uzmanına bırakmaktır.Hiç kimse bir veri setinde yapılması gereken analizleri bir istatistikçi kadar doğru yapamaz, ancak yaptığını sanır. Çünkü analiz sonuçlarını en doğru biçimde yorumlayacak olan yine bu işin gerçek ehli, yani istatistikçidir. Başka alanlarda çalışanlar da kendi çaplarında analiz yapmaktadırlar, ancak sonuçları yorumlama noktasında son derece yetersiz kalmaktadırlar. Çeşitli sonuçlar elde etseler dahi, bu sonuçları yanlış biçimde yorumlamaktadırlar. Hatta işin en kötüsü de, yanlış analiz yöntemleri kullanarak çalışmayı içinden çıkılmaz hale getirmektedirler. Örneğin bağımlı örneklem t-testi yapılması gereken yerde Mc Nemar testi yaparlarsa, çalışma topyekün yanlış yapılmış olur. Bu durum da, tıpkı bir doktorun ameliyat esnasında beyindeki tümörü almak yerine karaciğer nakli yapması gibidir. Böyle bir işlemin hastayı ölüme götümesi dahi muhtemeldir.

    İşte bir veri setine uygulanacak yanlış analiz ve yanlış yorumlamalar da, o çalışmayı öldürmek demektir. Böyle bir yanılgıya düşmemek için kendi alanında uzman olan istatistikçilerden destek alınmalıdır. En kötü istatistikçinin dahi bir teorik altyapısı vardır ve hangi veriye hangi analizin kullanılacağını az çok bilir. İstatistikçinin analize bakışı ile bir doktorun, bir ziraatçının, bir mühendisin, bir kimyacının, bir mühendisin analize bakışı mukayese dahi edilemez. En doğru eylem, bir analiz konusunda problem yaşandığında bir istatistikçiye başvurmaktır. Aksi halde dişi ağrıdığında veterinere giden ya da hastaya yanlış müdahale ederek ölümüne yol açan doktordan bir farkımız kalmaz.