Olasılık ve Verinin Yükselişi

Olasılık ve istatistiğin bilimsel tarihi genellikle 1500’lü yıllarda yaşamış meşhur İtalyan matematikçi ve kumarbaz Girolamo Cardano ile başlatılır. Üçüncü ve dördüncü derece polinom denklemlerinin çözümleri üzerine yaptığı çalışmalarla tanınan Cardano’nun 40 yıl boyunca her gün çeşitli şans oyunları oynadığı söyleniyor. Bir desteden as çekme ihtimali, iki zarla toplam 7 atma ihtimali gibi konuları matematiksel olarak incelemiş; şans oyunlarındaki tecrübesini ve matematiksel analizlerini Liber de Ludo Aleae (Kumarbaz Alim) adlı eserinde toplamıştır.

Bu bütünüyle bilimsel bir kitap değil fakat olasılıkla ilgili en temel matematiksel yaklaşımı açık seçik ortaya koyduğu için önemli: Hilesiz bir zarda 1, 2, 3, 4, 5 ya da 6 atma ihtimali eşittir. Şans oyunları ilerleyen yıllarda da matematikçilerin ilgisini çekmeye devam etmiş, 1600’lü yıllarda Pascal ve Fermat olasılık üzerine çeşitli çalışmalar yapmıştır. “Tanrı varsa ve yoktur dersem sonsuz acı çekerim, tanrı yoksa ve var dersem birşey kaybetmem, bu yüzden tanrıya inanmak mantıklıdır” diye özetleyebileceğimiz argümanı (Pascal’ın Bahsi) dolaşıma sokan kişinin de Pascal olması bir tesadüf olmamalı.

Bu anlatıdaki bir eksiğe de dikkat çekmeden geçemeyeceğim. Aristo’nun felsefi bağlamda olasılıktan bahsettiğini, bugün kullandığımız zarların M.Ö. 1400 civarında geliştirildiğini ve şans oyunlarının geçmişinin bundan da öncesine gittiğini biliyoruz. Nasıl oldu da 16. Yüzyıla kadar kimse bu konuyu teorik bir çerçevede incelemedi? Hesap kitap teknikleri açısından matematik bilgimiz uzun süredir temel olasılık hesapları için yeterli. Her nasıl olduysa bilinmezlikler içeren bir durumu matematiksel olarak inceleyebileceğimiz fikri çok uzun zaman kendini göstermemiş.

Cardano her aklıbaşında kumarbaz gibi zarların hileli olup olmadığını nasıl anlayabileceğimiz üzerine de düşünmüş. Bir zarı on bin kere attığımızda, her sonuç hemen hemen aynı sayıda görülmüyorsa o zar hilelidir. Bu basit görünen gözlemi ilerleyen yıllarda Jacob Bernoilli ve Poisson net bir matematiksel önerme haline getiriyor. “Büyük sayılar yasası” diye bildiğimiz bu önerme kavramsal olarak, sonuçlarını bilmediğimiz olasılıkları çok sayıda deney yaparak -yani veriye bakarak- yaklaşık olarak hesaplayabileceğimizi söylüyor.

Şimdiden bakınca “Ne var canım bunda?” diyebileceğimiz bu iki gelişme –olasılığın teorik kuralları ve büyük sayılar yasası- son 20 yılda gücünü katlanarak arttıran veriye dayalı karar alma paradigmasının temelini oluşturuyor. Olasılığın temel kurallarını ve bilinmeyen olasılıkların deneysel olarak kestirilebileceğini farketmemizle birlikte finans, sigorta, doğa bilimleri gibi alanlarda istatistik (ve dolayısıyla veri) kullanımı yaygınlaştı.

Prensip oldukça basit: Belirsiz bir durumla karşı karşıyaysan veriye bak. Örneğin Atlantik’i geçmeye yeltenen ticari gemilerin ne kadarının başarılı olduğu verisine sahipsen, bu gemileri ne kadar primle sigortalayacağını hesaplayabilirsin.

Teorik olasılık ve verinin biraraya gelmesinden ortaya çıkan bu gücü etkin olarak ilk kullanmaya başlayan kurumlar devletler olmuş. Zaten istatistik (statistics) kelimesi de 18. Yüzyılda devlet manasındaki “state” kelimesinden türetiliyor. Devlet geometri enstitüsü yok, ama devlet istatistik enstitüsü var. Devletlerin insanları, hayvanları, doğal kaynakları ve parayı saymasının tarihi Babil’e kadar uzanıyor fakat olasılık teorisinin de gelişmesiyle önümüzdeki yıl ne kadar vergi toplanabileceği, askere kaç kişi çağırılabileceği gibi pratik soruları çözmek için pek çok devlet 18. Yüzyıldan başlayarak veri toplamayı sistematik hale getiriyor.

Tesadüf mü, birbirini besleyen gelişmeler mi bilmek zor ama hemen hemen aynı zamanlarda fizikte de istatistiksel yaklaşımlar gelişmeye başlamış. O zamana kadar fiziksel teoriler az sayıda nesnenin birbirleriyle olan etkileşimlerine yoğunlaşırken, istatistiksel yöntemlerle milyarlarca nesnenin birbirleriyle etkileşimlerini tarif etmek mümkün hale geliyor.

Bu elbette gerçek bir ihtiyacın sonucu ortaya çıkıyor. O dönemlerde keşfedilen buhar motorları çalıştığı bildiğimiz ama teorik olarak çalışma prensiplerini açıklayamadığımız icatlar. Her bir molekülün tam olarak ne kadar ısıya maruz kaldığını, ne yönde ne hızda hareket ettiğini ve milyarlarca parçacığının birbirlerine ve içinde bulundukları kaba çarpa çarpa nasıl ilerleyeceğini teker teker hesaplamanın bir yolu yok. İşte bu problemleri çözmek için istatistiksel yöntemler kullanılmaya başlanıyor. Böylelikle 18. Yüzyıl itibariyle olasılıksal yöntemler bilimde de yer ediniyor.

Bu aynı zamanda doğayı anlayışımızda bir paradigma kırılması demek. İstatistiksel mekaniğin gelişimine kadar deneylerle uyumlu tahminler (ve dolayısıyla bilim) yapabilmek için az sayıda nesneye ait net ölçümler kullanıyorduk. Yüksek miktarda belirsizlik içeren durumlarda bile incelediğimiz sistemin nasıl davranacağını tahmin edebileceğimizi 18. yüzyılda farkettik. Belirsizlikleri olasılığın teorik diliyle sayısallaştırarak bilimin alanına çekebiliyoruz. Daha yakın dönemden örnek vermek gerekirse kuantum fiziğinin temelleri de olasıksal yaklaşımlar üzerine kurulu. Kuantum dalga fonksiyonunu, bir kuantum sistemin gözlemlenebilecek sonuçlarının olasılık dağılımı olarak yorumluyoruz.

Sanayi devrimiyle şirketlerin yüksek üretim hacimleri yakaladığı ve üretim süreçlerindeki küçük iyileştirmelerin karlılığa büyük etki etmeye başladığı yıllar başlıyor. Dolayısıyla veri ve veriden sağlanabilecek potansiyel fayda şirketler için de önemli hale geliyor.

İş dünyası ve istatistiksel yöntemlerin etkileşimindeki en bilindik örneklerinden birisi “Student t-testi”. Guinness bira fabrikaları 1900’lerin başlarında ürünlerinde kalite standartlarını tutturduğundan emin olmak için kimya ve matematik eğitimi almış genç William Sealy Gosset’i işe alıyor.

Kariyerinin geri kalanını Guinness’te en üst mevkilerde tamamlayacak olan Gosset’in çalıştığı sorulardan birisi “Biraların kalite standartlarına uygunluğunu düşük maliyetlerle, kısa zamanda nasıl tespit edilir?”. Bu problem üzerinde çalışırken Gosset, az sayıda örneklem ile yaptığı deneylerin o zamanlara kadar olasılık teorisindeki itici güç olan “normal dağılım”a uymadığını farkediyor. Az sayıda örneklemle ortaya çıkan sonuçların dağılımsal özelliklerini de bulduktan sonra sonuçları “Student” (Öğrenci) mahlasıyla yayınlıyor. Dönemin ünlü istatistikçilerinden Fisher’ın da katkılarıyla Gosset’nin keşfi hem bilimsel çalışmalarda hem de pratik uygulamalarda halen kullanılmaya devam eden “Student t-testi” olarak literatürde yerini alıyor.

Çarpıcı bir başka örnek, 2. Dünya savaşı sırasında Alman’ların tank üretimini bulmaya çalışan (olasılık literatürüne “Alman Tank Problemi” olarak geçmiştir) İngiliz istihbarat birimleri ve istatistikçilerin tahminleri:

Tarih	İstatistiksel Tahmin	İstihbarat Tahmini	Gerçek Üretim
Haziran 1940	169	1,000	122
Haziran 1941	244	1,550	271
Ağustos 1942	327	1,550	342

Bu ve benzeri örneklerle olasılık ve istatistik 20. Yüzyıl boyunca pratik problemlerden beslenerek teorik atılımlar yapmaya, teorik atılımlardan beslenerek daha çok problem çözmeye devam etti. Şu an vardığımız noktada artık belirsizlikler eskisi kadar belirsiz değil, problemlere doğru çerçeveler çizerek ve veriyi kullanarak kesinlik içermeyen durumlarda da faydalı sonuçlar bulabiliyoruz.

Olasılık ve Verinin Yükselişi

Comments

Leave a Reply Cancel reply

More posts

Sözün Fethi

Bilinç Problemi

Manayı Sayısallaştırmak

Simülasyon ve Pekiştirmeli Öğrenme