Benford Yasası

Yazar fotoğrafı

Berat Güdelek

1 Mart 2025

3 dk Okuma

Benford Yasası Nedir?

Benford Yasası, gerçek dünyadaki sayısal verilerin ilk basamaklarının rastgele değil, belirli bir dağılımı takip ettiğini öne süren bir olasılık yasasıdır. Bir veri kümesindeki sayılar genellikle 1 ile başlamaya eğilimlidir ve 9 ile başlaması en düşük olasılığa sahiptir. Bu durum, birçok doğa olayı, finansal veri ve nüfus istatistiklerinde gözlemlenmiştir.

Tarihçesi

Bu yasa ilk olarak Amerikalı astronom Simon Newcomb tarafından 1881 yılında fark edilmiştir. Newcomb, logaritma tablolarındaki sayfaların aşınma oranlarının düzensiz olduğunu gözlemledi. İnsanlar en çok 1 ile başlayan logaritmaları kullanıyordu, 9 ile başlayanlara ise nadiren ihtiyaç duyuyorlardı. Ancak, bu yasa geniş çapta tanınmamıştı. 1938'de Frank Benford, yasa üzerine kapsamlı bir çalışma yaparak, farklı türden 20 veri kümesinde (nehir uzunlukları, elektrik fatura verileri, nüfus sayıları vb.) bu dağılımın tekrar ettiğini keşfetti.

Kullanım Alanları

Finansal Dolandırıcılık Tespiti: Vergi beyanları, muhasebe kayıtları ve finansal raporlar gibi belgelerde sahtekarlık olup olmadığını belirlemek için kullanılır. Eğer sayıların ilk basamak dağılımı Benford Yasası’na uymuyorsa, sahtekarlık ihtimali yüksektir.

Adli Bilişim: Dijital verilerde anormallikleri tespit etmek için kullanılır. Özellikle siber suç araştırmalarında, saldırı izlerini takip etmek için kullanılabilir.

Bilimsel Verilerin Doğrulanması: Akademik makalelerde ve araştırmalarda üretilmiş verilerin gerçekçiliğini test etmek için kullanılır. Eğer bir çalışmadaki veriler Benford Yasası’na uymuyorsa, veri uydurulmuş olabilir.

Siber Güvenlik: Büyük veri kümeleri incelenerek anomali tespiti yapılabilir. Özellikle makine öğrenmesi ve veri madenciliğinde, hileli verileri tespit etmek için bu yasa kullanılabilir.

Jeofizik ve Ekonomi: Deprem büyüklükleri, hisse senedi fiyatları gibi doğal ve ekonomik süreçlerde Benford Yasası’na uygunluk gözlemlenir.

Matematiksel Açıklaması Benford Yasası’na göre, bir sayının ilk basamağı ddd olma olasılığı şu şekilde hesaplanır: P(d)=log⁡10(d+1)−log⁡10(d)P(d) = \log_{10}(d+1) - \log_{10}(d)P(d)=log10 (d+1)−log10 (d)

Bu formül sonucunda aşağıdaki dağılım elde edilir: 1: %30.1 2: %17.6 3: %12.5 4: %9.7 5: %7.9 6: %6.7 7: %5.8 8: %5.1 9: %4.6 Bu dağılımı bozan herhangi bir veri seti, manipüle edilmiş olabilir ve sahtecilik içerebilir.

Sonuç

Benford Yasası, rastgele gibi görünen birçok veri kümesinde belirli bir düzen olduğunu gösteren güçlü bir matematiksel fenomendir. Finansal dolandırıcılık, veri analitiği, bilimsel araştırmalar ve adli bilişim gibi birçok alanda kullanılması, onun sadece teorik bir kavram olmadığını, aynı zamanda pratikte büyük önem taşıyan bir araç olduğunu göstermektedir. Modern dünyada büyük veri analitiğinin giderek önem kazandığı düşünüldüğünde, Benford Yasası’nın önemi de artmaktadır. Veri sahtekarlığını tespit etmek ve güvenilirliği sağlamak için istatistiksel analizlerde sıklıkla başvurulan bu yasa, özellikle siber güvenlik ve finansal incelemelerde kritik bir yer tutmaktadır. Bununla birlikte, yasa her veri setine uygulanamaz. Örneğin, doğum tarihleri, telefon numaraları ve kimlik numaraları gibi veriler Benford dağılımına uymaz. Bu nedenle, uygulanacağı veri setinin dikkatlice seçilmesi gerekmektedir. Günümüzde, yapay zeka ve büyük veri uygulamalarında, Benford Yasası ile anomalileri tespit eden sistemler geliştirilmektedir. Dolayısıyla, veri analistleri, ekonomistler ve güvenlik uzmanları için önemli bir araç olmaya devam edecektir.