Benford Yasası Nedir? Bu Beklenmedik Sayı Modeli Neden Her Yerde?


aç senin favori sosyal medya platformu ve kaç arkadaşınızın veya takipçinizin olduğunu not edin. Özellikle, bu sayının ilk basamağına dikkat edin. Örneğin, 400 arkadaşınız varsa baştaki rakam 4, 79’unuz varsa 7’dir. Diyelim ki birçok kişiden bunu yapmasını istedik. Yaygın sezgi, arkadaş sayımlarının biraz rastgele olması gerektiğini ve bu nedenle baştaki rakamlarının da 1’den 9’a eşit davranarak olması gerektiğini öne sürdüğü için, genel olarak yanıtlar bekleyebiliriz. Garip bir şekilde, bulacağımız şey bu değil. Bunun yerine, hemen hemen her yerde dik bir dengesizlik görürdük. yarım İnsanların yüzde 10’u 1 veya 2 ile başlayan arkadaş sayısına sahipken, yüzde 10’u 8 veya 9 ile başlıyor. Unutmayın, bu daha fazla veya daha az arkadaşa sahip olmakla ilgili değil: 1.000 arkadaşa sahip olmak, sekiz arkadaşa sahip olmaktan çok daha fazlasıdır.

1’ler ve 2’lerin bu tuhaf aşırı temsili, arkadaşların ve takipçilerin ötesine geçerek beğeniler ve retweetlerve sosyal medyanın çok ötesinde sayısal dünyanın sayısız köşesi: ülke nüfusu, nehir uzunlukları, dağ yükseklikleri, ölüm oranları, hisse senedi fiyatları, hatta tipik bir sayısında bulunan çeşitli sayı koleksiyonları bile Bilimsel amerikalı. Yalnızca daha küçük baş basamaklar daha yaygın olmakla kalmaz, aynı zamanda kesin ve tutarlı bir model izlerler.

Safça beklenebileceği gibi, tüm rakamlar eşit olarak temsil edilseydi, o zaman her biri zamanın dokuzda biri (yaklaşık yüzde 11,1) görünürdü. Yine de, esrarengiz sayıda gerçek dünya veri setinde, girişlerin şaşırtıcı bir şekilde yüzde 30,1’i 1 ile başlar, yüzde 17,6’sı 2 ile başlar vb. Bu fenomen olarak bilinir Benford yasası. Kanun, verilerinizin birimlerini değiştirdiğinizde bile devam eder. Nehirleri fit veya uzun mesafelerle ölçün, hisse senedi fiyatlarını dolar veya dinar cinsinden ölçün, Neyse ölçtüğünüzde, baştaki rakamların bu kesin oranları sebat eder. Matematikçiler, modelin neden ortaya çıkabileceğine dair birkaç zekice neden öne sürerken, onun katıksız her yerde bulunması basit bir açıklamadan kaçıyor.

Hafif bir gözlem gibi görünebilir, ancak Benford yasası, insanları parmaklıklar ardına atmak ve büyük dolandırıcılık operasyonlarını tespit etmek için güçlü bir şekilde kullanıldı.

Çubuk grafik, gerçek dünya veri kümelerinde 1'den 9'a kadar her basamakla başlayan sayıların yüzdesini gösterir.


Kredi bilgileri: Amanda Montañez; Kaynak: Simon Newcomb’un yazdığı “Doğal Sayılarda Farklı Basamakların Kullanım Sıklığı Üzerine Not” Amerikan Matematik Dergisi, Cilt 4, No.1; 1881 (veri)

Hesap makinelerinden önce, insanlar kıllı aritmetiği, adı verilen referans kitaplarına yaptırdılar. logaritma tabloları. 1881’de gökbilimci Simon Newcomb, bir ile başlayan sayılara karşılık gelen logaritma tablolarının ilk sayfalarının, daha sonraki bozulmamış sayfalara kıyasla kirli ve yıpranmış olduğunu fark etti. Doğal veri kümelerinde daha küçük baş basamakların daha yaygın olması gerektiği sonucuna vardı ve Doğru yüzdeleri yayınladı. Fizikçi Frank Benford, 1938’de aynı gözlemi yaptı ve yasayı popüler hale getirdi. 20.000’den fazla veri noktasının derlenmesi evrenselliğini göstermektir. Arasöz: Benford’un isimsiz kredisi, Stigler yasasının bir örneğidir ve bilimsel keşiflere asla orijinal kaşiflerinin adının verilmediğini iddia eder. Stigler yasası, sosyolog Robert K. Merton tarafından Stephen Stigler’ın adını öğrenmesinden çok önce ortaya atılmıştı.

Benford yasası sadece istatistiksel bir tuhaflık değil: mali müşavir Wesley Rhodes, yatırımcıları dolandırmaktan suçlu bulundu. savcılar mahkemede belgelerinin baştaki rakamların beklenen dağılımına uymadığını ve bu nedenle muhtemelen uydurma olduğunu iddia ettiğinde. İlke daha sonra bilgisayar bilimcisi Jennifer Golbeck’e yardımcı oldu. bir Rus bot ağını ortaya çıkarmak Twitter’dan. Çoğu kullanıcı için, takipçilerinin sahip olduğu takipçi sayısının Benford yasasına uyduğunu, ancak yapay hesapların modelden önemli ölçüde saptığını gözlemledi. Satın alan kişileri yakalamak için benzer yöntemler kullandı. sahte retweetler. Örnekleri Benford yasası dolandırıcılık tespitine uygulandı bol, dan Yunanistan makroekonomik verileri manipüle ediyor oy hilesi yapmak için avro bölgesine katılma başvurusunda İran’ın 2009 cumhurbaşkanlığı seçimleri. Mesaj açık: organik süreçler küçük rakamları destekleyen sayılar üretirken, verileri tahrif etmenin saf yöntemleri bunu yapmıyor.

Doğa neden dokuzlu bir kıtlık ve birli bolluk üretiyor? İlk olarak, birçok veri setinin Benford yasasına uymadığını belirtmek önemlidir. Yetişkin boyları, fit olarak ölçüldüğünde çoğunlukla 4’ler, 5’ler ve 6’lar ile başlar. Bir rulet çarkının 2 ile başlayan bir sayıya gelme olasılığı 1 ile aynı. Yasanın, belirli rastgele süreç türlerinden gelişen birkaç büyüklük sırasını kapsayan veri kümelerinden çıkması daha olasıdır.

Üstel büyüme özellikle sezgisel bir örnektir. Başlangıçta 100 hayvanın yaşadığı ve nüfusu her yıl ikiye katlanan bir ada hayal edin: bir yıl sonra 200 hayvan var ve iki yıl sonra 400 hayvan var. İlk yıl boyunca, adanın nüfus büyüklüğünün ilk basamağı 1’di. Öte yandan, ikinci yıl nüfus sayımları aynı dönem için 200’lü ve 300’lü yıllara yayıldı ve her önde gelen için daha az zaman kaldı. saltanat için rakam. Bu, üçüncü yılda 400 ila 800 ile devam ediyor ve önde gelen haneler daha da hızlı emekli oluyor. Buradaki fikir şu ki, 1.000’den 2.000’e büyümek ikiye katlamayı gerektiriyor, oysa 8.000’den 9.000’e büyümek yalnızca yüzde 12,5’lik bir artış ve bu eğilim her yeni büyüklük sıralamasında sıfırlanıyor. Ada örneğinde seçtiğimiz parametrelerde özel bir şey yok. Örneğin, 43 hayvanlık bir popülasyonla başlayabilir ve yılda 1,3 kat büyüyebilir ve bu, aynı tam ön basamak modelini verir. Bu türden üstel büyümenin neredeyse tamamı Benford’a doğru yönelecektir.

Yasanın ölçü birimlerine karşı inatçı kayıtsızlığı, modelin doğal dünyada neden bu kadar yaygın olduğuna dair başka bir ipucu veriyor. Nehir uzunlukları, onları metre veya mil olarak kaydetsek de Benford yasasını takip eder, oysa yetişkin boyları gibi Benford’a uymayan veriler, metreye dönüştürüldüğünde, hiç kimse dört metre boyunda olmadığından, baştaki basamakların dağılımını kökten değiştirir. (Dikkat çekici bir şekilde, Benford’unki sadece Bu tür birim değişikliklerinden etkilenmeyen baştaki basamak dağılımı.) Birim değiştirmeyi, veri kümemizdeki her değeri belirli bir sayı ile çarpmak olarak düşünebiliriz. Örneğin, milden metreye dönüştürmek için bir dizi uzunluğu 1.609,34 ile çarparız. Benford yasası aslında çok daha genel bir dönüşüme dayanıklıdır. Benford uyumlu verileri alma ve çarpma her biri tarafından giriş farklı sayı (1.609,34 gibi sabit bir sayı yerine) veriden bağımsız olarak, baştaki basamak dağılımını bozmaz. Bunun anlamı, eğer bir doğal fenomen birkaç bağımsız kaynağın ürününden ortaya çıkıyorsa, o zaman sadece bir genel sonucun elde edilmesi için bu kaynakların Benford yasasıyla uyumlu olması gerekir. Benford yasası yamyamcadır, tıpkı bir grup sayıyı birbiriyle çarptığınızda, tüm sonucun sıfır olması için bunlardan yalnızca birinin sıfır olması gerektiği gibi.

Bu açıklamalar, örüntünün pek çok görünümünü açıklamaktadır, ancak bir sayı sayısından neden çeşitli sayı koleksiyonunun çıkarıldığını açıklamamaktadırlar. Bilimsel amerikalı Benford yasasını gösterirdi: bu sayılar üstel olarak artmaz ve onları birlikte çarpmıyoruz. Matematikçi Ted Hill, birçok kişinin düşündüğü şeyi keşfetti. önde gelen rakam yasasının kesin kanıtı. Argümanı ne yazık ki oldukça teknik, ancak basit terimlerle, bir grup rasgele veri setinden (matematik açısından, olasılık dağılımları) bir grup rasgele sayı seçerseniz, o zaman bunların Benford yasasına doğru yöneleceğini söylüyor. Başka bir deyişle, sayısız veri setinin Benford’un modelini gösterdiğini görmüş olsak da, bunu başarmanın en güvenilir yolu, bir gazetede gördüğümüz gibi çeşitli kaynaklardan rakamlar çekmektir.

Benford yasası hakkında çok zaman harcadım ve açıklamaların duvar örgüsüne rağmen, bunun ne sıklıkta meydana geldiği beni hala şaşırtıyor. Günlük yaşamınızda karşılaştığınız sayılara dikkat edin, fark etmeye başlayabilirsiniz.

Bu bir görüş ve analiz yazısıdır ve yazar veya yazarlar tarafından ifade edilen görüşler mutlaka o kişiye ait değildir. Bilimsel amerikalı.





Kaynak : https://www.scientificamerican.com/article/what-is-benfords-law-why-this-unexpected-pattern-of-numbers-is-everywhere/

Yorum yapın

SMM Panel PDF Kitap indir