mathpoint.ch | |||||
Logarithmen, abgegriffene Buchseiten und frisierte Bilanzen: Das Gesetz von Benford |
|||||
Im Folgenden spielt der Begriff der "führenden Ziffer einer Zahl" eine wichtige Rolle. Was ist darunter zu verstehen? - Die führende Ziffer einer Zahl ist die erste von Null verschiedene Ziffer der Zahl. Beispiele: 123.5 = 1.235⋅10² führende Ziffer = 1 Vor der Taschenrechner-Aera rechnete man mit Hilfe von Logarithmentafeln. Zu jeder Zahl schlug man den zugehörigen Zehnerlogarithmus nach. Dadurch konnten Multiplikationen auf Additionen und Divisionen auf Subtraktionen reduziert werden. Zahlen mit der gleichen führenden Ziffer wurden -unabhängig von der Stellung des Kommas - am gleichen Ort in der Logarithmentafel nachgeschlagen. |
1881 bemerkte der amerikanische Astronom Simon Newcomb, dass in zahlreichen Logarithmentafeln die ersten Seiten deutlich stärker abgegriffen waren als die hinteren. Das erschien ihm seltsam. Auf den ersten Seiten musste man stets nachschlagen, wenn man mit Zahlen rechnete, deren erste von Null verschiedene Ziffer eine 1 war, Dass die ersten Seiten abgegriffener waren, konnte nur bedeuten, dass Zahlen, die mit einer 1 begannen, häufiger vorkamen als etwa Zahlen, die mit einer 9 begannen. Konnte das tatsächlich sein? Newcombs Beobachtung geriet wieder in Vergessenheit, bis 1938 ein amerikanischer Elektroingenieur, Frank Benford, das Phänomen erneut entdeckte. Er analysierte etwa 20'000 Zahlen, die auf verschiedenste Weise zusammengekommen waren: Einwohnerzahlen amerikanischer Städte, physikalische Konstanten in Formelsammlungen, Zeitungsauflagen, Entwässerungsgebiete von Flüssen, Zahlen aus der Zeitschrift "Reader's Digest", usw. Tatsächlich: Rund 30% dieser Zahlen hatten eine 1 als führende Ziffer, ca. 17% eine 2 und ca. 12% eine 3. Das waren bereits 60% der untersuchten Zahlen! Das Phänomen wurde genauer untersucht. Die einfachste Form des Benfordschen Gesetzes betrifft die erste Ziffer ≠ 0 einer Zahl: |
Beim Fälschen von Daten wird nun die gewissermassen "natürlicherweise" entstandene Benford-Ordnung gestört. Deshalb ist es möglich, mit Hilfe des Benford-Gesetzes z.B. Bilanzen zu prüfen. So wiesen etwa die Zahlen des griechischen Staatshaushaltes der jüngeren Gegenwart wesentliche Abweichungen vom Benfordschen Gesetz auf, was auf Manipulationen hindeutet. Auch die belgische Bilanz fällt diesbezüglich schlecht aus. Die Mathematiker haben in den letzten 30 Jahren recht konkret eingrenzen können, welche Arten von Zahlensammlungen benford-verträglich sind und welche nicht. Es müssen Sammlungen sein, die sehr grosse und sehr kleine Werte umfassen und deren Zahlen durch möglichst viele, voneinander unabhängige Einflüsse entstanden sind. Dass Bilanzen zu den benford-verträglichen Zahlen-Sammlungen gehören, ist Pech für Erzeuger "kreativer" Abschlüsse. So stand hier eine skurrile Beobachtung an verschmutzten Logarithmentafeln am Anfang einer Entwicklung, die schliesslich zu logarithmischen Gesetzen führte, mit deren Hilfe man Hinweise auf Bilanzmanipulationen erhalten kann. |
||||
p("erste Ziffer ist d") = lg(d+1) - lg(d) = lg[(d+1)/d] |
|||||
Setzt man für d der Reihe nach die Ziffern 1 bis 9 ein, findet man folgende Wahrscheinlichkeiten, dass die Ziffer d die führende Ziffer einer Zahl ist:
Wahrscheinlichkeit, dass 3 die führende Ziffer ist = lg(4/3) ≈ 0.125 ≈ 12.5%.
|
Die Nachfolger der alten Logarithmentafeln sind Computertastaturen: In obiger Fotografie einer Computertastatur wird der Staub, der sich auf den Tasten "eingebrannt" hat, mittels Bildbearbeitung stark übertrieben dargestellt (massive Kontrasterhöhung). Man erkennt deutlich, dass die Tasten 1 und 2 am wenigsten "eingebrannten" Staub enthalten; offenbar werden diese Tasten viel öfter benutzt als die übrigen Zifferntasten und dadurch dauernd gereinigt: das moderne Analogon zu Newcombs Beobachtung an Logarithmentafeln. Oder wie Prof. Thomas Jech es ausdrückte: "When the '1' key on my old computer gave out I was not surprised." Infos z.T. aus: www.educ.ethz.ch/unt/um/mathe/ana/benford |
||||
Das Benford-Gesetz in Zahlenfolgen |
|
||||
Es gibt Zahlenfolgen, die -wenn sie sehr weit aufgeführt werden- in der Verteilung der führenden Ziffern das Benford-Gesetz erfüllen, es gibt aber auch Folgen, bei denen dies nicht der Fall ist. Beispiele für benford-verträgliche Folgen:
Beispiele für nicht-benford-verträgliche Folgen:
|
Beispiel: Folge der Zweierpotenzen 1 2 4 8 16 32 64 128 256 512 1024 2048 4096 8192 16384 ... Wir interessieren uns hier nur für die erste Ziffer. Deshalb können wir alle Zahlen der Folge reduzieren und zwar wie folgt: 1 2 4 8 1.6 3.2 6.4 1.28 2.56 5.12 1.024 2.048 4.096 8.192 1.6384 ... Wir erhalten dann lauter Zahlen im Intervall [1;10[. Wir ignorieren also die fehlenden Zehnerpotenzen; die führenden Ziffern bleiben ja bei dieser Reduktion dieselben. Bereits hier sieht man, dass die führende Ziffer 1 in fünf der oben aufgeführten Zahlen vorkommt. Die 8 tritt nur zwei Mal auf, die 9 wird erst als führende Ziffer von 253 die Bühne betreten. Je länger diese Folge aufgeführt wird, desto mehr wird sich die Verteilung der führenden Ziffern dem Benford-Gesetz annähern (s. blauer Kasten links). Dies soll im Folgenden heuristisch "begründet" werden. Zunächst einige sehr pauschale Bemerkungen:
Indem wir von den Zahlen unserer geometrischen Folge zu den Logarithmen (wir wählen die Zehnerlogarithmen) übergehen, erhalten wir eine arithmetische Folge, denn es gilt:
|
||||
Beispiel: Der Bruchteil der türkisfarbenen Strecke gemessen an der ganzen Einheitsstrecke ist die Wahrscheinlichkeit, dass die führende Ziffer einer Zahl der Folge (2ⁿ) - allgemein auch der Folge (qⁿ) mit lg(q) irrational - eine 4 ist. Die Länge der türkisfarbenen Strecke ist gleich lg(5) - lg(4) = lg(5/4). |
Schlussresultat
|
||||
Aufgabe: Lösung: p("zweite Ziffer = 1") = lg(12/11) + lg(22/21) + lg(32/31) + ... + lg(92/91) ≈0.1139 ≈11.39%. Aufgabe: Lösung: Vergleicht man die Ergebnisse beider Aufgaben, bemerkt man überraschenderweise, dass die Wahrscheinlichkeit, dass die zweite Ziffer eine 1 ist davon abhängt, wie gross die erste Ziffer ist! Die erste Ziffer beeinflusst also die Wahrscheinlichkeit für das Auftreten der zweiten Ziffer. |
Verallgemeinerung auf Zifferngruppen Die Benford-Formel für die führenden Ziffern:
Skaleninvarianz Habe ich etwa Flusslängen in km, welche dem Benford-Gesetz entsprechen, so werden auch die in englische Meilen umgerechneten Flusslängen dem Benford-Gesetz gehorchen. (Einige führende Ziffern 1 z.B. werden verschwinden, dafür andernorts neu auftauchen.)
|
||||
Zusammenfassung Die geometrische Folge (qⁿ) mit lg(q) irrational ist eine Benford-Folge.
|
Benford's Law in der Physik So wie Bilanzfälschungen via Abweichungen von Benfords Gesetz entdeckt werden können, ist es möglich, dass in physikalischen Bereichen, in denen Benfords Gesetz empirisch festgestellt wird plötzliche Abweichungen von diesem Gesetz darauf hindeuten, dass neue Einflüsse ins Spiel kommen, die man bisher noch nicht wahrgenommen hat. Die Benford-Verteilung wird deshalb auch für die Naturwissenschaft zunehmend interessant. Eine ausgezeichnete Wikepedia-Seite zum Thema: |