Dossier – La Loi de Benford

Dossier de Mathieu dans l’épisode #19.

La loi de Benford (également appelée loi des nombres anormaux) n’est pas à proprement parler une loi, mais plutôt une observation empirique qui se rencontre dans certains cas de figure et sur des ensembles de données bien particuliers.

La loi de Benford dit:

  • que les nombres dans la vie réelle ont l’habitude de commencer plus fréquemment par le chiffre «1».
  • que de tous les nombres infiniment possibles, ceux commençant par 1 sont plus fréquents ou probables que les autres.
  • que dans une liste de données statistiques, elle énonce que le 1er chiffre (non nul) le plus fréquent est 1, pour près du tiers des observations (30,1%). Puis le 2 (17,6%) est lui-même est plus fréquent que 3 (12,5%)… et la probabilité d’avoir un 9 comme premier chiffre significatif n’est que de 4,6 %.

Benford Distribution

Exemples

Cette distribution a été observée une première fois en 1881 par l’astronome américain Simon Newcomb après qu’il se fut aperçu de l’usure (et donc de l’utilisation) préférentielle des premières pages sur les dernières pages d’un ouvrage référençant les tables logarithmiques (utilisées à l’époque pour effectuer des calculs). Lorsqu’il réalisa que les premières pages (tables) étaient plus usées que les autres, il en a déduit que ses collègues de l’Université réalisaient des calculs avec des nombres commençant par des chiffres bas de façon beaucoup plus fréquente.

  • Cette découverte passe complètement inaperçu pendant cinquante-sept ans.
  • On constate (soit dit en passant) que la loi de Stigler est aussi vérifiée, loi selon laquelle une découverte scientifique ne porte jamais le nom de son auteur.
  • C’est Frank Benford(ingénieur chez General Electric), aux alentours de 1938, qui remarqua à son tour cette usure inégale des pages de certains ouvrages,  et il constate qu’il arrive aux même résultats après avoir répertorié des dizaines de milliers de données de notre vie quotidienne:
    • longueurs de fleuves
    • nombre d’habitants et indices de population
    • numéro dans l’adresse des personnes
    • taux de mortalité
    • listes de prix
    • liste de factures
    • cours de la bourse
    • les statistiques de la Ligue américaine de base-ball
    • Les scores de tournois de tennis
    • les nombre apparaissant dans des articles d’une revue
    • nombres premiers
    • constantes physiques et mathématiques
    • La loi de Benford est aussi utilisée dans différents pays pour détecter les fraudes fiscales.
      • Dans l’ensemble des données retournées par une déclaration fiscale, si les fréquences d’apparition et ratios des nombres et montants déclarés suivent une loi de Benford, la déclaration est probablement honnête.
      • Mais si les montants sont choisis et remplis au hasard, une analyse statistique montrera une distribution différente à celle de Benford, il y aurait donc risque de fraude.
      • Les premiers chiffres significatifs 5 et 6 prédominent nettement dans les données falsifiées : 40 % pour les 5 et plus de 20 % pour les 6.

Loi de Benford

Explications

  • Plus généralement, il s’agit en fait d’une loi logarithmique
    • qui exprime la probabilité que le premier chiffre d’un nombre soit le chiffre x.
    • qui permet de calculer la probabilité qu’un nombre commence par un chiffre déterminé.
  • On voit aussi que la formule peut s’étendre pour calculer la probabilité qu’un nombre commence par une séquence concrète de chiffres, pas seulement le premier.
    • Par exemple par extension la probabilité qu’un nombre commence par 79 est de 0.055%.
  • Les cas de figure qui fonctionnent démontrent aussi une invariance d’échelle:
    • Par exemple avec un ensemble de valeurs boursières ou de devises, on voit que la loi de Benford est indépendante du type de monnaie (dollars, euros, yens…) dans laquelle on exprime ces valeurs boursières.
  • Il existe une explication formelle mathématique qui a été établie par le mathématicien Ted Hill en 1995 et qui démontre l’énoncée émise par la loi de Benford.
  • Une autre explication consiste à considérer que l’on commence à compter à partir de 1 (1, 2, 3, …) jusqu’à 9, instant auquel chaque chiffe possède la même probabilité. Mais de 10 à 19, le premier chiffre est toujours 1, et c’est seulement quand on arrivera à 99 que tous les chiffres acquiéreront à nouveau la même probabilité d’apparition.

Limites de la loi de Benford

  • Cette loi s’applique très bien pour des données en relation avec le monde naturel et socio-économique, aux nombres qu’on utilise dans notre quotidien.
  • Cette loi n’est par contre pas vérifiée si la série de données comporte des contraintes quant à l’échelle des valeurs vraisemblables:
    • par exemple, la taille des individus, lorsqu’elle est exprimée dans le système métrique, ne suit pas la loi de Benford puisque la quasi totalité des mesures commence par le chiffre « 1 » (1 mètre).
  • La loi de Benford peut-elle m’aider à prévoir le résultat d’un loterie?
    • Malheureusement ce n’est pas le cas, les résultats de la loi de Benford ne sont pas observés…
    • A la différences des nombres réels et naturels suggérés par les humains, les numéros mis en jeu dans les tirages de loterie ne sont pas des numéros issus du monde naturel et réel, le résultat est arbitraire et équiprobable.
    • Les balles numérotées sont choisies arbitrairement, elles ne sont pas choisies en fonction d’une séquence numérisée.
    • On n’effectue pas une loterie sur un ensemble des nombres qui suivent la distribution de Benford, mais sur un ensemble de nombre qui suivent une distribution uniforme.

Resources

Calculateur en ligne de la loi de Benford

Fréquences relatives d’apparition de la 1ère décimale d’un résultat de mesure selon la Loi de Benford:

Loi de Benford -Fréquence relative

Sources:

http://fr.wikipedia.org/wiki/Loi_de_Benford

http://www.rexswain.com/benford.html (article en anglais)

http://www.microsiervos.com/archivo/azar/numeros-1-ley-benford.html (article en espagnol)

http://www.genciencia.com/matematicas/la-ley-de-benford-i (article en espagnol)

http://www.genciencia.com/matematicas/la-ley-de-benford-y-ii (article en espagnol)

Derniers épisodes