Le Mystère du 11 manquant : Une BD xkcd révèle une anomalie numérique

2025-06-19

Une bande dessinée xkcd a soulevé une question sur la fréquence anormalement basse du '11' du mois dans la base de données Ngrams de Google. L'auteur a confirmé cette anomalie grâce à une analyse de données, attribuant le problème à des erreurs d'interprétation OCR et à la technologie d'impression. Le chiffre '1' ressemble beaucoup aux lettres 'I', 'l' et 'i', entraînant des erreurs de lecture fréquentes de '11' comme 'II', 'Il' et même 'n'. Ceci était particulièrement courant à l'époque des machines à écrire, en raison de l'absence d'une touche '1' dédiée. La découverte met en évidence la complexité du processus apparemment simple de reconnaissance numérique et l'impact de l'évolution technologique sur l'analyse de données.

Divers