Mark Twain sagte einmal: " Es gibt Lügen, verdammte Lügen und Statistiken. "Der Punkt ist, dass Statistiken verwendet werden können, um irgendetwas zu beweisen, egal ob sie vor Ort gemacht oder aus echten Daten generiert werden.
Sie müssen sich auch nicht dafür entscheiden, denn eine Website mit dem Namen "Pseudo-Korrelationen" zeigt perfekt, wie Statistiken für eine bestimmte Ausrichtung angepasst und gestaltet werden können. Es stellt sich heraus, dass Statistiken eigentlich ziemlich nutzlos sind.
Die Webseite
"Spurious Correlations" ist die Idee von Tyler Vigen, einem Kriminalwissenschaftler an der Harvard Law School. Vigen ist fasziniert von der empirischen Forschung, und so hat er eine einfache Website geschaffen, die Variablen vergleicht und miteinander korreliert.
Es gibt jeden Tag eine neue dieser Scheinkorrelationen auf der Site, mit über 24.000, die bis heute gepostet wurden. Zusätzlich zu den automatisch generierten können die Besucher ihre eigenen entdecken, indem sie zwei verschiedene Datensätze auswählen, um sie miteinander zu vergleichen.
Probieren Sie es aus, Sie werden erstaunt sein, wie süchtig alles ist.
Die Beispiele
Was folgt, sind fünf zufällig gewählte Beispiele von Scheinkorrelationen, obwohl Nicolas Cage immer dazu bestimmt war, sich zu zeigen. Weil er Nicolas Cage ist.
Denken Sie daran, dass keines dieser Beispiele etwas anderes beweist als die Tatsache, dass Statistiken verwendet werden können, um Schlussfolgerungen zu ziehen, die nicht existieren. Aber es macht viel Spaß sich die Gründe vorzustellen, warum diese Statistiken zusammenpassen.
Das Geld für Haustiere in den USA korreliert mit der Anzahl der Anwälte in Kalifornien. Sind verwöhnte Haustiere 6 Apps, die Ihr iPad in ein überteuert-noch-Geniales Katzenspielzeug verwandelt 6 Apps, die Ihr iPad in ein überteuert-noch-Geniales Katzenspielzeug verwandeln Katzen sind genial. Wir sind uns alle einig. Ich muss allerdings zugeben, dass selbst für einen Katzenliebhaber wie mich die Idee, meine Katzen mit meinem wertvollen iPad spielen zu lassen, ein bisschen verrückt war. Oder ist das nur reiner Zufall?
Die Anzahl der Menschen, die ertrank, wenn sie in ein Schwimmbad fallen, korreliert mit der Anzahl der Filme, in denen Nicolas Cage aufgetreten ist. Cage hat einige verrückte schauspielerische Fähigkeiten, aber sie führen nicht zu Ertrinken.
Der Gesamtumsatz durch Arcaden in den USA korreliert mit der Anzahl der Informatik Open For All: 6 Informatikprojekte vom MIT Media Lab, die Sie heute ausprobieren können Offen für alle: 6 Informatikprojekte vom MIT Media Lab, die Sie heute ausprobieren können Jede große Bildungseinrichtung hat eine gemeinsame Qualität - Innovation. MIT Media Labs ist ein Exzellenzzentrum, das vielschichtiges Denken fördert, und seine "primäre Richtlinie" ist, sich auf Entwicklungen zu konzentrieren, die ... Lesen Sie mehr in den USA verliehene Doktorate Es könnte denkbar sein, dass es einen Link gibt, aber es ist wahrscheinlicher Diese beiden Dinge sind einfach zusammengewachsen.
Die Anzahl der in den USA verkauften deutschen Personenkraftwagen korreliert mit der Zahl der Selbstmorde durch den Absturz von Kraftfahrzeugen in den USA. Führt das Fahren eines deutschen Autos zu depressiven und selbstmörderischen 7 Online-Ressourcen für diejenigen, die depressiv und selbstmörderisch sind 7 Online-Ressourcen Um denjenigen zu helfen, die deprimiert und selbstmörderisch sind Obwohl ich der Chefredakteur von MakeUseOf bin, habe ich eine große Behinderung in meinem Leben, die eine klinische Depression ist. Es begann im Jahr 2002, als eine Depression im Zusammenhang mit Stress in meinem Beruf, ... Lesen Sie mehr? Wir vermuten nicht.
Die Scheidungsrate in Maine korreliert mit dem Pro-Kopf-Konsum von Margarine in den USA. Vielleicht sollte die Person, die für den Einkauf zuständig ist, stattdessen Butter gekauft haben.
Der Unterricht
Scheinkorrelationen ist auf den ersten Blick eine nette kleine Website, die Sie für ein paar Minuten ablenken kann. Aber es ist mehr als das. Es ist auch eine Erinnerung, dass Statistiken nicht zum Nennwert akzeptiert werden sollten. Stattdessen sollten sie näher untersucht werden, um sicherzustellen, dass sie sich tatsächlich stapeln.
Wir haben wahrscheinlich alle Schlagzeilen in Zeitungen gesehen, in denen eine Verbindung zwischen einem zufälligen Trend und einem anderen Trend festgestellt wurde. Boulevard-Journalisten und Redakteure lieben diese Dinge, da sie ein billiges Gimmick sind, das garantiert Zeitungen verkauft. Aber sie sind oft entweder unschuldig irreführend oder ganz und absichtlich falsch. Bulls ** t mit anderen Worten.
Und jetzt wissen wir dank der Scheinkorrelationen, warum das so ist.
Schlussfolgerungen
Verbringen Sie etwas Zeit mit Scheinkorrelationen und sehen Sie, welche zwei völlig unverbundenen Datensätze Sie abgleichen können. Und dann komm zurück und erzähle uns, was du gefunden hast. Fühle dich nicht schuldig wegen der Verbreitung von Fehlinformationen; Boulevardzeitungen tun es jeden Tag der Woche.
Bildnachweis: Simon Cunningham über Flickr, Ken Teegardin über Flickr, Ben Brown über Flickr