Korrelations-Heatmap

Alle paarweisen Korrelationen auf einen Blick — rot bedeutet verwandt, blau bedeutet umgekehrt verwandt

Eine Korrelations-Heatmap ist eine Matrix, in der jede Zelle den Pearson-r zwischen zwei numerischen Spalten zeigt. Die Farbe lässt Muster sofort erkennen: Rote Zellen (r nahe +1) bedeuten, dass beide Variablen gemeinsam steigen; Blaue Zellen (r nahe -1) bedeuten, dass eine steigt, während die andere fällt; weiße/blasse Zellen (r nahe 0) bedeuten keine lineare Beziehung.

Dieses Tool lädt einen Stichprobendatensatz von 30 Personen mit Alter, Größe, Gewicht, Punktzahl und Einkommen. Größe und Gewicht sind bewusst korreliert (~0,7); Alter und Einkommen sind mäßig korreliert (~0,6); Punktzahl ist unabhängig von den anderen. Klicke auf Daten verknüpfen, um die Heatmap zu erstellen und zu sehen, welche Paare tatsächlich verwandt sind.

Füge eine beliebige mehrspeltige numerische CSV ein, um eine Korrelations-Heatmap für deine eigenen Daten zu erstellen.

Was ist eine Korrelations-Heatmap?
Eine Korrelations-Heatmap ist ein Raster, bei dem Zeilen und Spalten Variablen darstellen und jede Zelle den Pearson-Korrelationskoeffizienten r zwischen diesem Paar zeigt. Farben kodieren Stärke und Richtung: warme Farben (Rot/Orange) für positive Korrelation, kühle Farben (Blau) für negative und neutral (Weiß) für nahe null.
Was ist Pearson-r und was bedeuten seine Werte?
Pearson-r reicht von -1 bis +1. r = +1 ist eine perfekte positive lineare Beziehung (wenn X zunimmt, nimmt Y immer proportional zu). r = -1 ist eine perfekte inverse Beziehung. r = 0 bedeutet keine lineare Beziehung — obwohl noch eine nichtlineare Beziehung bestehen kann. Als grobe Orientierung: |r| > 0,7 = stark, 0,4–0,7 = mäßig, < 0,4 = schwach.
Was bedeutet r = 0 — bedeutet es keine Beziehung?
r = 0 bedeutet keine lineare Beziehung. Zwei Variablen können eine starke nichtlineare Beziehung haben (z. B. U-förmig) und trotzdem r ≈ 0 ergeben. Kombiniere die Heatmap immer mit Streudiagrammen, um Kurven oder Cluster zu erkennen, die Pearson-r übersieht.
Wann sollte ich eine Korrelations-Heatmap verwenden?
Heatmaps sind am nützlichsten, wenn du 3 oder mehr numerische Spalten hast und schnell herausfinden möchtest, welche Paare es wert sind, weiter untersucht zu werden. Sie sind ein Standarderster Schritt bei der explorativen Datenanalyse (EDA), bevor Regressionsmodelle erstellt werden — sie helfen dir, Multikollinearität und interessante Prädiktoren zu erkennen.
Bedeutet Korrelation Kausalität?
Nein. Eine hohe Korrelation zwischen zwei Variablen bedeutet nur, dass sie sich in diesem Datensatz gemeinsam verändern — nicht, dass eine die andere verursacht. Eiscremeverkäufe und Sonnenbrandquoten sind hoch korreliert (beide gipfeln im Sommer), aber keine verursacht die andere. Die Feststellung von Kausalität erfordert kontrollierte Experimente oder sorgfältige kausale Inferenzmethoden.
Warum ist die Diagonale immer 1,0?
Die Diagonale einer Korrelationsmatrix zeigt die Korrelation jeder Variable mit sich selbst, die immer perfekt +1 ist. Das ist erwartet und normal — es bestätigt nur, dass die Matrix korrekt ist.