Carte Thermique de Corrélation

Visualisez toutes les corrélations par paires en un coup d'œil — rouge = corrélés, bleu = inversement corrélés

Une carte thermique de corrélation est une matrice où chaque cellule indique le r de Pearson entre deux colonnes numériques. La couleur fait ressortir les tendances immédiatement : les cellules rouges (r proche de +1) signifient que les deux variables augmentent ensemble ; les cellules bleues (r proche de -1) signifient que l'une augmente quand l'autre diminue ; les cellules blanches/pâles (r proche de 0) indiquent l'absence de relation linéaire.

Cet outil charge un jeu de données de 30 personnes avec Âge, Taille, Poids, Score et Revenu. Taille et Poids sont intentionnellement corrélés (~0,7) ; Âge et Revenu modérément corrélés (~0,6) ; Score est indépendant des autres. Cliquez sur Lier les données pour construire la carte thermique et voir quelles paires sont réellement liées.

Collez n'importe quel CSV numérique multi-colonnes pour créer une carte thermique de corrélation de vos propres données.

Qu'est-ce qu'une carte thermique de corrélation ?
Une carte thermique de corrélation est une grille où les lignes et colonnes représentent des variables, et chaque cellule affiche le coefficient de corrélation de Pearson r entre cette paire. Les couleurs encodent la force et la direction : couleurs chaudes (rouge/orange) pour une corrélation positive, couleurs froides (bleu) pour une corrélation négative, et neutre (blanc) pour une valeur proche de zéro.
Qu'est-ce que le r de Pearson et que signifient ses valeurs ?
Le r de Pearson varie de -1 à +1. r = +1 est une relation linéaire positive parfaite (quand X augmente, Y augmente toujours proportionnellement). r = -1 est une relation inverse parfaite. r = 0 signifie l'absence de relation linéaire — bien qu'une relation non linéaire puisse exister. Comme guide approximatif : |r| > 0,7 = fort, 0,4–0,7 = modéré, < 0,4 = faible.
Que signifie r = 0 — cela veut-il dire qu'il n'y a aucune relation ?
r = 0 signifie l'absence de relation linéaire. Deux variables peuvent avoir une relation non linéaire forte (p. ex. en forme de U) et produire quand même r ≈ 0. Associez toujours la carte thermique à des nuages de points pour détecter les courbes ou clusters que r de Pearson manque.
Quand utiliser une carte thermique de corrélation ?
Les cartes thermiques sont plus utiles lorsque vous avez 3 colonnes numériques ou plus et souhaitez trouver rapidement quelles paires méritent une investigation approfondie. Elles constituent une première étape standard dans l'analyse exploratoire des données (EDA) avant de construire des modèles de régression — elles aident à repérer la multicolinéarité et les prédicteurs intéressants.
La corrélation implique-t-elle la causalité ?
Non. Une corrélation élevée entre deux variables signifie seulement qu'elles évoluent ensemble dans ce jeu de données — pas que l'une cause l'autre. Les ventes de glaces et les coups de soleil sont fortement corrélés (les deux atteignent leur pic en été), mais ni l'un ni l'autre ne cause l'autre. Établir la causalité nécessite des expériences contrôlées ou des méthodes d'inférence causale rigoureuses.
Pourquoi la diagonale est-elle toujours à 1,0 ?
La diagonale d'une matrice de corrélation montre la corrélation de chaque variable avec elle-même, qui est toujours un parfait +1. C'est attendu et normal — cela confirme simplement que la matrice est correcte.