相関ヒートマップ

すべてのペアの相関を一目で確認——赤は関連あり、青は逆相関

相関ヒートマップは各セルが2つの数値列間のピアソンrを示す 行列です。色でパターンが一目でわかります:赤いセル(r が +1 に近い)は2変数が 一緒に上昇することを意味し、青いセル(r が -1 に近い)は一方が上がると他方が 下がることを意味し、白/薄いセル(r が 0 に近い)は線形関係がないことを意味します。

このツールには30人分のAge、Height、Weight、Score、Incomeのサンプルデータセットが 読み込まれています。HeightとWeightは意図的に相関(〜0.7)し、AgeとIncomeは中程度の相関 (〜0.6)があり、Scoreは残りと独立しています。データをリンクをクリックして ヒートマップを作成し、実際に関連しているペアを確認しましょう。

独自の複数列数値CSVを貼り付けて相関ヒートマップを作成できます。

相関ヒートマップとは何ですか?
相関ヒートマップは行と列が変数を表し、各セルがそのペアのピアソン相関係数rを示すグリッドです。色が強さと方向をエンコードします:温色(赤/オレンジ)は正の相関、寒色(青)は負の相関、中間色(白)はほぼゼロを表します。
ピアソンrとは何ですか?その値は何を意味しますか?
ピアソンrは-1から+1の範囲を取ります。r = +1は完全な正の線形関係(Xが増加するとYも常に比例して増加)。r = -1は完全な逆関係。r = 0は線形関係がないことを意味します(ただし非線形関係は存在する場合があります)。目安:|r| > 0.7は強い相関、0.4〜0.7は中程度、< 0.4は弱い相関です。
r = 0は関係がないことを意味しますか?
r = 0は線形関係がないことを意味します。2変数が強い非線形関係(U字型など)を持ちながら r ≈ 0 になることがあります。常にヒートマップと散布図を組み合わせて、ピアソンrが見逃す曲線やクラスターを確認してください。
相関ヒートマップはいつ使うべきですか?
3つ以上の数値列があり、さらに調査する価値のあるペアを素早く見つけたいときにヒートマップが最も役立ちます。回帰モデルを構築する前の探索的データ分析(EDA)の標準的な最初のステップで、多重共線性と重要な予測変数を見つけるのに役立ちます。
相関は因果関係を意味しますか?
いいえ。2変数間の高い相関はデータセットで一緒に動くことを意味するだけで、一方が他方を引き起こすことを意味しません。アイスクリームの売上と日焼けの発生率は高い相関があります(どちらも夏にピーク)が、どちらも他方を引き起こしません。因果関係の確立には制御実験や注意深い因果推論手法が必要です。
対角線がすべて1.0なのはなぜですか?
相関行列の対角線は各変数とそれ自身との相関を示し、常に完全な+1です。これは期待されることであり、行列が正しいことを確認するだけです。