Mapa de Calor de Correlação

Veja todas as correlações em pares de relance — vermelho significa relacionado, azul significa inversamente relacionado

Um mapa de calor de correlação é uma matriz onde cada célula mostra o Pearson r entre duas colunas numéricas. A cor faz com que os padrões apareçam instantaneamente: células vermelhas (r próximo de +1) significam que as duas variáveis sobem juntas; células azuis (r próximo de -1) significam que uma sobe enquanto a outra cai; células brancas/pálidas (r próximo de 0) significam nenhuma relação linear.

Esta ferramenta carrega um conjunto de dados amostral de 30 pessoas com Idade, Altura, Peso, Pontuação e Renda. Altura e Peso são intencionalmente correlacionados (~0,7); Idade e Renda estão moderadamente correlacionadas (~0,6); Pontuação é independente do resto. Clique em Vincular Dados para construir o mapa de calor e ver quais pares estão realmente relacionados.

Cole qualquer CSV numérico de múltiplas colunas para construir um mapa de calor de correlação para seus próprios dados.

O que é um mapa de calor de correlação?
Um mapa de calor de correlação é uma grade onde linhas e colunas representam variáveis, e cada célula mostra o coeficiente de correlação de Pearson r entre esse par. As cores codificam a força e direção: cores quentes (vermelho/laranja) para correlação positiva, cores frias (azul) para negativa, e neutro (branco) para próximo de zero.
O que é Pearson r e o que seus valores significam?
Pearson r varia de -1 a +1. r = +1 é uma relação linear positiva perfeita (à medida que X aumenta, Y sempre aumenta proporcionalmente). r = -1 é uma relação inversa perfeita. r = 0 significa nenhuma relação linear — embora uma relação não linear ainda possa existir. Como guia aproximado: |r| > 0,7 = forte, 0,4–0,7 = moderada, < 0,4 = fraca.
O que significa r = 0 — significa que não há relação?
r = 0 significa nenhuma relação linear. Duas variáveis podem ter uma forte relação não linear (ex.: em forma de U) e ainda produzir r ≈ 0. Sempre combine o mapa de calor com gráficos de dispersão para verificar curvas ou agrupamentos que o Pearson r perde.
Quando devo usar um mapa de calor de correlação?
Os mapas de calor são mais úteis quando você tem 3 ou mais colunas numéricas e quer encontrar rapidamente quais pares vale a pena investigar mais. Eles são um primeiro passo padrão na análise exploratória de dados (EDA) antes de construir modelos de regressão — ajudam a identificar multicolinearidade e preditores interessantes.
Correlação significa causalidade?
Não. Uma alta correlação entre duas variáveis significa apenas que elas se movem juntas neste conjunto de dados — não que uma cause a outra. Vendas de sorvete e taxas de queimadura solar são altamente correlacionadas (ambas atingem pico no verão), mas nenhuma causa a outra. Estabelecer causalidade requer experimentos controlados ou métodos cuidadosos de inferência causal.
Por que a diagonal é sempre 1,0?
A diagonal de uma matriz de correlação mostra a correlação de cada variável consigo mesma, que é sempre um +1 perfeito. Isso é esperado e normal — apenas confirma que a matriz está correta.