Calculadora de Estatísticas

Calcule média, mediana, desvio padrão e quartis — limpe seus dados primeiro

As estatísticas descritivas resumem um conjunto de dados com alguns números: o centro (média, mediana), a dispersão (desvio padrão, IQR) e os extremos (mínimo, máximo). Mas dados do mundo real raramente são limpos — frequentemente contêm valores ausentes codificados como -999, N/A ou outros códigos sentinela que distorceriam todos os cálculos.

Esta ferramenta carrega um conjunto de dados amostral de 30 funcionários com Nome, Idade, Salário e Departamento — incluindo alguns valores sentinela -999 na coluna Salário. Clique em Vincular Dados para ver como esses valores ruins afetam a média, depois peça à IA para limpá-los e recalcular. A diferença será dramática.

Cole seu próprio CSV para calcular estatísticas dos seus dados.

O que é um valor sentinela e por que é um problema?
Um valor sentinela é um número usado para indicar dados ausentes — comumente -999, -1 ou 9999. Se você calcular a média de uma coluna de salários que inclui -999, a média ficará completamente errada. Sempre limpe os valores sentinela antes de executar estatísticas.
Quando devo usar a mediana em vez da média?
Use a mediana quando seus dados tiverem outliers ou forem assimétricos. A mediana é o valor do meio e não é afetada por valores extremos. Para salários, preços de imóveis ou dados de renda, a mediana quase sempre fornece uma imagem melhor do valor "típico" do que a média.
O que o desvio padrão me diz?
O desvio padrão mede quão dispersos estão os dados em torno da média. Em uma distribuição normal, cerca de 68% dos valores caem dentro de ±1 desvio padrão da média, e 95% dentro de ±2. Um desvio padrão pequeno significa que os dados se concentram; um grande significa alta variabilidade.
O que é o resumo dos cinco números?
O resumo dos cinco números é: mínimo, Q1 (25º percentil), mediana (50º), Q3 (75º) e máximo. Esses cinco valores descrevem completamente a dispersão e o centro de um conjunto de dados. Eles também são os blocos de construção de um box plot.