상자 그림 도구

데이터의 분산, 사분위수, 이상치를 시각화 — 여러 그룹을 한눈에 비교

상자수염도는 다섯 가지 핵심 통계량을 하나의 간결한 그림으로 담아냅니다: 최솟값, 제1사분위수(Q1), 중앙값, 제3사분위수(Q3), 최댓값. 상자는 사분위수 범위(IQR = Q3 − Q1)를 나타내며, 수염 너머의 점은 이상치입니다.

이 도구는 네 개의 서로 다른 학급에서 얻은 시험 점수 40개를 불러옵니다. 데이터 연결을 클릭하면 네 학급을 한꺼번에 비교하는 그룹 상자 그림이 그려집니다. 어느 학급의 중앙값이 높은지, 어느 학급의 점수 분산이 큰지 바로 확인할 수 있습니다.

숫자 열과 선택적 그룹 열이 있는 CSV를 붙여넣어 직접 데이터를 분석해 보세요.

상자 그림의 각 부분은 무엇을 의미하나요?
상자는 Q1에서 Q3까지(데이터의 중간 50%)를 나타냅니다. 안쪽 선은 중앙값입니다. 수염은 상자 끝에서 1.5×IQR 이내의 가장 극단적인 값까지 뻗어 있습니다. 수염 너머의 점은 이상치입니다.
IQR이란 무엇인가요?
IQR(사분위수 범위) = Q3 − Q1. 데이터 중간 50%의 분산을 측정하며, 이상치에 강건합니다. IQR이 크면 변동성이 높고, IQR이 작으면 데이터가 중앙값 주변에 빽빽이 모여 있습니다.
상자 그림으로 이상치를 어떻게 찾나요?
Q1 − 1.5×IQR보다 낮거나 Q3 + 1.5×IQR보다 높은 점은 이상치로 표시되어 수염 너머에 개별 점으로 그려집니다. 이 값들은 자세히 살펴볼 필요가 있습니다 — 데이터 입력 오류일 수도 있고 진짜 극단적인 사례일 수도 있습니다.
히스토그램보다 상자 그림이 더 유용한 경우는 언제인가요?
상자 그림은 여러 그룹을 나란히 비교할 때 빛을 발합니다 — 그룹마다 상자 하나씩으로 중앙값과 분산을 즉시 시각적으로 비교할 수 있습니다. 히스토그램은 단일 분포의 전체적인 모양을 파악하는 데 더 적합합니다.