분포 적합

데이터에 가장 적합한 확률 분포를 찾고 얼마나 잘 맞는지 확인하세요

분포 적합은 "내 데이터를 생성한 무작위 과정은 어떤 유형인가?"라는 질문에 답합니다. 정규 분포(종형 곡선)인가요? 지수 분포(기억 없는 감쇠)인가요? 균등 분포(동등하게 가능한 결과)인가요? 분포를 알면 강력한 확률 계산이 가능해집니다 — "X를 초과하는 값의 비율은 얼마인가?" 또는 "95번째 백분위수는 얼마인가?"

이 도구는 거의 정규 분포에서 추출한 키 측정값 60개를 불러옵니다. 데이터 연결을 클릭하면 AI가 세 가지 후보 분포를 적합하고, 히스토그램에 최적 곡선을 오버레이하며, 어떤 분포가 최적인지 매개변수(정규의 경우 μ, σ)와 함께 보고합니다.

직접 숫자 열 CSV를 붙여넣어 데이터에 분포를 적합해 보세요.

정규분포란 무엇인가요?
정규분포(종형 곡선)는 자연에서 가장 흔한 분포입니다. 두 매개변수로 완전히 설명됩니다: 평균 μ(중심)와 표준편차 σ(너비). 키, 몸무게, 시험 점수 등 많은 자연 측정값은 대략 정규 분포를 따릅니다.
적합도란 무엇인가요?
적합도는 이론적 분포가 관측 데이터와 얼마나 잘 맞는지를 측정합니다. 일반적인 검정으로는 콜모고로프-스미르노프(K-S) 검정과 카이제곱 검정이 있습니다. K-S 통계량이 낮을수록(또는 p-값이 높을수록) 더 좋은 적합입니다.
적합된 분포를 예측에 어떻게 활용하나요?
분포와 그 매개변수를 알면 확률 질문에 답할 수 있습니다. μ = 170, σ = 8인 정규분포의 경우: "180 cm보다 키가 큰 사람의 비율은?" = P(X > 180) = P(Z > (180−170)/8) = P(Z > 1.25) ≈ 10.6%.
어떤 분포도 잘 맞지 않으면 어떻게 하나요?
데이터가 이중 봉우리(두 개의 최빈값), 비대칭, 또는 유계를 갖는다면 세 가지 기본 분포 중 어느 것도 맞지 않을 수 있습니다. 데이터를 변환하거나(예: 오른쪽으로 치우친 데이터에 로그 변환) 비모수 접근법을 사용하는 것을 고려하세요. AI가 부적합을 표시하고 대안을 제안합니다.