分布フィッティング

データに最も適した確率分布を見つける——どの程度適合しているかを確認

分布フィッティングは「私のデータはどのような確率過程から生成されたか?」という 問いに答えます。正規分布(ベルカーブ)でしょうか?指数分布(記憶のない減衰)でしょうか? 一様分布(等確率の結果)でしょうか?分布がわかると強力な確率計算が可能になります—— 「X を超える値はどの割合か?」や「95パーセンタイルは何か?」といった問いに答えられます。

このツールには近似正規分布から抽出した身長60件の測定値が読み込まれています。 データをリンクをクリックすると、AIが3つの候補分布を当てはめ、ヒストグラムに 最適カーブを重ね、どの分布が最も適合するか(μ、σなど)を報告します。

独自の数値列CSVを貼り付けてデータに分布を当てはめることもできます。

正規分布とは何ですか?
正規分布(ベルカーブ)は自然界で最も一般的な分布です。平均μ(中心)と標準偏差σ(幅)の2つのパラメータで完全に記述されます。身長・体重・テスト点数など多くの自然な測定値は近似的に正規分布に従います。
適合度とは何ですか?
適合度は理論的な分布が観測データにどの程度一致するかを測ります。一般的な検定にはコルモゴロフ-スミルノフ(K-S)検定やカイ二乗検定があります。K-S統計量が小さいほど(またはp値が大きいほど)適合度が良いことを意味します。
当てはめた分布を予測に使うには?
分布とそのパラメータがわかれば確率問題に答えられます。μ = 170、σ = 8の正規分布の場合:「180cmより背の高い人の割合は?」= P(X > 180) = P(Z > (180−170)/8) = P(Z > 1.25) ≈ 10.6%。
どの分布も適合しない場合は?
データが二峰性(2つのピーク)、歪んでいる、または有界の場合、3つの基本分布のどれも適合しない可能性があります。その場合は、データの変換(例:右歪みデータへの対数変換)やノンパラメトリック手法を検討してください。AIは不良な適合にフラグを立てて代替案を提案します。