p値計算機

統計的有意性を計算し、分布上の棄却域を可視化

p値は帰無仮説が真であると仮定した場合に、観測されたほど極端な 検定統計量が得られる確率です。小さいp値はデータがH₀の下で起こりにくいことを意味し、 H₀を棄却する根拠を与えます。

最も一般的な閾値はα = 0.05です:p < 0.05なら結果は95%信頼水準で 統計的に有意と呼ばれます。厳格な分野ではα = 0.01やα = 0.001を使います。 p値はH₀が真である確率を教えません——その仮定の下でデータがどれほど 驚くべきかを測るだけです。

この計算機はz検定・t検定・カイ二乗検定・F検定をサポートします。 検定統計量と自由度(必要な場合)を入力すると、AIがp値を計算し、分布曲線上に 棄却域を陰影付けして、H₀を棄却すべきかを説明します。

p値とは何ですか?
p値は帰無仮説(H₀)が真であると仮定した場合に、標本から計算された検定統計量と同じかそれ以上に極端な結果を観測する確率です。非常に小さいp値は、H₀が真であればその観測結果は非常にあり得ないことを意味し、H₀に対する証拠となります。H₀が真か偽かの確率ではありません。
p < 0.05とはどういう意味ですか?
p < 0.05のとき、H₀の下で観測された結果がランダムな偶然だけで起こる確率が5%未満であることを意味します。慣例的にこれは統計的に有意と呼ばれます。ただし有意性は実際の重要性を意味しません——大きな標本は小さな効果を統計的に有意にすることがあります。常にp値とともに効果量を報告してください。
片側検定と両側検定の違いは何ですか?
両側検定はいずれかの方向の差を検定します(H₁: μ ≠ μ₀)、αを両側のテールに分割します。片側検定は特定の方向を検定します(H₁: μ > μ₀またはμ < μ₀)、αをすべて1つのテールに配置します。データ収集前に方向性の仮説があった場合のみ片側を使い、そうでなければ人工的に検出力を高めないよう両側を使います。
一般的な有意水準は何ですか?
最も広く使われる水準はα = 0.05(5%)です。より厳格な基準としては医学研究で使われるα = 0.01(1%)、素粒子物理学で使われるα = 0.001(0.1%)(「5σ」基準)があります。αの選択はフィールドでのI型エラー(偽陽性)のコストに基づいてデータ収集前に行うべきです。
棄却域をどう解釈しますか?
棄却域はH₀を棄却することになる検定統計量の値の集合です。帰無分布の下で最も極端な値——陰影付きのテール——に対応します。観測された検定統計量が棄却域に入れば(同等に、p < αであれば)、H₀を棄却します。AIはこの領域を分布上にプロットするので、統計量がどこに位置するかが正確にわかります。
p値と信頼区間の違いは何ですか?
p値は二値的な意思決定補助ツールです:H₀を棄却するかできないかを判定します。信頼区間(CI)はパラメータの妥当な値の範囲を与え、より多くの情報を持ちます。両者は数学的に結びついています:パラメータの95%CIが帰無値を除外するのは両側p値 < 0.05のときに限られます。ほとんどの統計学者は両方を報告することを推奨します。