p 值計算器

計算統計顯著性並在分布上視覺化拒絕域

p 值是在虛無假設為真的前提下,觀測到與所得結果一樣極端 或更極端的檢定統計量的機率。p 值小表示資料在 H₀ 下不太可能出現, 給您理由拒絕它。

最常見的門檻是 α = 0.05:如果 p < 0.05,則結果在 95% 信賴水準下 被稱為統計顯著。較嚴格的領域使用 α = 0.01 或甚至 0.001。 p 值並不告訴您 H₀ 為真的機率——它只衡量在該假設下資料有多令人驚訝。

此計算器支援 z 檢定、t 檢定、卡方檢定和 F 檢定。 輸入您的檢定統計量和自由度(如有需要),AI 將計算 p 值, 在分布曲線上為拒絕域加上陰影,並解釋是否應拒絕 H₀。

什麼是 p 值?
p 值是在虛無假設(H₀)為真的前提下,觀測到與您樣本計算結果一樣極端的檢定統計量的機率。p 值非常小表示如果 H₀ 為真,觀測到的結果極不可能出現——這是反對 H₀ 的證據。它不是 H₀ 為真或假的機率。
p < 0.05 是什麼意思?
當 p < 0.05 時,在 H₀ 下,觀測到的結果僅由隨機機會造成的機率不到 5%。按照慣例,這被稱為統計顯著。然而,顯著性並不意味著實際重要性——大樣本可以使微小效應具有統計顯著性。務必同時報告效應量和 p 值。
單尾檢定和雙尾檢定有什麼區別?
雙尾檢定檢驗任意方向的差異(H₁: μ ≠ μ₀),並將 α 分配到兩端。單尾檢定檢驗特定方向(H₁: μ > μ₀ 或 μ < μ₀),將所有 α 放在一端。只有在收集資料前已有方向性假設時才使用單尾檢定;否則使用雙尾檢定以避免人為提高檢定力。
常見的顯著水準有哪些?
最廣泛使用的水準是 α = 0.05(5%)。較嚴格的標準包括醫學研究使用的 α = 0.01(1%),以及粒子物理學使用的 α = 0.001(0.1%)(「五個 sigma」標準)。α 的選擇應在資料收集前根據您領域中型一錯誤(假陽性)的代價來決定。
如何解讀拒絕域?
拒絕域是一組會讓您拒絕 H₀ 的檢定統計量值。它對應於虛無分布下最極端的值——即陰影尾部。如果您觀測到的檢定統計量落在拒絕域內(等效地,如果 p < α),則拒絕 H₀。AI 在分布圖上繪製此區域,讓您清楚看到您的統計量落在哪裡。
p 值和信賴區間有什麼區別?
p 值提供決策輔助:拒絕或不拒絕 H₀。信賴區間(CI)給出參數的合理值範圍,攜帶更多資訊。它們在數學上相互關聯:參數的 95% CI 排除虛無值,當且僅當雙尾 p 值 < 0.05。大多數統計學家建議同時報告兩者。