當 p 統計顯著。然而，顯著性並不意味著實際重要性——大樣本可以使微小效應具有統計顯著性。務必同時報告效應量和 p 值。

雙尾檢定檢驗任意方向的差異（H₁: μ ≠ μ₀），並將 α 分配到兩端。單尾檢定檢驗特定方向（H₁: μ > μ₀ 或 μ < μ₀），將所有 α 放在一端。只有在收集資料前已有方向性假設時才使用單尾檢定；否則使用雙尾檢定以避免人為提高檢定力。

最廣泛使用的水準是 α = 0.05（5%）。較嚴格的標準包括醫學研究使用的 α = 0.01（1%），以及粒子物理學使用的 α = 0.001（0.1%）（「五個 sigma」標準）。α 的選擇應在資料收集前根據您領域中型一錯誤（假陽性）的代價來決定。

拒絕域是一組會讓您拒絕 H₀ 的檢定統計量值。它對應於虛無分布下最極端的值——即陰影尾部。如果您觀測到的檢定統計量落在拒絕域內（等效地，如果 p < α），則拒絕 H₀。AI 在分布圖上繪製此區域，讓您清楚看到您的統計量落在哪裡。

p 值提供決策輔助：拒絕或不拒絕 H₀。信賴區間（CI）給出參數的合理值範圍，攜帶更多資訊。它們在數學上相互關聯：參數的 95% CI 排除虛無值，當且僅當雙尾 p 值 < 0.05。大多數統計學家建議同時報告兩者。

Question 1

什麼是 p 值？

Accepted Answer

p 值是在虛無假設（H₀）為真的前提下，觀測到與您樣本計算結果一樣極端的檢定統計量的機率。p 值非常小表示如果 H₀ 為真，觀測到的結果極不可能出現——這是反對 H₀ 的證據。它不是 H₀ 為真或假的機率。

Question 2

p < 0.05 是什麼意思？

Accepted Answer

當 p 統計顯著。然而，顯著性並不意味著實際重要性——大樣本可以使微小效應具有統計顯著性。務必同時報告效應量和 p 值。

Question 3

單尾檢定和雙尾檢定有什麼區別？

Accepted Answer

雙尾檢定檢驗任意方向的差異（H₁: μ ≠ μ₀），並將 α 分配到兩端。單尾檢定檢驗特定方向（H₁: μ > μ₀ 或 μ < μ₀），將所有 α 放在一端。只有在收集資料前已有方向性假設時才使用單尾檢定；否則使用雙尾檢定以避免人為提高檢定力。

Question 4

常見的顯著水準有哪些？

Accepted Answer

最廣泛使用的水準是 α = 0.05（5%）。較嚴格的標準包括醫學研究使用的 α = 0.01（1%），以及粒子物理學使用的 α = 0.001（0.1%）（「五個 sigma」標準）。α 的選擇應在資料收集前根據您領域中型一錯誤（假陽性）的代價來決定。

Question 5

如何解讀拒絕域？

Accepted Answer

拒絕域是一組會讓您拒絕 H₀ 的檢定統計量值。它對應於虛無分布下最極端的值——即陰影尾部。如果您觀測到的檢定統計量落在拒絕域內（等效地，如果 p < α），則拒絕 H₀。AI 在分布圖上繪製此區域，讓您清楚看到您的統計量落在哪裡。

Question 6

p 值和信賴區間有什麼區別？

Accepted Answer

p 值提供決策輔助：拒絕或不拒絕 H₀。信賴區間（CI）給出參數的合理值範圍，攜帶更多資訊。它們在數學上相互關聯：參數的 95% CI 排除虛無值，當且僅當雙尾 p 值 < 0.05。大多數統計學家建議同時報告兩者。

p 值計算器