当 p 具有统计显著性。但显著性并不意味着实际重要性——大样本量可以使极小的效应具有统计显著性。始终在P值旁边报告效应量。

双尾检验检验任意方向的差异（H₁: μ ≠ μ₀），将 α 分配到两个尾部。单尾检验检验特定方向（H₁: μ > μ₀ 或 μ < μ₀），将所有 α 放在一个尾部。仅当数据收集前就有方向性假设时使用单尾检验；否则使用双尾检验，以避免人为夸大检验功效。

最广泛使用的水平是 α = 0.05（5%）。更严格的标准包括医学研究使用的 α = 0.01（1%），以及粒子物理学使用的 α = 0.001（0.1%）（"五个西格玛"标准）。α 的选择应在数据收集前，根据您领域中第一类错误（假阳性）的代价来确定。

拒绝域是一组检验统计量值，落入其中将导致拒绝 H₀。它对应于零假设分布下最极端的值——阴影尾部。如果您观测到的检验统计量落在拒绝域内（等价地，如果 p < α），则拒绝 H₀。AI 将把该区域绘制在分布曲线上，让您直观地看到统计量的位置。

P值提供二元决策辅助：拒绝或不拒绝 H₀。置信区间（CI）给出参数的合理取值范围，携带更多信息。它们在数学上相互关联：当且仅当双尾 p 值 < 0.05 时，参数的 95% CI 才不包含零假设值。大多数统计学家建议同时报告两者。

Question 1

什么是P值？

Accepted Answer

P值是在原假设（H₀）为真的条件下，观察到至少与样本计算值一样极端的检验统计量的概率。P值非常小意味着如果 H₀ 为真，观测结果极不可能出现——这是反对 H₀ 的证据。它不是 H₀ 为真或为假的概率。

Question 2

p < 0.05 意味着什么？

Accepted Answer

当 p 具有统计显著性。但显著性并不意味着实际重要性——大样本量可以使极小的效应具有统计显著性。始终在P值旁边报告效应量。

Question 3

单尾检验和双尾检验有什么区别？

Accepted Answer

双尾检验检验任意方向的差异（H₁: μ ≠ μ₀），将 α 分配到两个尾部。单尾检验检验特定方向（H₁: μ > μ₀ 或 μ < μ₀），将所有 α 放在一个尾部。仅当数据收集前就有方向性假设时使用单尾检验；否则使用双尾检验，以避免人为夸大检验功效。

Question 4

常见的显著性水平有哪些？

Accepted Answer

最广泛使用的水平是 α = 0.05（5%）。更严格的标准包括医学研究使用的 α = 0.01（1%），以及粒子物理学使用的 α = 0.001（0.1%）（"五个西格玛"标准）。α 的选择应在数据收集前，根据您领域中第一类错误（假阳性）的代价来确定。

Question 5

如何解读拒绝域？

Accepted Answer

拒绝域是一组检验统计量值，落入其中将导致拒绝 H₀。它对应于零假设分布下最极端的值——阴影尾部。如果您观测到的检验统计量落在拒绝域内（等价地，如果 p < α），则拒绝 H₀。AI 将把该区域绘制在分布曲线上，让您直观地看到统计量的位置。

Question 6

P值和置信区间有什么区别？

Accepted Answer

P值提供二元决策辅助：拒绝或不拒绝 H₀。置信区间（CI）给出参数的合理取值范围，携带更多信息。它们在数学上相互关联：当且仅当双尾 p 值 < 0.05 时，参数的 95% CI 才不包含零假设值。大多数统计学家建议同时报告两者。

P值计算器