P值计算器

计算统计显著性,并在分布曲线上可视化拒绝域

P值是在原假设为真的前提下,观察到的检验统计量至少像观测值一样极端 的概率。P值越小,意味着在 H₀ 下数据越不可能出现,给您拒绝 H₀ 的理由。

最常用的阈值是 α = 0.05:如果 p < 0.05,则结果在 95% 置信水平下被称为 具有统计显著性。更严格的领域使用 α = 0.01 甚至 0.001。P值告诉您 H₀ 为真的概率—— 它只衡量在该假设下数据出现的可能性。

本计算器支持 z 检验、t 检验、卡方检验和 F 检验。 输入您的检验统计量和自由度(如需),AI 将计算 P 值,在分布曲线上对拒绝域进行阴影处理, 并解释是否应拒绝 H₀。

什么是P值?
P值是在原假设(H₀)为真的条件下,观察到至少与样本计算值一样极端的检验统计量的概率。P值非常小意味着如果 H₀ 为真,观测结果极不可能出现——这是反对 H₀ 的证据。它不是 H₀ 为真或为假的概率。
p < 0.05 意味着什么?
当 p < 0.05 时,在 H₀ 下,观测结果仅由随机机会产生的概率不足 5%。按照惯例,这被称为具有统计显著性。但显著性并不意味着实际重要性——大样本量可以使极小的效应具有统计显著性。始终在P值旁边报告效应量。
单尾检验和双尾检验有什么区别?
双尾检验检验任意方向的差异(H₁: μ ≠ μ₀),将 α 分配到两个尾部。单尾检验检验特定方向(H₁: μ > μ₀ 或 μ < μ₀),将所有 α 放在一个尾部。仅当数据收集前就有方向性假设时使用单尾检验;否则使用双尾检验,以避免人为夸大检验功效。
常见的显著性水平有哪些?
最广泛使用的水平是 α = 0.05(5%)。更严格的标准包括医学研究使用的 α = 0.01(1%),以及粒子物理学使用的 α = 0.001(0.1%)("五个西格玛"标准)。α 的选择应在数据收集前,根据您领域中第一类错误(假阳性)的代价来确定。
如何解读拒绝域?
拒绝域是一组检验统计量值,落入其中将导致拒绝 H₀。它对应于零假设分布下最极端的值——阴影尾部。如果您观测到的检验统计量落在拒绝域内(等价地,如果 p < α),则拒绝 H₀。AI 将把该区域绘制在分布曲线上,让您直观地看到统计量的位置。
P值和置信区间有什么区别?
P值提供二元决策辅助:拒绝或不拒绝 H₀。置信区间(CI)给出参数的合理取值范围,携带更多信息。它们在数学上相互关联:当且仅当双尾 p 值 < 0.05 时,参数的 95% CI 才不包含零假设值。大多数统计学家建议同时报告两者。