p-Wert-Rechner

Statistische Signifikanz berechnen und Ablehnungsbereiche auf der Verteilung visualisieren

Der p-Wert ist die Wahrscheinlichkeit, eine Teststatistik zu erhalten, die so extrem ist wie die beobachtete — oder extremer — unter der Annahme, dass die Nullhypothese wahr ist. Ein kleiner p-Wert bedeutet, dass die Daten unter H₀ unwahrscheinlich sind, und gibt dir Grund, sie abzulehnen.

Der häufigste Schwellenwert ist α = 0,05: Wenn p < 0,05, wird das Ergebnis als statistisch signifikant auf dem 95-%-Konfidenzniveau bezeichnet. Strengere Fachgebiete verwenden α = 0,01 oder sogar 0,001. Der p-Wert sagt dir nicht, wie wahrscheinlich H₀ wahr ist — er misst nur, wie überraschend die Daten unter dieser Annahme sind.

Dieser Rechner unterstützt z-Tests, t-Tests, Chi-Quadrat-Tests und F-Tests. Gib deine Teststatistik und Freiheitsgrade ein (falls erforderlich) und die KI berechnet den p-Wert, schattiert den Ablehnungsbereich auf der Verteilungskurve und erklärt, ob H₀ abzulehnen ist.

Was ist ein p-Wert?
Der p-Wert ist die Wahrscheinlichkeit, eine Teststatistik zu beobachten, die so extrem ist wie die aus deiner Stichprobe berechnete, unter der Annahme, dass die Nullhypothese (H₀) wahr ist. Ein sehr kleiner p-Wert bedeutet, dass das beobachtete Ergebnis sehr unwahrscheinlich wäre, wenn H₀ wahr wäre — was als Beleg gegen H₀ gilt. Es ist nicht die Wahrscheinlichkeit, dass H₀ wahr oder falsch ist.
Was bedeutet p < 0,05?
Wenn p < 0,05, besteht eine weniger als 5-prozentige Wahrscheinlichkeit, dass das beobachtete Ergebnis allein durch Zufall unter H₀ aufgetreten ist. Konventionell wird dies als statistisch signifikant bezeichnet. Signifikanz bedeutet jedoch keine praktische Bedeutsamkeit — eine große Stichprobe kann einen winzigen Effekt statistisch signifikant machen. Berichte immer die Effektgröße neben dem p-Wert.
Was ist der Unterschied zwischen einem ein- und zweiseitigen Test?
Ein zweiseitiger Test prüft auf einen Unterschied in beide Richtungen (H₁: μ ≠ μ₀) und verteilt α auf beide Seiten. Ein einseitiger Test prüft auf eine bestimmte Richtung (H₁: μ > μ₀ oder μ < μ₀) und legt das gesamte α in eine Seite. Verwende einseitige Tests nur, wenn du vor der Datenerhebung eine gerichtete Hypothese hattest; sonst verwende zweiseitige Tests, um eine künstliche Erhöhung der Teststärke zu vermeiden.
Welche Signifikanzniveaus sind üblich?
Das am weitesten verbreitete Niveau ist α = 0,05 (5 %). Strengere Standards sind α = 0,01 (1 %), verwendet in der medizinischen Forschung, und α = 0,001 (0,1 %), verwendet in der Teilchenphysik (der „Fünf-Sigma"-Standard). Die Wahl von α sollte vor der Datenerhebung basierend auf den Kosten von Typ-I-Fehlern (falsche Positive) in deinem Fachgebiet getroffen werden.
Wie interpretiere ich den Ablehnungsbereich?
Der Ablehnungsbereich ist die Menge der Teststatistikwerte, die dazu führen würden, H₀ abzulehnen. Er entspricht den extremsten Werten unter der Nullverteilung — den schraffierten Schwänzen. Wenn deine beobachtete Teststatistik in den Ablehnungsbereich fällt (gleichwertig: wenn p < α), lehnst du H₀ ab. Die KI zeigt diesen Bereich auf der Verteilung, damit du genau sehen kannst, wo deine Statistik liegt.
Was ist der Unterschied zwischen einem p-Wert und einem Konfidenzintervall?
Ein p-Wert liefert eine binäre Entscheidungshilfe: H₀ ablehnen oder nicht ablehnen. Ein Konfidenzintervall (KI) liefert einen Bereich plausibler Werte für den Parameter und enthält mehr Information. Sie sind mathematisch verknüpft: Ein 95-%-KI für einen Parameter schließt den Nullwert genau dann aus, wenn der zweiseitige p-Wert < 0,05. Die meisten Statistiker empfehlen, beides zu berichten.