Verteilungsanpassung

Finde heraus, welche Wahrscheinlichkeitsverteilung am besten zu deinen Daten passt — und wie gut sie passt

Verteilungsanpassung beantwortet die Frage: Welcher Typ von Zufallsprozess hat meine Daten erzeugt? Sind sie normalverteilt (Glockenkurve)? Exponentialverteilt (gedächtnisloser Zerfall)? Gleichverteilt (gleich wahrscheinliche Ergebnisse)? Das Kennen der Verteilung ermöglicht leistungsstarke Wahrscheinlichkeitsberechnungen — „welcher Anteil der Werte übersteigt X?" oder „was ist das 95. Perzentil?"

Dieses Tool lädt 60 Körpergröße-Messungen, die aus einer nahezu normalverteilten Verteilung stammen. Klicke auf Daten verknüpfen und die KI passt drei Kandidatenverteilungen an, legt die beste Kurve über das Histogramm und berichtet, welche Verteilung mit ihren Parametern gewinnt (μ, σ für Normal).

Füge deine eigene CSV mit einer numerischen Spalte ein, um eine Verteilung an deine Daten anzupassen.

Was ist eine Normalverteilung?
Die Normalverteilung (Glockenkurve) ist die häufigste Verteilung in der Natur. Sie wird vollständig durch zwei Parameter beschrieben: den Mittelwert μ (Zentrum) und die Standardabweichung σ (Breite). Viele natürliche Messungen — Körpergrößen, Gewichte, Testergebnisse — sind annähernd normalverteilt.
Was ist Anpassungsgüte?
Anpassungsgüte misst, wie gut eine theoretische Verteilung zu den beobachteten Daten passt. Gebräuchliche Tests sind der Kolmogorov-Smirnov-Test (K-S) und der Chi-Quadrat-Test. Eine niedrigere K-S-Statistik (oder höherer p-Wert) bedeutet eine bessere Anpassung.
Wie verwende ich die angepasste Verteilung für Vorhersagen?
Sobald du die Verteilung und ihre Parameter kennst, kannst du Wahrscheinlichkeitsfragen beantworten. Für eine Normalverteilung mit μ = 170 und σ = 8: „Welcher Anteil der Menschen ist größer als 180 cm?" = P(X > 180) = P(Z > (180−170)/8) = P(Z > 1,25) ≈ 10,6 %.
Was, wenn keine der Verteilungen gut passt?
Wenn die Daten bimodal (zwei Gipfel), schief oder begrenzt sind, passen möglicherweise keine der drei Basisverteilungen. In diesem Fall empfiehlt sich eine Datentransformation (z. B. Log-Transformation für rechtsschiefe Daten) oder ein nicht-parametrischer Ansatz. Die KI weist auf schlechte Anpassungen hin und schlägt Alternativen vor.