Streuung vs. Schiefe
In der Statistik und Wahrscheinlichkeitstheorie muss die Streuung der Verteilungen zu Vergleichszwecken oft quantitativ ausgedrückt werden. Dispersion und Schiefe sind zwei statistische Konzepte, bei denen die Form der Verteilung in einer quantitativen Skala dargestellt wird.
Mehr über Dispersion
In der Statistik ist die Streuung die Streuung einer Zufallsvariablen oder ihrer Wahrscheinlichkeitsverteilung. Er ist ein Maß dafür, wie weit die Datenpunkte vom zentralen Wert entfernt liegen. Um dies quantitativ auszudrücken, werden Streuungsmaße in der deskriptiven Statistik verwendet.
Varianz, Standardabweichung und Quartilabstand sind die am häufigsten verwendeten Streuungsmaße.
Wenn die Datenwerte aufgrund der Skalierung eine bestimmte Einheit haben, können auch die Streuungsmaße die gleichen Einheiten haben. Interdezilbereich, Bereich, mittlere Differenz, mittlere absolute Abweichung, durchschnittliche absolute Abweichung und Entfernungsstandardabweichung sind Streuungsmaße mit Einheiten.
Im Gegensatz dazu gibt es Streuungsmaße, die keine Einheiten haben, also dimensionslos sind. Varianz, Variationskoeffizient, Quartil-Streuungskoeffizient und relative mittlere Differenz sind Streuungsmaße ohne Einheiten.
Die Streuung in einem System kann durch Fehler verursacht werden, wie zum Beispiel durch Instrumenten- und Beobachtungsfehler. Auch zufällige Variationen in der Probe selbst können Variationen verursachen. Es ist wichtig, eine quantitative Vorstellung von der Variation der Daten zu haben, bevor andere Schlussfolgerungen aus dem Datensatz gezogen werden.
Mehr über Schiefe
In der Statistik ist die Schiefe ein Maß für die Asymmetrie der Wahrscheinlichkeitsverteilungen. Die Schiefe kann positiv oder negativ sein oder in einigen Fällen nicht vorhanden sein. Sie kann auch als Maß für die Abweichung von der Normalverteilung betrachtet werden.
Wenn die Schiefe positiv ist, dann ist der Großteil der Datenpunkte links von der Kurve zentriert und das rechte Ende ist länger. Wenn die Schiefe negativ ist, ist der Großteil der Datenpunkte rechts von der Kurve zentriert und der linke Schwanz ist ziemlich lang. Wenn die Schiefe null ist, dann ist die Grundgesamtheit normalverteilt.
Bei einer Normalverteilung, also bei einer symmetrischen Kurve, haben Mittelwert, Median und Modus den gleichen Wert. Wenn die Schiefe nicht Null ist, gilt diese Eigenschaft nicht, und Mittelwert, Modus und Median können unterschiedliche Werte haben.
Pearsons erster und zweiter Schiefekoeffizient werden üblicherweise zur Bestimmung der Schiefe der Verteilungen verwendet.
Pearson’s first schiefness coffeicent=(Mittelwert – Modus) / (Standardabweichung)
Pearson’s Second Schiefe coffeicent=3(Mittelwert – Modus) / (Standardabweichung)
In sensibleren Fällen wird der angepasste standardisierte Fisher-Pearson-Momentenkoeffizient verwendet.
G={n / (n-1)(n-2)} ∑i=1 ((y-ӯ)/s)3
Was ist der Unterschied zwischen Dispersion und Schiefe?
Die Streuung betrifft den Bereich, über den die Datenpunkte verteilt sind, und die Schiefe betrifft die Symmetrie der Verteilung.
Beide Maße für Dispersion und Schiefe sind beschreibende Maße und der Schiefekoeffizient gibt einen Hinweis auf die Form der Verteilung.
Streuungsmaße werden verwendet, um den Bereich der Datenpunkte und den Offset vom Mittelwert zu verstehen, während die Schiefe verwendet wird, um die Tendenz zur Variation von Datenpunkten in eine bestimmte Richtung zu verstehen.