Standardabweichung vs. Mittelwert
In der deskriptiven und schließenden Statistik werden mehrere Indizes verwendet, um einen Datensatz entsprechend seiner zentralen Tendenz, Streuung und Schiefe zu beschreiben. In der statistischen Inferenz werden diese allgemein als Schätzer bezeichnet, da sie die Parameterwerte der Population schätzen.
Zentrale Tendenz bezeichnet und lokalisiert das Zentrum der Werteverteilung. Mittelwert, Modus und Median sind die am häufigsten verwendeten Indizes zur Beschreibung der zentralen Tendenz eines Datensatzes. Streuung ist die Menge der Streuung von Daten vom Zentrum der Verteilung. Bereich und Standardabweichung sind die am häufigsten verwendeten Streuungsmaße. Die Schiefekoeffizienten nach Pearson werden zur Beschreibung der Schiefe einer Datenverteilung verwendet. Hier bezieht sich die Schiefe darauf, ob der Datensatz symmetrisch zum Zentrum ist oder nicht und wenn nicht, wie schief er ist.
Was ist gemein?
Mittelwert ist der am häufigsten verwendete Index der zentralen Tendenz. Bei einem gegebenen Datensatz wird der Mittelwert berechnet, indem die Summe aller Datenwerte genommen und dann durch die Anzahl der Daten dividiert wird. Zum Beispiel werden die Gewichte von 10 Personen (in Kilogramm) mit 70, 62, 65, 72, 80, 70, 63, 72, 77 und 79 gemessen. Dann kann das mittlere Gewicht der zehn Personen (in Kilogramm) sein wie folgt berechnet. Die Summe der Gewichte ist 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. Mittelwert=(Summe) / (Anzahl der Daten)=710 / 10=71 (in Kilogramm).
Wie in diesem speziellen Beispiel ist der Mittelwert eines Datensatzes möglicherweise kein Datenpunkt des Datensatzes, sondern für einen bestimmten Datensatz eindeutig. Der Mittelwert hat die gleichen Einheiten wie die Originaldaten. Daher können sie auf der gleichen Achse wie die Daten markiert und in Vergleichen verwendet werden. Auch gibt es keine Vorzeichenbeschränkung für den Mittelwert eines Datensatzes. Er kann negativ, null oder positiv sein, da die Summe des Datensatzes negativ, null oder positiv sein kann.
Was ist die Standardabweichung?
Standardabweichung ist der am häufigsten verwendete Streuungsindex. Zur Berechnung der Standardabweichung werden zunächst die Abweichungen der Datenwerte vom Mittelwert berechnet. Der quadratische Mittelwert der Abweichungen wird als Standardabweichung bezeichnet.
Im vorigen Beispiel sind die jeweiligen Abweichungen vom Mittelwert (70 – 71)=-1, (62-71)=-9, (65-71)=-6, (72-71)=1, (80-71)=9, (70-71)=-1, (63-71)=-8, (72-71)=1, (77-71)=6 und (79-71)=8. Die Summe der Abweichungsquadrate ist (-1)2+ (-9)2+ (-6)2+ 1 2+92+ (-1)2+ (-8)2 + 12+ 62 + 82=366. Die Standardabweichung ist √(366/10)=6,05 (in Kilogramm). Daraus lässt sich schließen, dass der Großteil der Daten im Intervall 71±6 liegt.05, vorausgesetzt, der Datensatz ist nicht stark verzerrt, und das ist in diesem speziellen Beispiel tatsächlich so.
Da die Standardabweichung dieselben Einheiten wie die Originaldaten hat, gibt sie uns ein Maß dafür, wie stark die Daten von der Mitte abweichen; größer die Standardabweichung größer die Streuung. Außerdem ist die Standardabweichung unabhängig von der Art der Daten im Datensatz ein nicht negativer Wert.
Was ist der Unterschied zwischen Standardabweichung und Mittelwert?
• Die Standardabweichung ist ein Maß für die Streuung von der Mitte, während der Mittelwert die Position der Mitte eines Datensatzes misst.
• Die Standardabweichung ist immer ein nicht negativer Wert, aber der Mittelwert kann jeden realen Wert annehmen.