Abweichung vs. Standardabweichung
Abweichung vs. Standardabweichung
In der deskriptiven und schließenden Statistik werden mehrere Indizes verwendet, um einen Datensatz entsprechend seiner zentralen Tendenz, Streuung und Schiefe zu beschreiben. In der statistischen Inferenz werden diese allgemein als Schätzer bezeichnet, da sie die Parameterwerte der Population schätzen.
Streuung ist das Maß für die Streuung von Daten um das Zentrum des Datensatzes. Die Standardabweichung ist eines der am häufigsten verwendeten Streuungsmaße. Die Abweichungen jedes Datenpunkts vom Mittelwert werden bei der Berechnung der Standardabweichung berücksichtigt. Daher kann man argumentieren, dass die Standardabweichung zusammen mit dem Mittelwert ein fast ausreichendes Bild über einen Datensatz liefert.
Betrachten Sie den folgenden Datensatz. Die Gewichte von 10 Personen (in Kilogramm) werden mit 70, 62, 65, 72, 80, 70, 63, 72, 77 und 79 gemessen. Dann beträgt das Durchschnittsgewicht der zehn Personen (in Kilogramm) 71 (in Kilogramm).
Was ist Abweichung?
In der Statistik bezeichnet Abweichung den Betrag, um den ein einzelner Datenpunkt von einem festen Wert wie dem Mittelwert abweicht. Im Allgemeinen sei k ein fester Wert und x1, x2, …, xn bezeichnen Daten einstellen. Dann ist die Abweichung von xj von k definiert als (xj– k).
Beispielsweise sind im obigen Datensatz die jeweiligen Abweichungen vom Mittelwert (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 und (79 – 71)=8.
Was ist die Standardabweichung?
Wenn Daten der gesamten Bevölkerung berücksichtigt werden können (z. B. bei einer Volkszählung), ist es möglich, die Standardabweichung der Bevölkerung zu berechnen. Um die Standardabweichung der Grundgesamtheit zu berechnen, werden zunächst die Abweichungen der Datenwerte vom Mittelwert der Grundgesamtheit berechnet. Der quadratische Mittelwert der Abweichungen wird als Grundgesamtheits-Standardabweichung bezeichnet. In Symbolen ist σ=√{ ∑(xi-µ)2 / n} wobei µ der Populationsmittelwert und n die Populationsgröße ist.
Wenn Daten aus einer Stichprobe (der Größe n) verwendet werden, um Parameter der Grundgesamtheit zu schätzen, wird die Standardabweichung der Stichprobe berechnet. Zunächst werden die Abweichungen der Datenwerte vom Stichprobenmittelwert berechnet. Da der Mittelwert der Stichprobe anstelle des Mittelwerts der Grundgesamtheit (der unbekannt ist) verwendet wird, ist die Verwendung des quadratischen Mittelwerts nicht angemessen. Um die Verwendung des Stichprobenmittelwerts zu kompensieren, wird die Summe der Abweichungsquadrate durch (n-1) statt durch n dividiert. Die Stichproben-Standardabweichung ist die Quadratwurzel davon. In mathematischen Symbolen ist S=√{ ∑(xi-ẍ)2 / (n-1)}, wobei S die Standardabweichung der Stichprobe ist, ẍ ist der Stichprobenmittelwert und xi sind die Datenpunkte.
Im vorherigen Datensatz ist die Summe der Abweichungsquadrate (-1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1) 2 + (-8)2 + 12 + 62 + 82=366. Somit beträgt die Populationsstandardabweichung √(366/10)=6,05 (in Kilogramm). (Angenommen, die betrachtete Population besteht aus den 10 Personen, von denen die Daten stammen).
Was ist der Unterschied zwischen Abweichung und Standardabweichung?
• Die Standardabweichung ist ein statistischer Index und ein Schätzwert, die Abweichung jedoch nicht.
• Die Standardabweichung ist ein Maß für die Streuung eines Datenclusters von der Mitte, während sich die Abweichung auf den Betrag bezieht, um den ein einzelner Datenpunkt von einem festen Wert abweicht.