Mittelwert vs. Median vs. Modus
Mittelwert, Median und Modus sind die primären Maße der zentralen Tendenz, die in deskriptiven Statistiken verwendet werden. Sie sind völlig unterschiedlich und die Fälle, in denen sie zur Zusammenfassung der Daten verwendet werden, sind ebenfalls unterschiedlich.
Mittelwert
Das arithmetische Mittel ist die Summe der Datenwerte dividiert durch die Anzahl der Datenwerte, also
[latex]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]
Wenn die Daten aus einem Stichprobenraum stammen, wird dies als Stichprobenmittelwert ([latex]\bar{x} [/latex]) bezeichnet, was eine beschreibende Statistik der Stichprobe ist. Obwohl es sich um das am häufigsten verwendete beschreibende Maß für eine Stichprobe handelt, ist es keine robuste Statistik. Es reagiert sehr empfindlich auf Ausreißer und Schwankungen.
Betrachte zum Beispiel das Durchschnittseinkommen der Bürger einer bestimmten Stadt. Da alle Datenwerte summiert und dann geteilt werden, beeinflusst das Einkommen einer sehr wohlhabenden Person den Mittelwert erheblich. Daher sind die Mittelwerte nicht immer eine gute Darstellung der Daten.
Auch im Fall eines Wechselsignals ändert sich der Strom, der durch ein Element fließt, periodisch von der positiven Richtung in die negative Richtung und umgekehrt. Wenn wir den durchschnittlichen Strom nehmen, der in einer einzigen Periode durch das Element fließt, ergibt dies eine 0, was bedeutet, dass kein Strom durch das Element geflossen ist, was offensichtlich nicht wahr ist. Daher ist auch in diesem Fall das arithmetische Mittel kein gutes Maß.
Das arithmetische Mittel ist ein guter Indikator, wenn die Daten gleichmäßig verteilt sind. Bei einer Normalverteilung ist der Mittelwert gleich dem Modus und dem Median. Es hat auch die niedrigsten Residuen, wenn der mittlere quadratische Fehler betrachtet wird; daher das beste beschreibende Maß, wenn es erforderlich ist, einen Datensatz durch eine einzelne Zahl darzustellen.
Median
Die Werte des mittleren Datenpunktes nach Anordnung aller Datenwerte in aufsteigender Reihenfolge werden als Median des Datensatzes definiert. Median ist das 2. Quartil, 5. Dezil und 50. Perzentil.
• Wenn die Anzahl der Beobachtungen (Datenpunkte) ungerade ist, dann ist der Median die Beobachtung genau in der Mitte der geordneten Liste.
• Wenn die Anzahl der Beobachtungen (Datenpunkte) gerade ist, dann ist der Median der Mittelwert der beiden mittleren Beobachtungen in der geordneten Liste.
Median teilt die Beobachtung in zwei Gruppen; d. h. eine Gruppe (50 %) von Werten, die höher sind, und eine Gruppe (50 %) von Werten, die niedriger als der Median sind. Mediane werden speziell in schiefen Verteilungen verwendet und stellen Daten ziemlich besser dar als das arithmetische Mittel.
Modus
Mode ist die am häufigsten vorkommende Zahl in einer Reihe von Beobachtungen. Der Modus eines Datensatzes wird berechnet, indem die Häufigkeit jedes Elements innerhalb des Satzes ermittelt wird.
• Wenn kein Wert mehr als einmal vorkommt, dann hat der Datensatz keinen Modus.
• Ansonsten ist jeder Wert, der am häufigsten vorkommt, ein Modus des Datensatzes.
Mehr als 1 Modus kann in einem Satz existieren; Daher ist der Modus keine eindeutige Statistik eines Datensatzes. Bei einer gleichmäßigen Verteilung gibt es einen Modus. Der Modus einer diskreten Wahrscheinlichkeitsverteilung ist der Punkt, an dem die Wahrscheinlichkeitsmassenfunktion ihren höchsten Punkt erreicht. Wenn wir die obigen Interpretationen wiedergeben, können wir sagen, dass globale Maxima Moden sind.
Betrachten Sie die Anwendung aller drei Maßnahmen auf den folgenden Datensatz.
DATEN: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
Mittelwert=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8,12
Median=9 (13. Element)
Modus=9 (Häufigkeit von 9=5)
Was ist der Unterschied zwischen Mittelwert, Median und Modus?
• Das arithmetische Mittel ist die Summe der Werte (Beobachtungen) dividiert durch die Anzahl der Beobachtungen. Es ist keine robuste Statistik und stark abhängig von der Natur der Normalverteilung innerhalb der betrachteten Verteilung. Ein einzelner Ausreißer kann eine erhebliche Verschiebung des Mittelwerts verursachen und relativ irreführende Werte ergeben. Das Konzept kann auf geometrisches Mittel, harmonisches Mittel, gewichtetes Mittel usw. erweitert werden.
• Der Median ist der Mittelwert der Beobachtungsreihe und wird relativ weniger von Ausreißern beeinflusst. Es kann eine gute Schätzung als zusammenfassende Statistik in stark schiefen Fällen liefern.
• Modus sind die häufigsten Beobachtungswerte im Datensatz. Bei positiver Schiefe liegt der Modus links vom Median und bei negativer Schiefe rechts vom Median.
• Bei positiver Schiefe ist der Mittelwert rechts vom Median; wenn der negativ schiefe Mittelwert links vom Median liegt.
• In der Normalverteilung sind alle drei, Mittelwert, Modus und Median, gleich.