Deskriptive vs. Inferenzstatistik
Statistik ist die Disziplin der Sammlung, Analyse und Präsentation von Daten. Die Theorie der Statistik wird auf der Grundlage der Informationen, die sie durch die Analyse der Daten liefern, in zwei Zweige unterteilt.
Was ist deskriptive Statistik?
Die deskriptive Statistik ist der Zweig der Statistik, der die wesentlichen Eigenschaften eines Datensatzes quantitativ beschreibt. Um die Eigenschaften eines Datensatzes möglichst genau darzustellen, werden die Daten entweder grafisch oder numerisch zusammengefasst.
Die grafische Zusammenfassung erfolgt durch tabellarische Auflistung, Gruppierung und grafische Darstellung der Werte der interessierenden Variablen. Histogramme der Häufigkeitsverteilung und der relativen Häufigkeitsverteilung sind solche Darstellungen. Sie bilden die Verteilung der Werte in der Bevölkerung ab.
Die numerische Zusammenfassung beinh altet die Berechnung beschreibender Maße wie Durchschnitt, Modus und Mittelwert. Die beschreibenden Maße werden weiter in zwei Klassen eingeteilt; sie sind Maße der zentralen Tendenz und Maße der Streuung/Variation. Die Maße der zentralen Tendenz sind Mittelwert/Durchschnitt, Median und Modus. Jede hat ihre eigene Anwendbarkeit und Nützlichkeit. Wo einer fehlschlägt, kann der andere den Datensatz besser darstellen.
Wie der Name schon sagt, beinh alten Streuungsmaße die Messung der Verteilung der Daten. Die Spannweite, die Standardabweichung, die Varianz, die Perzentil- und Quartilbereiche und der Variationskoeffizient sind Streuungsmaße. Sie geben Aufschluss über die Verbreitung der Daten.
Ein einfaches Beispiel für die Verwendung deskriptiver Statistiken ist die Berechnung des Notendurchschnitts eines Schülers. Der GPA ist im Wesentlichen das gewichtete Mittel der Ergebnisse der Schüler und spiegelt die akademische Gesamtleistung dieses bestimmten Schülers wider.
Was ist Inferenzstatistik?
Inferenzstatistik ist der Zweig der Statistik, der Schlussfolgerungen über die betroffene Population aus dem Datensatz ableitet, der aus einer Stichprobe gewonnen wird, die Zufalls-, Beobachtungs- und Stichprobenvariationen unterzogen wurde. Im Allgemeinen werden die Ergebnisse aus einer Zufallsstichprobe der Bevölkerung gewonnen und die aus der Stichprobe abgeleiteten Schlussfolgerungen werden dann verallgemeinert, um die gesamte Bevölkerung darzustellen.
Die Stichprobe ist eine Teilmenge der Grundgesamtheit, und Maße der deskriptiven Statistik für die aus der Stichprobe gewonnenen Daten werden einfach als Statistiken bezeichnet. Die aus der Analyse der Stichprobe gewonnenen Maße der deskriptiven Statistik werden als Parameter bezeichnet, wenn sie auf die Grundgesamtheit angewendet werden, und sie repräsentieren die gesamte Grundgesamtheit.
Inferenzstatistik konzentriert sich darauf, wie die aus einer Stichprobe gewonnenen Statistiken so genau wie möglich verallgemeinert werden können, um die Grundgesamtheit darzustellen. Ein besorgniserregender Faktor ist die Art der Probe. Wenn die Stichprobe verzerrt ist, dann sind auch die Ergebnisse verzerrt und die darauf basierenden Parameter bilden nicht die gesamte Grundgesamtheit korrekt ab. Daher ist die Stichprobenziehung eine wichtige Studie der Inferenzstatistik. Statistische Annahmen, statistische Entscheidungstheorie und Schätztheorie, Hypothesentest, Versuchsplanung, Varianzanalyse und Regressionsanalyse sind wichtige Studienthemen in der Theorie der Inferenzstatistik.
Ein gutes Beispiel für Inferenzstatistik in Aktion ist die Vorhersage des Ergebnisses einer Wahl vor der Abstimmung durch Umfragen.
Was ist der Unterschied zwischen deskriptiver und inferenzieller Statistik?
• Die deskriptive Statistik konzentriert sich auf die Zusammenfassung der aus einer Stichprobe gesammelten Daten. Die Technik erzeugt Maße der zentralen Tendenz und Streuung, die darstellen, wie die Werte der Variablen konzentriert und verteilt sind.
• Inferenzstatistik verallgemeinert die aus einer Stichprobe gewonnenen Statistiken auf die allgemeine Bevölkerung, zu der die Stichprobe gehört. Die Maße der Grundgesamtheit werden als Parameter bezeichnet.
• Die deskriptive Statistik fasst nur die Eigenschaften der Stichprobe zusammen, aus der die Daten gewonnen wurden, aber in der Inferenzstatistik wird das Maß der Stichprobe verwendet, um auf Eigenschaften der Grundgesamtheit zu schließen.
• In der Inferenzstatistik wurden die Parameter aus einer Stichprobe gewonnen, aber nicht aus der gesamten Grundgesamtheit; Daher besteht immer eine gewisse Unsicherheit im Vergleich zu den realen Werten.