Unterschied zwischen linearer und logistischer Regression

Unterschied zwischen linearer und logistischer Regression
Unterschied zwischen linearer und logistischer Regression

Video: Unterschied zwischen linearer und logistischer Regression

Video: Unterschied zwischen linearer und logistischer Regression
Video: ORDINALzahlen vs. KARDINALzahlen - DaF: A1, A2, B1, B2 - 2024, November
Anonim

Lineare vs. logistische Regression

In der statistischen Analyse ist es wichtig, die Beziehungen zwischen den betroffenen Variablen und der Studie zu identifizieren. Manchmal kann es der einzige Zweck der Analyse selbst sein. Ein starkes Werkzeug, das verwendet wird, um das Bestehen einer Beziehung festzustellen und die Beziehung zu identifizieren, ist die Regressionsanalyse.

Die einfachste Form der Regressionsanalyse ist die lineare Regression, bei der die Beziehung zwischen den Variablen eine lineare Beziehung ist. Statistisch gesehen stellt es die Beziehung zwischen der erklärenden Variable und der Antwortvariablen heraus. Mittels Regression können wir zum Beispiel den Zusammenhang zwischen dem Rohstoffpreis und dem Verbrauch anhand von Daten aus einer Stichprobe herstellen. Die Regressionsanalyse erzeugt eine Regressionsfunktion des Datensatzes, bei dem es sich um ein mathematisches Modell handelt, das am besten zu den verfügbaren Daten passt. Dies kann leicht durch ein Streudiagramm dargestellt werden. Die grafische Regression entspricht dem Finden der am besten passenden Kurve für den gegebenen Datensatz. Die Funktion der Kurve ist die Regressionsfunktion. Mit Hilfe des mathematischen Modells kann der Verbrauch eines Rohstoffs zu einem gegebenen Preis vorhergesagt werden.

Deshalb wird die Regressionsanalyse häufig zur Vorhersage und Vorhersage verwendet. Es wird auch verwendet, um die Beziehungen in experimentellen Daten herzustellen, in den Bereichen Physik, Chemie und in vielen natur- und ingenieurwissenschaftlichen Disziplinen. Wenn die Beziehung oder die Regressionsfunktion eine lineare Funktion ist, wird der Prozess als lineare Regression bezeichnet. Im Streudiagramm kann es als gerade Linie dargestellt werden. Wenn die Funktion keine lineare Kombination der Parameter ist, dann ist die Regression nichtlinear.

Die logistische Regression ist vergleichbar mit der multivariaten Regression und erstellt ein Modell, um den Einfluss mehrerer Prädiktoren auf eine Antwortvariable zu erklären. Bei der logistischen Regression sollte die Endergebnisvariable jedoch kategorial sein (normalerweise geteilt; d. h. ein Paar erreichbarer Ergebnisse wie Tod oder Überleben, obwohl spezielle Techniken die Modellierung von mehr kategorisierten Informationen ermöglichen). Eine kontinuierliche Ergebnisvariable kann in eine kategoriale Variable transformiert werden, um für die logistische Regression verwendet zu werden; Allerdings wird davon abgeraten, kontinuierliche Variablen auf diese Weise zu reduzieren, da dies die Genauigkeit verringert.

Anders als bei der linearen Regression zum Mittelwert müssen die Prädiktorvariablen bei der logistischen Regression nicht gezwungen werden, linear verbunden, gemeinsam verteilt oder innerhalb jedes Clusters die gleiche Varianz zu haben. Daher ist die Beziehung zwischen Prädiktor- und Ergebnisvariablen wahrscheinlich keine lineare Funktion.

Was ist der Unterschied zwischen der logistischen und der linearen Regression?

• Bei der linearen Regression wird eine lineare Beziehung zwischen der erklärenden Variablen und der Antwortvariablen angenommen und Parameter, die das Modell erfüllen, werden durch Analyse gefunden, um die genaue Beziehung zu erh alten.

• Für quantitative Variablen wird eine lineare Regression durchgeführt, und die resultierende Funktion ist eine quantitative.

• Bei der logistischen Regression können die verwendeten Daten entweder kategorial oder quantitativ sein, aber das Ergebnis ist immer kategorial.

Empfohlen: