Was für ein einfaches lineares Regressionsmodell ist und wie es funktioniert

Was für ein einfaches lineares Regressionsmodell ist und wie es funktioniert

Lineare Regressionsmodelle werden verwendet, um die Beziehung zwischen zwei Variablen oder Faktoren zu zeigen oder vorherzusagen. Der vorhergesagte Faktor (der Faktor, den die Gleichung löst für) wird das genanntabhängige Variable. Die Faktoren, die verwendet werden, um den Wert der abhängigen Variablen vorherzusagen, werden als unabhängige Variablen bezeichnet.

Bei der linearen Regression besteht jede Beobachtung aus zwei Werten. Ein Wert ist für die abhängige Variable und ein Wert ist für die unabhängige Variable. In diesem einfachen Modell nähert sich eine gerade Linie der Beziehung zwischen der abhängigen Variablen und der unabhängigen Variablen.

Wenn in der Regressionsanalyse zwei oder mehr unabhängige Variablen verwendet werden, ist das Modell kein einfacher linearer. Dies wird als multiple Regression bezeichnet.

Formel für ein einfaches lineares Regressionsmodell

Die beiden Faktoren, die an einer einfachen linearen Regressionsanalyse beteiligt sind X Und y. Die Gleichung, die beschreibt, wie y bezieht sich auf X ist als die bekannt Regressionsmodell.

Das einfache lineare Regressionsmodell wird dargestellt durch:

y = β0 +β1X

Das lineare Regressionsmodell enthält einen Fehlerbegriff, der durch ε dargestellt wird. Der Fehlerbegriff wird verwendet, um die Variabilität in zu berücksichtigen y das kann nicht durch die lineare Beziehung zwischen erklärt werden X Und y. Wenn ε nicht vorhanden wäre, würde das das Wissen bedeuten X würde genügend Informationen liefern, um den Wert von zu bestimmen y.

Es gibt auch Parameter, die die untersuchte Bevölkerung darstellen. Diese Parameter des Modells werden durch dargestellt β0 Und β1.

Die einfache lineare Regressionsgleichung wird als gerade Linie drapiert, wobei:

  1. β0 ist der y-Abschnitt der Regressionslinie.
  2. β1 ist der Hang.
  3. Ε(y) ist der Mittelwert oder der erwartete Wert von y für einen bestimmten Wert von X.

Eine Regressionslinie kann eine positive lineare Beziehung, eine negative lineare Beziehung oder keine Beziehung zeigen.

  1. Keine Beziehung: Die draphierte Linie in einer einfachen linearen Regression ist flach (nicht abgerissen). Es gibt keine Beziehung zwischen den beiden Variablen.
  2. Gute Beziehung: Die Regressionslinie nimmt mit dem unteren Ende der Linie am y-Schnur (Achse) des Graphen und dem oberen Ende der Linie nach oben in das Graphenfeld weg vom X-Schnur (Achse) nach oben und des oberen Endes. Es gibt eine positive lineare Beziehung zwischen den beiden Variablen: Wenn der Wert eines der einen zunimmt, nimmt auch der Wert des anderen zu.
  3. Negative Beziehung: Die Regressionslinie steigt mit dem oberen Ende der Linie am y-Schnur (Achse) des Graphen und dem unteren Ende der Linie nach unten in das Graphenfeld in Richtung des X-Schnur (Achse) ab. Es gibt eine negative lineare Beziehung zwischen den beiden Variablen: Wenn der Wert eines der einen zunimmt, nimmt der Wert der anderen ab.

Die geschätzte lineare Regressionsgleichung

Wenn die Parameter der Bevölkerung bekannt waren, könnte die einfache lineare Regressionsgleichung (siehe unten) verwendet werden, um den Mittelwert von zu berechnen y für einen bekannten Wert von X.

Ε(y) = β0 +β1X

In der Praxis sind jedoch Parameterwerte im Allgemeinen nicht bekannt, daher müssen sie durch Verwendung von Daten aus einer Stichprobe der Bevölkerung geschätzt werden. Die Populationsparameter werden unter Verwendung von Stichprobenstatistiken geschätzt. Die Stichprobenstatistiken werden durch dargestellt β0 Und β1. Wenn die Stichprobenstatistiken durch die Populationsparameter ersetzt werden, wird die geschätzte Regressionsgleichung gebildet.

Die geschätzte Regressionsgleichung lautet:

(ŷ) = β0 +β1X

Notiz: (ŷ) wird ausgesprochen y Hut.

Die Grafik der geschätzten einfachen Regressionsgleichung wird als geschätzte Regressionslinie bezeichnet.

  1. β0 ist der y-Abschnitt der Regressionslinie.
  2. β1 ist der Hang.
  3. (ŷ) ist der geschätzte Wert von y für einen bestimmten Wert von X.

Grenzen der einfachen linearen Regression

Auch die besten Daten erzählen keine vollständige Geschichte. 

In der Forschung wird häufig eine Regressionsanalyse verwendet, um festzustellen, dass eine Korrelation zwischen Variablen besteht. Korrelation ist jedoch nicht die gleiche wie die Ursache: Eine Beziehung zwischen zwei Variablen bedeutet nicht. Selbst eine Linie in einer einfachen linearen Regression, die gut zu den Datenpunkten passt.

Durch die Verwendung eines linearen Regressionsmodells können Sie feststellen, ob eine Beziehung zwischen Variablen überhaupt vorhanden ist. Um genau zu verstehen, was diese Beziehung ist und ob eine Variable eine andere verursacht, benötigen Sie zusätzliche Forschung und statistische Analyse.