Wie führe ich eine lineare Regression für Daten durch?

Wie führe ich eine lineare Regression für Daten durch?
Anonim

Antworten:

Sie müssen die vollständige Antwort sehen, um zu verstehen

Erläuterung:

Ich weiß nicht genau, was Sie als Erstes meinen, Sie erhalten Ihre Daten dort, wo Sie auf x regressieren, um herauszufinden, wie sich eine Änderung in x auswirkt.

x y

1 4

2 6

3 7

4 6

5 2

Und Sie möchten die Beziehung zwischen x und y finden, sagen Sie also, Sie glauben, dass das Modell so ist

# y = mx + c #

oder in Statistiken

# y = beta_0 + beta_1x + u #

diese # beta_0, beta_1 # sind die Parameter in der Bevölkerung und # u # ist die Auswirkung von nicht beobachteten Variablen, die ansonsten als Fehlerterm bezeichnet werden # hatbeta_0, hatbeta_1 #

So # haty = hatbeta_0 + hatbeta_1x #

Dies sagt Ihnen, dass die vorhergesagten Koeffizienten den vorhergesagten y-Wert ergeben.

Sie möchten also die besten Schätzungen für diese Koeffizienten finden, indem wir die geringste Differenz zwischen dem tatsächlichen y-Wert und dem vorhergesagten Wert ermitteln.

#min sum_ (i = 1) ^ nhatu_i ^ 2 ~ hatbeta_0, hatbeta_1 #

Dies bedeutet im Wesentlichen, dass Sie das Minimum der Summe der Differenzen zwischen den aktuellen y-Werten und den vorhergesagten y-Werten für Ihre Regressionsgerade wünschen

Die Formeln für das Finden sind also

# hatbeta_1 = (sum_ (i = 1) ^ n (x_ibarx) (y_i-bary)) / (sum_ (i = 1) ^ n (x_i-barx) ^ 2) #

# hatbeta_0 = bary-hatbeta_1barx #