Das Kefk Network Wiki befindet sich im Testbetrieb.


Annahmen der Regressionsschätzung

Aus Kefk.

Wechseln zu: Navigation, Suche
<imagemap>-Fehler: Bild ist ungültig oder nicht vorhanden Die Artikel Annahmen der Regressionsschätzung, Satz von Gauß-Markow, Einfachregression und BLUE überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zu vereinigen. Die Diskussion über diese Überschneidungen findet hier statt. Bitte äußere dich dort, bevor du den Baustein entfernst. Chrisqwq 17:27, 24. Nov. 2006 (CET)
Wikipedia
Dieses Dokument entstammt in seiner ersten oder einer späteren Version der deutschsprachigen Wikipedia. Es ist dort zu finden unter dem Stichwort Annahmen_der_Regressionssch%C3%A4tzung, die Liste der bisherigen Autoren befindet sich in der Versionsliste; die Originalfassung kann dort auch bearbeitet werden. Alle Texte der Wikipedia und ihre Derivate stehen unter der GNU-Lizenz für freie Dokumentation.

Damit die Regressionsschätzungen inferentiell analysiert werden können, müssen für das lineare Regressionsmodell bestimmte Annahmen erfüllt sein:

1. Bezüglich der Störgröße εi

  1. Der Zufallsvektor \underline{\epsilon}=(\epsilon_1,\ldots,\epsilon_n)^T ist verteilt mit dem Erwartungswertvektor 0, d.h. E(\underline{\epsilon})=0 .
  2. Die Zufallsvariablen εi sind stochastisch unabhängig voneinander d. h. \Sigma_\epsilon=\mbox{Cov}(\underline{\epsilon})= \sigma^2I_n\;, wobei In die n dimensionale Einheitsmatrix bezeichnet. Dies kann man genauer auch schreiben als
\mbox{Cov}(\epsilon_i,\epsilon_j)=\delta_{ij} \sigma^2, i=1,\ldots, n\; ,
wobei δij das Kronecker-Delta bezeichnet. Hierbei gilt
\delta_{ij} = \begin{cases}
                            1 & \mbox{falls} \ i=j \\
                            0 & \mbox{sonst}
                            \end{cases},
das heißt die Fehler sind unkorreliert mit homogener Varianz.

2. Die Datenmatrix \underline{X}, welche im Abschnitt zur multiplen Regression explizit angegeben ist, ist fest vorgegeben.

3. Die Datenmatrix \underline{X} hat den Rang (p + 1).

  • In der ersten Annahme haben also alle εi die gleiche Varianz (Homoskedastie) und sie sind paarweise unkorreliert (keine Autokorrelation). Man interpretiert dies so, dass die Störgröße keinerlei Information enthalten darf und nur zufällig streut. Deshalb kann Y nur durch Informationen aus \underline{X} erklärt werden.
  • Die zweite Annahme hält \underline{X} konstant.
  • Die dritte Annahme ist für eine eindeutige Lösung des Regressionsproblems erforderlich.

Schätzen und Testen

Für die inferentielle Regression (Schätzen und Testen) wird noch die Information über die Verteilung der Störgröße ε gefordert. Man hat hier eingeführt als zusätzliche Annahme zu den bereits weiter oben aufgeführten Annahmen

4. Die Störgröße εi ist normalverteilt.

Zusammen mit der 1. Annahme erhält man für die Verteilung des Vektors der Störgröße:

\underline \epsilon \sim N(\underline 0, \sigma^2 I_n) ,

wobie \underline{0} den Nullvektor bezeichnet. Hier sind unkorrelierte Zufallsvariablen auch stochastisch unabhängig. Da die interessierenden Schätzer zum größten Teil lineare Transformationen von \underline{\epsilon} sind, sind sie ebenfalls normalverteilt mit den entsprechenden Parametern. Ferner ist die Quadratsumme der Residuen als nichtlineare Transformation χ2-verteilt mit np Freiheitsgraden.

Beweisskizze: Sei

\underline{w}=\underline{Y}-\underline{X}\underline{\beta},

damit erhält man

\underline{w}^T(I_n-\underline{H})\underline{w}/\sigma^2=(\underline{Y}-\underline{X}\underline{\beta})^T (I_n-\underline{H}) (I_n-\underline{H})\underline{Y}-\underline{X}\underline{\beta} / \sigma^2
=\underline{Y}^T (I_n-\underline{H})\underline{Y}/\sigma^2
=SS_{Res} / \sigma^2 \sim \chi^2_{n-p}.

Wobei

(I_n - \underline{H})\underline{X}=0 und der Satz von Cochran verwendet wurde.
            

Ferner gilt ebenso

SS_{Reg} / \sigma^2 \sim \chi^2_{n-1}.

Betrachte hierzu auch den Artikel Bestimmtheitsmaß.

Wikipedia
Dieses Dokument entstammt in seiner ersten oder einer späteren Version der deutschsprachigen Wikipedia. Es ist dort zu finden unter dem Stichwort Annahmen_der_Regressionssch%C3%A4tzung, die Liste der bisherigen Autoren befindet sich in der Versionsliste; die Originalfassung kann dort auch bearbeitet werden. Alle Texte der Wikipedia und ihre Derivate stehen unter der GNU-Lizenz für freie Dokumentation.
Persönliche Werkzeuge