Das Kefk Network Wiki befindet sich im Testbetrieb.
Annahmen der Regressionsschätzung
Aus Kefk.
| <imagemap>-Fehler: Bild ist ungültig oder nicht vorhanden | Die Artikel Annahmen der Regressionsschätzung, Satz von Gauß-Markow, Einfachregression und BLUE überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zu vereinigen. Die Diskussion über diese Überschneidungen findet hier statt. Bitte äußere dich dort, bevor du den Baustein entfernst. Chrisqwq 17:27, 24. Nov. 2006 (CET) |
| Dieses Dokument entstammt in seiner ersten oder einer späteren Version der deutschsprachigen Wikipedia. Es ist dort zu finden unter dem Stichwort Annahmen_der_Regressionssch%C3%A4tzung, die Liste der bisherigen Autoren befindet sich in der Versionsliste; die Originalfassung kann dort auch bearbeitet werden. Alle Texte der Wikipedia und ihre Derivate stehen unter der GNU-Lizenz für freie Dokumentation. |
Damit die Regressionsschätzungen inferentiell analysiert werden können, müssen für das lineare Regressionsmodell bestimmte Annahmen erfüllt sein:
1. Bezüglich der Störgröße εi
- Der Zufallsvektor
ist verteilt mit dem Erwartungswertvektor 0, d.h.
.
- Die Zufallsvariablen εi sind stochastisch unabhängig voneinander d. h.
, wobei In die n dimensionale Einheitsmatrix bezeichnet. Dies kann man genauer auch schreiben als
,
- wobei δij das Kronecker-Delta bezeichnet. Hierbei gilt
,
- das heißt die Fehler sind unkorreliert mit homogener Varianz.
2. Die Datenmatrix
, welche im Abschnitt zur multiplen Regression explizit angegeben ist, ist fest vorgegeben.
3. Die Datenmatrix
hat den Rang (p + 1).
- In der ersten Annahme haben also alle εi die gleiche Varianz (Homoskedastie) und sie sind paarweise unkorreliert (keine Autokorrelation). Man interpretiert dies so, dass die Störgröße keinerlei Information enthalten darf und nur zufällig streut. Deshalb kann Y nur durch Informationen aus
erklärt werden.
- Die zweite Annahme hält
konstant.
- Die dritte Annahme ist für eine eindeutige Lösung des Regressionsproblems erforderlich.
Schätzen und Testen
Für die inferentielle Regression (Schätzen und Testen) wird noch die Information über die Verteilung der Störgröße ε gefordert. Man hat hier eingeführt als zusätzliche Annahme zu den bereits weiter oben aufgeführten Annahmen
4. Die Störgröße εi ist normalverteilt.
Zusammen mit der 1. Annahme erhält man für die Verteilung des Vektors der Störgröße:
,
wobie
den Nullvektor bezeichnet. Hier sind unkorrelierte Zufallsvariablen auch stochastisch unabhängig.
Da die interessierenden Schätzer zum größten Teil lineare Transformationen von
sind, sind sie ebenfalls normalverteilt mit den entsprechenden Parametern. Ferner ist die Quadratsumme der Residuen als nichtlineare Transformation χ2-verteilt mit n − p Freiheitsgraden.
Beweisskizze: Sei
,
damit erhält man
.
Wobei
und der Satz von Cochran verwendet wurde.
Ferner gilt ebenso
.
Betrachte hierzu auch den Artikel Bestimmtheitsmaß.
| Dieses Dokument entstammt in seiner ersten oder einer späteren Version der deutschsprachigen Wikipedia. Es ist dort zu finden unter dem Stichwort Annahmen_der_Regressionssch%C3%A4tzung, die Liste der bisherigen Autoren befindet sich in der Versionsliste; die Originalfassung kann dort auch bearbeitet werden. Alle Texte der Wikipedia und ihre Derivate stehen unter der GNU-Lizenz für freie Dokumentation. |
