4. Die Qualität der Regressionsgleichung (3/3)

Der Freiheitsgrad, auch RDF (vom englischen Regression Degrees of Freedom) genannt, gibt die Anzahl der unabhängigen Variablen an. Wir haben gesehen, dass diese bei der einfachen linearen Regression gleich 1 ist, während N die Ausgangsgesamtheit der Stichprobe ist, die genutzt wird, um die Regressionsgleichung zu berechnen. Wir haben bereits gesehen, dass (N - 1) genutzt wird, um die Varianz der Ausgangsgesamtheit einer Stichprobe abzuleiten, da wir so einen unverzerrten Schätzer der Varianz erhalten. Das tun wir, weil ein Parameter, nämlich der Mittelwert, bereits vor der Berechnung der Varianz aus den Daten berechnet werden musste. Bei der einfachen linearen Regression müssen wir zwei Parameter ableiten, b0 und b1, daher ziehen wir 2 von N im Nenner ab, obwohl wir das Ganze für eine allgemeinere Anwendung in die Form der Gleichung auf der vorigen Seite bringen.

Sie haben also den F-Test durchgeführt. Wo liegt nun der Grenzwert, der darüber entscheidet, ob man die Nullhypothese annehmen oder verwerfen soll? Diesen Grenzwert können wir aus Tabellen entnehmen. Wählen Sie das Vertrauensniveau aus, das für Ihre Entscheidung gelten soll; die beiden Tabellen, sowohl Tabelle 1 als auch Tabelle 2, haben eine Signifikanz von 2,5% und 1%, was bedeutet, dass man zu 97,5% und 99% sicher sein kann, dass die Nullhypothese angenommen werden sollte, wenn der Wert niedriger als der in Tabelle angegebene ist; wenn er größer ist, wird sie abgelehnt. In unserem Beispiel erhalten wir beim F-Test Werte von 367,15 für die lineare Regression des Winterweizens und 196,87 für die Sommergerste. Möchten wir uns bei dem Ergebnis zu 99% sicher sein, so nutzen wir die 0,01-Tabellen, schauen in Zeile 1 nach, um einen Freiheitsgrad im Zähler zu haben, und in Zeile 60 für den Winterweizen und Zeile 51 für die Sommergerste. Unsere Tabelle geht nur bis zu 30 Freiheitsgraden, doch sogar schon bei dieser kleinen Anzahl ist der Tabellenwert sehr viel geringer, als unsere Werte. Demzufolge können wir die Nullhypothese mit Sicherheit ablehnen und die Regression als statistisch signifikant ansehen.

Aufgaben

  1. Ermitteln Sie in Ihren Tabellenblatt das Bestimmtheitsmaß für Winterweizen und Sommergerste und machen Sie den F-Test. Nutzen Sie die Tabellen des F-Tests, um die hier im Text gegebenen Ergebnisse zu überprüfen und zwar für die beiden Vetrauensbereiche 97,5% und 99%.