Ergänzung 2.1: Punktwolken und Ausgleichsgeraden (1/3)

Wir betrachten eine Punktwolke aus i=1...n Datenpunkten P( x i , y i ) , wobei n eine natürliche Zahl ist (Grafik links unten). Gesucht ist die Gerade, welche die beste Annäherung für die Verteilung der Datenpunkte darstellt. Hierzu untersuchen wir die Gleichung einer Geraden (in den Grafiken als blaue gebrochene Linie eingezeichnet),

f(x)=ax+b ,

und insbesondere die Punkte P( x i ,f( x i )) auf dieser Geraden mit gleichen x-Koordinaten wie die Datenpunkte (Grafik rechts unten; zum Umschalten auf die jeweilige Überschrift klicken).

Die Differenzen zwischen den Datenpunkten und den Punkten auf der Geraden mit gleichen x-Werten sind durch y i f( x i ) gegeben. Diese Differenzen, in der unten abgebildeten Grafik am Beispiel der Punkte P( x 1 , y 1 ) und P( x 1 ,f( x 1 ) ) gezeigt, erlauben es, die Gerade zu finden, mit der die Datenpunkte am besten wiedergegeben werden. Diese Ausgleichsgerade sollte kleinstmögliche Abstände zu den Datenpunkten aufweisen, d.h. die Differenzen ein Minimum einnehmen!

Alternativ könnte man auch die Differenzen zwischen den Datenpunkten und den Punkten auf der Geraden mit gleichen y-Werten untersuchen. Dies bezeichnet man als Regressionsanalyse bezüglich y.

Im weiteren betrachten wir eine Regressionsanalyse bezüglich x.

Es wäre nicht sinnvoll, die Differenzen aufzuaddieren und das Minimum durch Ändern der Lage der Geraden zu suchen, da diese Differenzen positiv und negativ sind. Auf das Vorzeichen soll es nicht ankommen. Daher werden die Differenzen quadriert, und wir bestimmen die mittlere quadratische Abweichung

S= 1 n i=1 n ( y i f( x i ) ) 2 ,

in unserem Beispiel:                           S= ( y 1 f( x 1 ) ) 2 +...+ ( y 6 f( x 6 ) ) 2 6

Ersetzt man f( x i ) durch f( x i )=a x i +b , so folgt:

S(a,b)= 1 n i=1 n ( y i (a x i +b) ) 2

mit der Steigung a und dem y-Achsenabschnitt b der Geraden.

Der Schwerpunkt der Datenpunkte

Die Ausgleichsgerade ist gefunden, wenn die Parameter a und b der Geraden so gewählt sind, dass die mittlere quadratische Abweichung

S(a,b)= 1 n i=1 n ( y i (a x i +b) ) 2

ein Minimum einnimmt. Daher berechnen wir die Ableitung von S und setzen sie zu Null.

Allerdings hängt S von zwei Variablen ab, a und b. Daher bestimmen wir die Ableitung in zwei Schritten. Wir leiten zunächst S nach b ab und halten a konstant. In einem zweiten Schritt leiten wir S nach a ab und halten b konstant. (In der höheren Differenzialrechnung bezeichnet man S als Funktion zweier Variabler, und wir berechnen die parziellen Ableitungen von S nach den Variablen a bzw. b)

Die Ableitung nach b ergibt:

S'(b)= 2 n i=1 n ( y i (a x i +b) )
S'(b)= 2 n ( i=1 n y i a i=1 n x i i=1 n b )

Mit              1 n i=1 n y i = y ¯ 1 n i=1 n x i = x ¯ 1 n i=1 n b =b

wobei x ¯ und y ¯ die arithmetischen Mittelwerte der x i - und y i -Koordinaten sind, folgt:

S'(b)=2 y ¯ 2a x ¯ 2b

Das Minimum von S(b) ergibt sich aus S'(b)=0 , und man erhält:

y ¯ =a x ¯ +b

Dies sieht zunächst aus wie eine Geradengleichung. Allerdings sind die Mittelwerte x ¯ und y ¯ Koordinaten eines Punktes. Der Punkt P( x ¯ , y ¯ ) ist daher das arithmetische Mittel der Punkte P( x i , y i ) , er wird als Schwerpunkt bezeichnet.

Zoom Sign
points in the diagram
Schwerpunkt P( x ¯ , y ¯ ) der Datenpunkte.
Der Schwerpunkt P( x ¯ , y ¯ ) ist ein Punkt auf der Ausgleichsgeraden der Punktwolke P( x 1 , y 1 ),P( x 2 , y 2 ),...P( x n , y n ) .