4. La qualité de l'équation de régression (3/3)

Le degré de liberté de régression (Regression degree of Freedom - RDF), est le nombre de variables indépendantes, et nous avons vu que celui-ci vaut un pour une régression linéaire simple, alors que N est l'échantillon de population utilisé pour mettre en place l'équation de régression. Nous avons vu que (N - 1) est utilisé pour trouver la variance d'un échantillon de population, car cela apporte une estimation de la variance non biaisée. Nous faisons ceci car un paramètre, la moyenne, devait être extrait des données avant le calcul de la variance. Avec une régression linéaire simple, nous devons extraire deux paramètres (b0 and b1) ), et donc nous soustrayons 2 de N au dénominateur, bien que nous l'écrivions sous la forme montrée ci-dessus pour en généraliser l'applicabilité.

Vous avez calculé le F statistique (F de Snedecor). Quelle est la valeur limite entre accepter et rejeter l'hypothèse NULLE ? Nous pouvons trouver cette limite dans des tables. Sélectionnez le degré de confiance voulu dans la décision. Les deux tables reprises ici ont un degré de signification de 2,5% et 1% pour les tables 1 et 2 respectivement, ce qui veut dire que vous pouvez être certain à 97,5% et 99% que l'hypothèse NULLE doit être acceptée en dessous de la valeur donnée dans la table, et rejetée au dessus. Dans notre exemple, le F statistique vaut 367,15 pour la régression linéaire du blé d'hiver et 196,87 pour celle de l'orge de printemps. Si nous voulons être confiant à 99% de nos résultats, nous devons utiliser les tables 0.01, en utilisant la colonne 1 pour un degré de liberté au numérateur, et les rangées 60 pour le blé d'été et 51 pour l'orge de printemps. Notre table s'arrête à 30 degrés de liberté, mais même avec ce petit nombre la valeur de la table est bien inférieure àla valeur dont nous disposons. Dès lors, nous pouvons rejeter l'hypothèse NULLE et accepter la régression comme statistiquement significative.

Exercices

  1. Dans votre feuille de tableur, trouvez le coefficient de détermination pour le blé d'hiver et l'orge de printemps, ainsi que le F de Snedecor. Utilisez le F de Snedecor dans les tables statistiques pour vérifier les résultats donnés dans le texte ci-dessus, aux niveaux de confiance de 97,5% et 99%.