L'analyse de la variance - Test de Fisher -
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
La
seule analyse d'une régression par son coefficient de corrélation
et par le coefficient directeur de
la droite n'est pas suffisant pour tester l'influence de x sur y.
Le
test de Fischer fournit une estimation de cette influence. Il est
surtout ut-lie en régression multiple
où l'on peut analyser plusieurs facteurs à la fois. Dans
ce cas les calculs sont longs et fastidieux. Des logiciels d'analyse
de la variance permettent de
s'en affranchir. Le
but de ce chapitre est d'expliquer le principe du test qui est transposable
en régression multiple.
1
- Les variances
Sur
une régression, on peut calculer trois variances distinctes :
-
la
variance totale . C'est la variance classique. Cette
variance est égale à l'écart-type s au carré de
toutes les valeurs de y. Exemple avec les valeurs du tableau ( graphique )
La variance est calculée à partir des segments correspondants représentés en traits forts sur la figure.
-
SCE
représente la somme des carrés des écarts résiduels.
Cette variance résiduelle est la variance due aux facteurs autres que le (ou les) facteur(s) pris en compte. La variance est calculée à partir des segments correspondants représentés en traits forts sur le graphique. -
la
variance due au facteur _________________ Elle correspond à la variance due à la pente de la droite c'est à dire au facteur pris en compte dans la régression (x). - SCE1 représente la somme des carrés des écarts provoqués par la régression linéaire.
La variance est calculée à partir des segments correspondants représentés en traits forts sur le graphique . Les résultats correspondant à l'analyse de la variance sont regroupés dans un tableau dit d'analyse de la variance.
n = nombre total d'observations, F test = variable de Fisher pour le test, Pour faciliter les calculs, on note que: SCEt = SCE + SCEr Pour les valeurs de l'exemple: L'hypothèse Ho est: la pente de la droite est significativement différente de 0. sy=7,7667
d'où SCEt=
7,7667 sX=
7,2449 d'où
s Coefficient
directeur b = 0,85182 d'où SCE1 = 0,8518 x 0,8518 x 472,4 = 342,8 et SCEr = 542,9 - 342,8 = 200,1
Si
Ftest
dépasse
la valeur fournie par la table (extrait du tableau ci-dessous),
la pente de la droite est significative et
l'on considère que l'effet du facteur x
est significatif (risque Extrait
de la table du F
pour un risque
F(0,95;1;9) = 5,32 L'influence de x est donc significative au risque de 5 % puisque 13,7 est plus grand que les 5,32 prévus par la table. L'hypothèse
Ho est acceptée. La pente de la droite de
régression est significativement différente de
0( |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() |