La validation des coefficients d'une régression linéaire


 

Valider les coefficients d'une régression linéaire c'est vérifier si ces coefficients sont significativement différents d'une valeur de référence on non.

  • On vérifie si le coefficient directeur est différent de zéro ce qui valide la pente.
  • On vérifie le plus souvent si l'ordonnée à l'origine est significativement différente de zéro mais on peut tester également d'autres valeurs.

1 - Calculs préalables.
2 - Test sur l'ordonnée à l'origine (a)
3 - Test sur le coefficient directeur (b)
4 - Exemple d'application

 

 

 

 

 

 

 

 

 

 


1 - Calculs préalables.
On détermine tout d'abord les coefficients de la droite de régression et le coefficient de corrélation linéaire :

  • a = ordonnée à l'origine (A sur les calculatrices),
  • b = coefficient directeur (B sur les calculatrices),
  • r = coefficient de corrélation linéaire.

Il est également nécessaire de déterminer :

(xi-)=(n - 1) sx   (yi-)=(n - 1) sy = SCEt

La variance résiduelle est estimée par la formule : sr = [(1 - r)/ (n - 2)] SCEt

Attention : dans ce calcul, le résultat est fortement influencé par la précision de r

2 - Test sur l'ordonnée à l'origine (a) (graphique)


On vérifie que la valeur 0 est comprise dans l'intervalle de confiance de l'ordonnée à l'origine construit autour de la valeur a.

Le test est bilatéral pour un risque choisi.

Nota: ne pas confondre valeur vraie de a et le risque statistique

La valeur de l'écart-type s a permettant de déterminer l'intervalle de confiance est égal à : avec et

On vérifie l'inégalité

Si l'inégalité est respectée, on accepte l'hypothèse selon laquelle a = 0

3 - Test sur le coefficient directeur (b) (graphique)


On vérifie que la valeur de 0 est comprise dans l'intervalle de confiance du coefficient directeur construit autour de la valeur b.
Le test est bilatéral pour un risque choisi.

La valeur de l'écart-type s b permettant de déterminer l'intervalle de confiance est égal à : avec et

 

On vérifie l'inégalité :

Si l'inégalité est respectée, on accepte l'hypothèse selon laquelle b = 0

Nota : ce test est équivalent au test de Fisher.

4 - Exemple d'application

4 - 1 Tableau de résultats

Tableau de calcul
Symbole
valeur
n
20
100,174
b
12,997
a
-15,737
r
0,9973567
(xi-)=(n - 1) sx
16124,86
(yi-)=(n - 1) sy = SCEt
2738333,58
Nota : ces résultats sont accessibles sur une calculatrice à fonction régression linéaire.

sr =[ (1 - 0,9973567) / (20 - 2)] x 2738333,58 = 803,2

4 - 2 Graphique de la régression

Le graphique de régression est construit en plaçant la variable x en abscisse et la variable y en ordonnée. x est la variable indépendante. Attention: si l'on inverse les deux variables, les résultats seront différents pour les coefficients a et b.

Signification des coefficients :

L'ordonnées à l'origine a permet d'estimer la valeur de y lorsque x est égal à zéro. Le coefficient directeur b estime la variation moyenne de y lorsque x varie dans l'intervalle étudié.
Le coefficient r estime la liaison existant entre x et y. Attention : r ne permet pas de déterminer directement l'influence de x sur y.
Chacun de ces coefficients représente une estimation des coefficients vrais.

4 - 3 Test sur l'ordonnée à l'origine (a) - (graphique)

Les valeurs de ttable sont de t(0,025;18) = -2,101 et t(0,975;18) = 2,101

- 2,101 < 0,68 < 2,101

On peut conclure que l'ordonnée à l'origine (a) n'est pas significativement différente de zéro ( = 0,05)

4 - 4 Test sur le coefficient directeur (b) - (graphique)

Les valeurs de t table sont de t(0 015; 18) = - 2,101 et t(0,97.5; 18) = 2,101

- 58,3 < - 2,101

On peut conclure que le coefficient directeur (b) est significativement différent de zéro (a = 0,05).