Accueil
Statistiques appliquées
Les lois
Les tests
La variance - la fidélité
La régression linéaire
Forums
Contact

La comparaison de deux droites de régression


 

La comparaison de deux droites de régression permet de vérifier s'il existe des différences significatives entre deux séries de résultats dont on a étudié les régressions linéaires.

Il peut s'agir de deux méthodes de production, de deux méthodes d'analyse, etc...

On compare les coefficients a et b des régressions par deux tests de Student appliqués aux différences entre les résultats obtenus par échantillonnage sur les deux populations étudiées.

Ces comparaisons ne peuvent se faire que si les variances résiduelles des deux séries sont homogènes (pas de différence significative entre elles).

Si les deux régressions ne sont pas significativement différentes l'une de l'autre, il est alors possible de regrouper les données afin de retenir un modèle de régression unique pour les deux séries.

 

 

 

 

 

1 - Calculs à effectuer.
1 - 1 Calculs préliminaires.

 
Droite N° 1
Droite N° 2
Caractéristique Symbole Valeur Symbole Valeur

Taille des échantillons

Ordonnée à l'origine

Coefficient directeur

Coefficient de corrélation

Moyennes

Somme des carrés des écarts sur x (total)

Somme des carrés des écarts sur y (total)

Somme des carrés des écarts (résidus)

Variance des résidus

n1

a1

b1

r1

1

SCE1x=

SCE1y=

SCE 1r

S1r

 

Calculatrice

Calculatrice

Calculatrice

Calculatrice

(x1i-1)

(yi-)

(1 - r i) SCE1v

SCEtr / (n 1 -2)

n2

a2

b2

r2

2

SCE2x=

SCE2y=

SCE 2r

S2r

 

Calculatrice

Calculatrice

Calculatrice

Calculatrice

(x1i-1)

(yi-)

(1 - r i) SCE1v

SCEtr / (n 1 -2)

Variance résiduelle commune
sc=(SCE1r+SCE2r) / (n1 + n2 -4)

1 - 2 Comparaison des variances résiduelles.


La comparaison entre les coefficients des droites de régressions ne peut se faire que si les variances résiduelles des deux séries ne sont pas significativement différentes l'une de l'autre.
On réalise donc un test de Snedecor sur s1 et s2.

On pratique le test du F avec : Ftest = (variance des résidus la plus forte) / (variance des résidus la plus faible)

On vérifie que cette valeur de F du test est inférieure ou égale au F de la table pour (1= n1 - 2 et , 2 = n2 - 2) degrés de liberté et au risque de 5 %.

1 - 3 Calcul de la variance résiduelle commune

Si les deux variances résiduelles ne diffèrent pas de façon significative, on peut calculer la variance résiduelle commune aux deux séries.

sc=(SCE1r+SCE2r) / (n1 + n2 -4)

1 - 4 Test sur les pentes. (graphique)

On vérifie que la différence entre b1 et b2 est comprise dans l'intervalle de confiance construit autour de 0 (avec choisi )

Le calcul de t test se fait à l'aide de la formule suivante :

Si la valeur de ttest est située dans l'intervalle de confiance on conclut qu'il n'y a pas de différence significative entre les pentes des deux régressions.

1 - 5 Test sur les ordonnées à l'origine. (graphique)

On vérifie que la différence entre a 1 et a2 est comprise dans l'intervalle de confiance construit autour de 0 (avec choisi)

Le calcul de t test se fait à l'aide de la formule suivante:

Si la valeur de ttest est située dans l'intervalle de confiance on conclut qu'il n'y a pas de différence significative entre les ordonnées à l'origine des deux séries.

Nota : le risque est souvent de 5 %.


2 - Exemple d'application

On se propose de tester deux séries de valeurs correspondant à deux résultats d'essais.

Quinze mesures sont effectuées pour chaque série.

On testera l'identité des deux méthodes d'essais.

Trois mesures de y sont effectuées pour chacun des paliers de x (5,10,15,20,25). La valeur réelle de x est prise en compte pour chaque essai.

On comparera les ordonnées à l'origine et les pentes. Les risques seront de 5 % dans les deux cas.

 

Essai N° 1

Essai N° 2

x1

y1

x2

y2

1

5,1

2,2

5,0

1,9

2

5,0

0,2

5,5

3,8

3

5,0

2,0

5,2

2,5

4

10,0

 8,3

 

10,2

6,0

5

10,1

8,1

10,7

6,2

6

10,2

7,0

10,7

10,0

7

15,3

11,0

15,0

11,5

8

15,1

11,7

15,3

14,4

9

15,0

13,0

15,5

16,3

10

20,0

15,9

20,2

17,8

11

20,2

18,1

20,5

18,2

12

20,4

17,5

20,1

19,6

13

24,9

19,4

25,0

22,1

14

25,2

22,9

25,1

24,4

15

25,0

23,5

25,6

24,1

 

2 - 1 Calculs préliminaires

 
Droite N° 1
Droite N° 2
Caractéristique Symbole Valeur Symbole Valeur

Taille des échantillons

Ordonnée à l'origine

Coefficient directeur

Coefficient de corrélation

Moyennes

Somme des carrés des écarts sur x (total)

Somme des carrés des écarts sur y (total)

Somme des carrés des écarts (résidus)

Variance des résidus

n1

a1

b1

r1

1

SCE1x=

SCE1y=

SCE 1r

S1r

15

-4,289

1,063

0,9808088

15,10

753,260

884,496

33,6233

2,5864

n2

a2

b2

r2

2

SCE2x=

SCE2y=

SCE 2r

S2r

15

-3,002

1,062

0,9835723

15,31

742,909

866,097

28,2222

2,1709

Variance résiduelle commune
sc= 2,3787

2 - 2 Graphique des régressions

2 - 3 Comparaison des variances résiduelles.

F table = F (0,95; 13 ; 13) = 2,57 (obtenu par interpolation)

F test = 2,5864 / 2,1709 = 1,19

Conclusion: la valeur du test (1,19) est inférieure à la valeur de la table (2,57), on peut donc conclure que les variances des résidus ne sont pas significativement différentes ( = 5 %) On peut donc procéder à la comparaison des deux droites d'ajustement.

2 - 4 Test de comparaison des pentes des droites d'ajustement (test de Student)

On calcule la valeur de t correspondant aux écarts entre les pentes des deux droites d'ajustement (valeurs de b) pour un risque bilatéral de 5 % .
Les valeurs sont extraites du tableau des calculs préliminaires.

ttest = 0,001 / 0,0797 = 0,01

Les valeurs de t table sont de t(0,025; 26) = - 2,056 et t(0,975; 26) = 2,056

- 2,056 < 0,01 < 2,056

La valeur du t du test (0,01) est comprise entre les valeurs du t de la table (- 2,056 et 2,056).

On accepte donc l'hypothèse d'égalité des pentes des deux droites d'ajustement.( = 5 %) Les valeurs du test sont illustrées par le graphique.

2 - 5 Test de comparaison des ordonnées à l'origine (test de Student)


On calcule la valeur de t correspondant aux écarts entre les ordonnées à l'origine des deux droites d'ajustement (valeurs de a) pour un risque bilatéral de 5 % .


Les valeurs sont extraites du tableau des calculs préliminaires.

Les valeurs de t table sont de t(0,025; 26) = - 2,056 et t(0,975; 26) = 2,056

- 2,056 < - 0,96 < 2,056


La valeur du t du test ( 0,96) est comprise entre les valeurs de t de la table (- 2,056 et 2,056) .

On accepte donc l'hypothèse d'égalité des ordonnées à l'origine des deux droites d'ajustement.(a = 5 %).

Les valeurs du test sont illustrées par le graphique.

2 - 6 Conclusions


Les deux tests ayant conclu à l'égalité des pentes des deux droites de régression et des deux ordonnées à l'origine, on est conduit à estimer que les résultats sont identiques tant pour l'essai N° 1 que pour l'essai N° 2.
Il est alors possible d'exploiter une régression commune avec l'ensemble des valeurs.