Chapitre 6

 

Tests sur la moyenne et la variance.

1. Test sur la moyenne.

X suit la loi normale N(m, s).

H0 : m = m0

H1 : m ¹ m0

 

M : estimateur empirique de la moyenne

S2 : estimateur empirique de la variance

 

Test de Student :

 

 

M – m0

T

=

__________

 

 

S/Ö(n-1)

 

Loi de T sous H0 : loi de Student de degré de liberté n-1 

 

Région critique :

 

]-¥, m0 - ta s/(n - 1)1/2[ È ] m0 + ta s/(n - 1) 1/2 , +¥ [

 

ta étant défini par P(½T½> ta ] = a

 

Exemple : l’objectif fixé par les responsables nationaux de l’enseigne Euromarket est un montant moyen des achats égal à 420F. Le directeur commercial s’inquiète du montant moyen observé (316.95F) dans son hypermarché et veut donc vérifier si cette valeur montre effectivement une différence. La variance estimée est égale à s2 = 42902.472.

Pour un risque de première espèce de 5% et un degré de liberté égal à 49, on a :

ta = 2.02.

La région critique est donc :

]-¥, 360.23 [ È ] 479.77, +¥ [

La valeur 316.95 appartient à la région critique. On rejette donc l’hypothèse nulle.

 

équivalence : on calcule l’intervalle de confiance de la moyenne (cf. chapitre 5) :

IC = [ 257.173, 376.717 ]

La valeur 420 n’appartient pas à l’intervalle de confiance. Elle n’est pas acceptable.


2. Comparaison de moyennes.

X1 = N(m1, s1)

X2 : N(m2, s2)

H0 : m1 = m2

H1 : m1 ¹ m2

 

M1 et S12 estimateurs empiriques de la moyenne et la variance de X1

M2 et S22 estimateurs empiriques de la moyenne et la variance de X2

n1 et n2 : nombres d’observations de X1 et X2.

 

Statistique U :

 

 

M1 - M2

U

=

––––––––––––––––––––

 

 

[S12/(n1-1) + S22/(n2-1)]1/2

 

Loi de U sous H0 : la loi normale centrée réduite (n1 et n2 suffisants, s1= s2) .

 

Région critique :

RC = ] - ¥, -ua] U [ua, + ¥ [

 

ua étant défini par P(½U½> ua ) =a

 

Exemple : la moyenne des achats de l’autre hypermarché (410F) a été calculée sur 100 clients. La variance des achats calculée sur ces 100 clients est égale à 35401.

On en déduit :

 

 

316.95 - 410

 

 

T

=

__________________________________________

=

– 2.65

 

 

[ 42902.47 / 49 + 35401 / 99 ]1/2

 

 

Pour un risque de première espèce a = 0.05, on a ua = 1.96. La valeur observée t appartient à la région critique et on rejette donc l’hypothèse nulle : la différence entre les deux moyennes n’est vraisemblablement pas due uniquement au hasard.

 

3. Test sur la variance.

X suit la loi normale N(m, s).

H0 : s2 = s02

H1 : s2 ¹ s02

M : estimateur empirique de la moyenne

S2 : estimateur empirique de la variance

Statistique :

X2 = n S2/s02

 

Loi de X2 sous H0 : loi du c2 de degré de liberté n = n-1.


Région Critique :

 

RC = [0, ca2] È [c1-a2, + ¥ [

 

ca2 et c1-a2 étant définies par la relation :

P(X2 < ca2 ) = a/2

P(X2 > c1-a2 ) = a/2

Exemple : nous supposons que la loi de probabilité de la v.a. âge est la loi normale (en éliminant les trois clients retraités) et testons l’hypothèse H0 : s2 =50.

La valeur observée sur les 47 clients est s2 = 47.86. On en déduit :

X2 = 47 x 47.86 / 50 = 44.99

Nous choisissons comme risque de première espèce a = 0.05. La table donne directement pour le degré de liberté n = 46 :

ca2 = 29.160

tel que P(X2<ca2 ) =0.025

c1-a2 = 66.617

tel que P(X2>c1-a2 ) =0.025

La région critique est : RC = [0, 29.160 ] È [66.617, + ¥ [. La valeur observée n’appartient pas à la région critique et on accepte l’hypothèse nulle.

En déterminant l’ensemble des valeurs s2 telles que l’on accepte l’hypothèse nulle, on retrouvera l’intervalle de confiance déterminé dans le chapitre 5. On pourra examiner aussi la figure 11 du chapitre 5.

4. Comparaison de variances.

X1 = N(m1, s1)

X2 : N(m2, s2)

H0 : s12= s22 = s2

H1 : s12 ¹ s22

 

M1 et S12 estimateurs empiriques de la moyenne et la variance de X1

M2 et S22 estimateurs empiriques de la moyenne et la variance de X2

n1 et n2 : nombres d’observations de X1 et X2.

 

Statistique :

 

 

n1 S12 / s12

 

n2 - 1

F

=

_____________

x

_______

 

 

n2 S22 / s22

 

n1 - 1

 

Loi de F sous H0 : loi de Fisher de degrés de liberté n1-1 et n2-1.

 

Région Critique :

 

RC = ]0, fa[U] f1-a, + ¥ [

 

fa et f1-a étant définies par : P(F< fa) = a/2,      P(F> f1-a) = a/2


Exemple : Pour contrôler l’égalité des moyennes des achats des deux hypermarchés, nous avons supposé que les variances étaient égales. Nous le vérifions ci-dessous, en supposant que les lois sont normales . Les variances des achats sont égale à :

                 s12 = 42902.47 (n1 = 50)                  s22 = 35401 (n2 = 100)

On en déduit :

 

 

50 x 42902.47 / 49

 

 

f

=

_______________________

=

1.2243

 

 

100 x 35401 / 99

 

 

Nous choisissons comme risque de première espèce a = 0.02. Les degrés de liberté sont n1 = 49 et n2 = 99.La table donne directement f1-a = 1.73.

Pour calculer fa, il faut considérer la v.a. 1/F , qui suit la loi de Fisher de degrés de liberté n1 = 99 et n2 = 49. On a :

P(1/F>1/fa) = 0.01

Û

1/fa = 1.82

Û

fa = 0.549

La région critique est donc : RC = ]0, 0.549 [ ] 1.73, + ¥ [.

La valeur observée n’appartient pas à cette région critique et on accepte l’hypothèse d’égalité des variances.

 

5. Introduction au risque de seconde espèce et à la fonction puissance.

Définition :

risque de seconde espèce :  probabilité d’accepter l’hypothèse nulle quand elle est fausse.

puissance : probabilité de rejeter l’hypothèse nulle quand elle est fausse.

p = 1 – b

Puissance du test sur la variance :

 

Hypothèses:

H0 : s2 = s02

H1 : s2 = s12

 

Acceptation de l’hypothèse nulle : n S2/s02 n’appartient pas à la région critique.

Risque b de seconde espèce (sous H1) :

 

 

 

 

 

n S2

 

 

b

=

P

( ca2

<

––––

<

c1-a2 )

 

 

 

 

 

s02

 

 

Calcul de b :

 

 

 

n S2

 

b

=

P (ca2

< –––– <

c1-a2)

 

 

 

s02

 

 

 

 

nS2s12

 

 

=

P (ca2

< –––––– <

c1-a2)

 

 

 

s02s12

 

 

 

ca2s02

nS2

c1-a2s02

 

=

P (––––––

< ––––<

–––––––)

 

 

s12

s12

s12

Loi de n S2 / s12 sous H1 : loi du c2 de degré de liberté n = n – 1.

 

Exemple : nous donnons ci-dessous la puissance du test sur la variance de l’âge. La valeur testée est fixée à s2 = 50, le risque de première espèce à 0.05, et le nombre d’observations est égal à 47.

La lecture de ce tableau donne le renseignement suivant : la probabilité de rejeter l’hypothèse s2 = 50 lorsque la vraie valeur est 33.333 est égale à 0.432 pour un risque de première espèce égal à 0.05.

 

Rang

variance vraie

puissance

Rang

variance vraie

puissance

1

20.0000

0.993

11

64.4444

0.263

2

24.4444

0.915

12

68.8889

0.379

3

28.8889

0.699

13

73.3333

0.497

4

33.3333

0.432

14

77.7778

0.606

5

37.7778

0.227

15

82.2222

0.701

6

42.2222

0.109

16

86.6667

0.778

7

46.6667

0.057

17

91.1111

0.839

8

51.1111

0.053

18

95.5556

0.885

9

55.5556

0.090

19

100.0000

0.919

10

60.0000

0.162

 

 

 

C