Chapitre 6

 

introduction aux tests statistiques.

1. Notion de test statistique.

Définition : on appelle test statistique une démarche de la statistique inférentielle consistant :

·        à contrôler la validité d’une hypothèse considérée comme vraie a priori, appelée hypothèse nulle et notée H0  (présomption d’innocence d’un accusé) ; 

·        à admettre une hypothèse différente lorsque le contrôle se révèle négatif, appelée hypothèse alternative et notée H1 (culpabilité d’un accusé).

 

Définitions : on appelle :

·        erreur de première espèce, l’erreur consistant à rejeter l’hypothèse nulle alors qu’elle est vraie (on condamne un innocent) ;

·        erreur de seconde espèce, l’erreur consistant à accepter l’hypothèse nulle alors qu’elle est fausse (on acquitte un coupable). 

 

Définitions : on appelle :

·        risque de première espèce la probabilité de rejeter l’hypothèse nulle alors qu’elle est vraie (erreur de première espèce). On le note a. C’est le risque qu’on limite (risque de condamner un innocent).

·        risque de seconde espèce la probabilité d’accepter l’hypothèse nulle quand elle est fausse (erreur de seconde espèce). On le note b. Il reste souvent inconnu (risque d’acquitter un coupable).

·        puissance la probabilité de rejeter l’hypothèse nulle quand elle est fausse. On la note p et elle est égale à 1 – b (probabilité de condamner un coupable).

 

 

 

Hypothèse

vraie

 

 

H0

H1

Hypothèse

H0

pas d’erreur

Erreur de 2ième espèce

Risque b

acceptée

H1

Erreur de 1ère espèce

Risque a

pas d’erreur

Puissance p

2 Règle de décision.

La décision est prise à l’issue d’observations statistiques (ou d’investigations policières) apportant ou non la preuve que l’hypothèse nulle est fausse (que l’accusé n’est pas innocent). 

L’acceptation de l’hypothèse nulle n signifie donc pas qu’elle est vraie, mais seulement que les données observées ne montrent pas qu’elle est fausse.

 

Exemple :

Un coefficient d’asymétrie très différent de 0 montre que la répartition des observations n’est pas symétrique.

Une grosse somme d’argent inexpliquée sur un compte courant peut être une preuve d’escroquerie.

 

Définition : dans un test statistique, la variable aléatoire que l’on utilise pour contrôler l’hypothèse nulle est appelée elle-même statistique.

 

Exemple : coefficient d’asymétrie (solde d’un compte en banque)

 

Définition : on appelle région critique d’un test statistique l’ensemble des valeurs observées de la statistique provoquant le rejet de l’hypothèse nulle.

 

Exemple : coefficient d’asymétrie supérieur à 0.534 pour 50 observations (solde d’un compte en banque supérieur à la moyenne des soldes des mois précédents + deux fois l’écart-type)

 

choix du risque a : Le risque a mesure la faiblesse de la preuve. Plus le risque est grand, plus la preuve est faible et inversement.

Il y a des valeurs classiques :

Risque de première espèce

hypothèse alternative

0.001 (0.1%)

quasiment impossible

0.01 (1%)

très peu vraisemblable

0.05 (5%)

peu vraisemblable

0.1 (10%)

rare mais possible

3. Tests élémentaires.

Tests sur le coefficient d’asymétrie et d’aplatissement :

·           hypothèse nulle H0 : la loi de la v.a. est la loi normale (gas = 0 et gap = 3).

·           hypothèse alternative H1 : la loi de X n’est pas la loi normale (gas ¹ 0 ou gap ¹ 3).

Les intervalles en dehors desquels les coefficients d’asymétrie et d’aplatissement observés dénient la normalité de la répartition sont donnés dans une table statistique.

Pour n = 50 observations et a = 0.05 :

Coefficient d’asymétrie cas très différent de 0 : on rejette l’hypothèse nulle.

RC = ] - ¥ , -0.534 [ È ] 0.534 ,+ ¥ [

P[{cas < -0.534}È{cas > 0.534}/ H0) =  0.05

Coefficient d’aplatissement cap très différent de 3 : on rejette l’hypothèse nulle.

RC = ] 0 , 2.15 [ È ] 3.99 , + ¥ [

P[{cap < 2.15}È{cas > 3.99}/ H0) =  0.05

4. discussion. généralisation.

On a observé des traces de pas sur une plage, et on a pu en déduire la pointure de la personne qui est passée. On sait que cette personne s’appelle Dominique. 

·      H0 : Dominique est une femme

·      H1 : Dominique est un homme

·      Statistique : pointure.

Décision intuitive :

1ère observation : Dominique chausse du 43.

Peu de femmes chaussant du 43, on peut considérer que Dominique est un homme.

2ième observation : Dominique chausse du 39.

La pointure 39 est fréquente chez les femmes ; Dominique peut être une femme.

Décision statistique :

La décision est prise suivant les probabilités calculées sous l’hypothèse nulle, c’est-à-dire chez les femmes. On sait qu’il y a 7% de femmes chaussant du 41 ou plus. La région critique et le risque de première espèce sont donc :

RC = [41, +¥ [

P(RC / H0) = 0.07

Critique du raisonnement :

La décision prise est discutable. Plusieurs hypothèses ont été émises implicitement sur la population constituée des promeneurs sur la plage.

·           il n’y a que des adultes, pas d’enfant.

·           il y a autant d’hommes que de femmes : le pourcentage de 7% ne tient pas compte de la proportion de femmes se promenant sur la plage.

·           un raisonnement identique conduirait à rejeter l’hypothèse que Dominique est un homme s’il chausse du 45, puisque 3.33% seulement d’hommes chaussent du 45 ou plus. De même, il est rare qu’une femme chausse du 35 ou moins (6.7%).La décision est pourtant évidente dans chaque cas, et doit être prise en comparant la vraisemblance des hypothèses dans chaque cas, c’est-à-dire le pourcentage d’homme chaussant au moins du 45 (ou au plus du 35) au pourcentage de femmes correspondant : c’est le rapport des vraisemblances qui permet de prendre la décision.

Pour la pointure 45, il y a 0.1% de femmes chaussant du 45 ou plus, contre 3.3% d’hommes  : la vraisemblance que ce soit un homme est donc largement supérieure.

Pour la pointure 35, il y a 0.01% d’hommes chaussant du 35 ou moins contre 6.7% de femmes : la vraisemblance que ce soit une femme est donc largement supérieure.

 

Conclusion : méfions-nous des raisonnements hâtifs.