stabilité de la décision statistique

Ce que l’on appelle décision statistique est la décision prise à l’issue d’un test effectué pour contrôler une hypothèse. La statbilité est une notion importante et nous utilisons le test d’ajustement du c2 pour montrer le genre de difficultés auxquelles on peut être confronté.

Nous avons admis dans le chapitre 6 la normalité de la variable définie par le logarithme des revenus des 47 clients d’Euromarket, les clients de rang 25, 31 et 43 étant éliminés des données. On peut utiliser le fichier de données Euromar1.dat, duquel nous avons éliminé les trois clients ci-dessus (fichier de paramètres Euromar1.par).

 

En réalité, cette normalité est discutable, et la statistique mène à des conclusions différentes suivant la procédure suivie.

 Nous donnons ci-dessous les résultats du test du c2 effectué de la façon suivante :

·  on définit 5 classes de même amplitude ;

·  on réunit les classes 4 et 5 pour que les conditions de convergence soient satisfaites ;

·  on choisit un risque de première espèce égal à 5% ;

·  on effectue le test d’ajustement.

 

La répartition des 50 observations est la suivante :

Classe

Centre

Fréquence

absolue

Fréquence relative

Densité

[11.2123, 11.4075 [

11.3099

11

23.4%

1.1990

[11.4075, 11.6027 [

11.5051

19

40.4%

2.0709

[11.6027, 11.7979 [

11.7003

9

19.2%

0.9810

[11.7979, 11.9931 [

11.8955

5

10.6%

0.5450

[11.9931, 12.1883 [

12.0907

3

6.4%

0.3270

 

Le choix des classes nécessite quelques précisions. On a choisi cinq classes de même amplitude, et les bornes extrêmes ont été définies par la plus petite et la plus grande des valeurs observées. On obtient ainsi l’histogramme ci-dessous.

Toutefois, le calcul des probabilités de la première et de la dernière classe est effectué en considérant comme classes ] - ¥, 11.4075 [ et ] 11.9931, + ¥ [ . Les probabilités doivent en effet avoir pour somme 1 : on retrouve ici l’importance du choix des bornes extrêmes déjà vu dans les applications pédagogiques du chapitre 1.

Le test d’ajustement du c2 donne les résultats suivants (nous avons défini cinq classes de même amplitude et regroupé les classes 4 et 5) :

 

Cl.

%

Probabilité

x2

Cl.

%

Probabilité

x2

1

0.234

0.24194

0.01

2

0.404

0.30788

1.42

3

0.191

0.27925

1.30

4

0.170

0.17933

0.00

 

La statistique x2 est égale à 2.7264 et sa probabilité critique à P(X²>x²) =  0.0945, pour un degré de liberté égal à 1. On accepte donc l’hypothèse d’une loi normale pour un risque de première espèce égal à 0.05.

 

Nous laissons le lecteur effectuer le test de la façon suivante :

·  on définit 6 classes de même amplitude ;

·  on réunit les classes 4, 5 et 6 pour que la convergence soit assurée;

·  on choisit un risque de première espèce égal à 5% ;

·  on effectue le test d’ajustement.

 

Il constatera que l’hypothèse de normalité est rejetée.

 

D’où l’importance d’un recul critique devant de type de méthodes statistiques que l’on considère comme peu robustes, c’est-à-dire ici dépendant des choix de l’utilisateur. Ces choix doivent systématiquement être effectués a priori, c’est-à-dire avant tout calcul. La modification des classes après le calcul de la statistique X2 est une erreur méthodologique qui prive la démarche statistique de son caractère de scientificité. 

 

On notera aussi que parfois, les tests peuvent donner des résultats contradictoires. Nous avons calculé les coefficients d’asymétrie et d’aplatissement sur la série des logarithmes des revenus (sans les clients 25, 31 et 43). On trouve :

cas = 1.083232

cap = 3.556773

 

Le coefficient d’asymétrie dépasse largement la valeur limite donnée par la table (0.534). La loi normale est donc peu vraisemblable suivant ce critère.

 

En conclusion, la pratique des tests n’est pas aussi facile qu’elle le paraît. Dans le cas du test du c2, les choix doivent être effectués a priori, avant tout calcul, et il est très possible que des tests aboutissent à des résultats contradictoires : certains sont « meilleurs » que d’autres, c’est-à-dire que leur puissance est supérieure pour un même risque de première espèce : on parle alors de tests UMP.