Ce que l’on appelle décision statistique est la décision prise à l’issue d’un test effectué pour contrôler une hypothèse. La statbilité est une notion importante et nous utilisons le test d’ajustement du c2 pour montrer le genre de difficultés auxquelles on peut être confronté.
Nous avons admis dans le chapitre 6 la normalité de la variable définie par le logarithme des revenus des 47 clients d’Euromarket, les clients de rang 25, 31 et 43 étant éliminés des données. On peut utiliser le fichier de données Euromar1.dat, duquel nous avons éliminé les trois clients ci-dessus (fichier de paramètres Euromar1.par).
En réalité, cette normalité est discutable, et la statistique mène à des conclusions différentes suivant la procédure suivie.
Nous donnons ci-dessous les résultats du test du c2 effectué de la façon suivante :
· on définit 5 classes de même amplitude ;
· on réunit les classes 4 et 5 pour que les conditions de convergence soient satisfaites ;
· on choisit un risque de première espèce égal à 5% ;
· on effectue le test d’ajustement.
La répartition des 50 observations est la suivante :
Classe |
Centre |
Fréquence absolue |
Fréquence relative |
Densité |
[11.2123, 11.4075 [ |
11.3099 |
11 |
23.4% |
1.1990 |
[11.4075, 11.6027 [ |
11.5051 |
19 |
40.4% |
2.0709 |
[11.6027, 11.7979 [ |
11.7003 |
9 |
19.2% |
0.9810 |
[11.7979, 11.9931 [ |
11.8955 |
5 |
10.6% |
0.5450 |
[11.9931, 12.1883 [ |
12.0907 |
3 |
6.4% |
0.3270 |
Le choix des classes nécessite quelques précisions. On a choisi cinq classes de même amplitude, et les bornes extrêmes ont été définies par la plus petite et la plus grande des valeurs observées. On obtient ainsi l’histogramme ci-dessous.
Toutefois, le calcul des probabilités de la première et de la dernière classe est effectué en considérant comme classes ] - ¥, 11.4075 [ et ] 11.9931, + ¥ [ . Les probabilités doivent en effet avoir pour somme 1 : on retrouve ici l’importance du choix des bornes extrêmes déjà vu dans les applications pédagogiques du chapitre 1.
Le test d’ajustement du c2 donne les résultats
suivants (nous avons défini cinq classes de même amplitude et regroupé les
classes 4 et 5) :
Cl. |
% |
Probabilité |
x2 |
Cl. |
% |
Probabilité |
x2 |
1 |
0.234 |
0.24194 |
0.01 |
2 |
0.404 |
0.30788 |
1.42 |
3 |
0.191 |
0.27925 |
1.30 |
4 |
0.170 |
0.17933 |
0.00 |
La statistique x2
est égale à 2.7264 et sa probabilité critique à P(X²>x²) = 0.0945, pour un degré de liberté égal à 1. On
accepte donc l’hypothèse d’une loi normale pour un risque de première espèce
égal à 0.05.
Nous laissons le lecteur effectuer le test
de la façon suivante :
· on définit 6 classes de même amplitude ;
· on réunit les classes 4, 5 et 6 pour que la convergence soit assurée;
· on choisit un risque de première espèce égal à 5% ;
· on effectue le test d’ajustement.
Il constatera que l’hypothèse de normalité
est rejetée.
D’où l’importance d’un recul critique devant
de type de méthodes statistiques que l’on considère comme peu robustes,
c’est-à-dire ici dépendant des choix de l’utilisateur. Ces choix doivent
systématiquement être effectués a priori, c’est-à-dire avant tout calcul. La
modification des classes après le calcul de la statistique X2 est
une erreur méthodologique qui prive la démarche statistique de son caractère de
scientificité.
On notera aussi que parfois, les tests peuvent donner des résultats contradictoires. Nous avons calculé les coefficients d’asymétrie et d’aplatissement sur la série des logarithmes des revenus (sans les clients 25, 31 et 43). On trouve :
cas = 1.083232 |
cap = 3.556773 |
Le coefficient d’asymétrie dépasse largement
la valeur limite donnée par la table (0.534). La loi normale est donc peu
vraisemblable suivant ce critère.
En conclusion, la pratique des tests n’est
pas aussi facile qu’elle le paraît. Dans le cas du test du c2, les choix doivent être effectués a priori, avant tout calcul, et il
est très possible que des tests aboutissent à des résultats
contradictoires : certains sont « meilleurs » que d’autres,
c’est-à-dire que leur puissance est supérieure pour un même risque de première
espèce : on parle alors de tests UMP.