Risque de seconde espèce
dans le test d’indépendance du c2

Il est difficile d’étudier le risque de seconde espèce du test d’indépendance du c2, noté b, qui est la probabilité d’accepter l’indépendance alors qu’elle est fausse. On peut toutefois procéder par simulation. La procédure est la suivante :

1)      On considère le tableau observé : il ne vérifie jamais exactement l’indépendance, même s’il ne permet pas de la rejeter pour le risque a de première espèce choisi.

2)      On simule ce tableau : on obtient ainsi un échantillon de X2 calculés sous l’hypothèse alternative définie par H1 : la répartition théorique est égale à la répartition observée. .

3)      On commet l’erreur de seconde espèce à chaque fois que l’on accepte l’indépendance. Le pourcentage d’acceptation de l’indépendance est donc l’approximation du risque de seconde espèce b.

4)      On peut poursuivre le processus en définissant successivement les hypothèses alternatives définies par les tableaux dont la probabilité critique de la valeur x2 de la statistique X2 observée est comprise entre 0 et 0.1, entre 0.1 et 0.2, entre 0.2 et 0.3 etc…La puissance pour chaque hypothèse alternative se déduit du risque de seconde espèce calculé par simulation comme précédemment, et on obtient une fonction puissance du test.

 

La figure 1 ci-dessous met en évidence tous ces éléments : pour l’obtenir, nous avons simulé un tableau de 5 lignes et 6 colonnes de somme 1000. Supposons que ce tableau donne la répartition exacte de la population de référence : dans ce cas, l’indépendance n’est pas vérifiée et doit être rejetée.

Figure 1 : estimation du risque de seconde espèce par simulation

Densité théorique du c2 (n = 20, xa2 = 31.41)

Histogramme des X2 observés

 

1)      La valeur de X2 calculée sur le tableau simulé est égale à 9.19 et conduit donc à l’acceptation de l’indépendance puisque, pour a = 0.05 et n = (5-1)(6-1) = 20, la région critique est définie par ]31.41, +¥ [. La décision est erronée, puisque la répartition observée qui est considérée comme vraie montre qu’il n’y a pas indépendance.

2)      Pour évaluer le risque de seconde espèce b, nous avons simulé ce tableau 1000 fois, obtenant ainsi 1000 valeurs de X2. L’histogramme de ces 1000 valeurs donne une approximation de la loi de X2 lorsque le tableau théorique est le tableau précédent.

3)      On peut constater sur la figure 4 que dans 60% des cas environ, le test du c2 aboutit à l’acceptation de l’indépendance alors qu’elle n’est pas vraie . Le risque de seconde espèce est donc de l’ordre de 0.60.

4)      Le risque de seconde espèce sera d’autant plus élevé que le tableau simulé montre une proximité avec l’indépendance et que la valeur de X2 sur ce tableau est faible.

 

On ne peut jamais être certain que la décision prise - acceptation ou rejet - est la bonne.

Ce texte utilise un programme de simulation publié dans l’ouvrage Introduction aux tests statistiques. Enseignement Assisté par Ordinateur  (T. Foucart, Technip, 1991).