TRICHEUR !

L’application Tricheur ! est l’application du test d’ajustement du c2 à la loi uniforme discrète sur l’ensemble {1, 2, …, 6}. Cette loi est en effet celle de la variable X définie par le numéro obtenu en jetant un dé à six faces.

Deux situations sont envisagées : 

le dé est équilibré : avec quelle fréquence va-t-on le déclarer pipé ?

le dé est pipé : avec quelle fréquence va-t-on le déclarer équilibré ?

 

Le jeu est a priori équitable. Il est naturel de considérer que le dé est équilibré, et que les faces ont toutes la même probabilité 1/6. C’est l’hypothèse nulle.

L’hypothèse alternative est donc que le dé est pipé. Mais on ne connaît pas les probabilités de chaque face dans ce cas-là..

 

Déclarer le dé pipé alors qu’il est équilibré, c’est commettre l’erreur de première espèce, et remettre en cause la bonne foi de l’adversaire : c’est ennuyeux. Déclarer le dé équilibré alors qu’il est pipé constitue l’erreur de seconde espèce : on garde confiance en l’adversaire même si on a perdu.

Le choix du risque de première espèce dépend donc de la confiance que l’on a en l’adversaire : si on le considère comme intègre, insoupçonnable, ou si on risque sa vie en l’accusant de tricher, on choisira un risque de première espèce très faible, a = 0.001 par exemple, et on ne l’accusera de tricher que si les résultats sont très bizarres. Inversement, si on n’a guère confiance en son honnêteté, on choisira un risque de première espèce relativement élevé, a = 0.1 par exemple, pour s’abstenir de jouer le cas échéant.

Ce risque de première espèce donne alors la règle de décision, sous la forme de la région critique ou de la probabilité critique. Le degré de liberté est égal à 6-1 = 5.

 

risque

Région critique

0.100

[ 9.236, +¥ [

0.050

[11.070, +¥ [

0.025

[12.832, +¥ [

0.010

[15.086, +¥ [

0.005

[16.750, +¥ [

0.001

[20.515, +¥ [

 

Il est impossible ici d’évaluer mathématiquement le risque de seconde espèce, sauf si l’on connaît précisément les probabilités théoriques de chaque face sous l’hypothèse alternative, ce qui est le cas lorsque la simulation est faite par ordinateur.

L’application donne le détail des calculs de la statistique X2 que l’on pourra effectuer à l’aide d’une simple calculatrice. Nous avons lancé ci-dessous un dé équilibré :

 

Pour lancer un dé pipé, il faut définir les probabilités théoriques de chaque  face. Par exemple :

Face 1 : 0.25, face 2 : 0.125, face 3 : 0.125, face 4 : 1/6, face 5 : 1/6, face 6 : 1/6

Le dé n’est pas très déséquilibré. Combien de fois faut-il le lancer pour que l’on puisse détecter qu’il est pipé, pour un risque de première espèce de 0.05 ?

Voici le résultat de 100 lancers :

 

 

Les 100 lancers n’ont pas suffi. Essayons 200 lancers :

 

 

Cela n’a pas suffi non plus pour un risque de 0.05. Mais on ne peut se limiter à cette approche : il arrivera toujours que l’on juge le dé équilibré quel que soit le nombre de fois qu’on le lance. Il faut étudier dans quel pourcentage on est conduit à la bonne décision. C’est pour cela que l’on recommence l’expérience dans les mêmes conditions un certain nombre de fois, en comptant le nombre de fois que l’on détecte que le dé est pipé. On remplit alors le tableau suivant, pour un nombre fixé de séries de lancers :

 

nombre de lancers

% de détection

a = 0.01

% de détection

a = 0.05

% de détection

a = 0.10

100

 

 

 

200

 

72.8%

 

300

 

 

 

400

 

 

 

500

 

 

 

600

 

 

 

700

 

 

 

800

 

 

 

900

 

 

 

1000

 

 

 

 

La valeur ci-dessus a été obtenue en effectuant 1000 séries de 200 lancers ; elle signifie qu’on détecte un dé pipé suivant la loi de probabilité définie par :

 

p1 = 0.25

p2 =  0.125

p3 = 0.125

p4 = 1/6

p5 = 1/6

p6= 1/6

dans 72.8% des cas environ lorsqu’on lance le dé 200 fois.

Ces pourcentages correspondent à la notion de puissance p. Ils donnent le pourcentage de rejets de l’hypothèse nulle (dé équilibré) dans la situation de l’hypothèse alternative (dé pipé). Ils se déduisent du risque de seconde espèce b par la relation élémentaire :

p = 1 - b

On constatera que la puissance augmente avec le nombre de lancers et diminue avec le risque de première espèce.

On remarquera aussi que plus les probabilités de chaque face sont différentes de 1/6, plus la puissance augmente. On peut le vérifier en représentant la puissance en fonction du carré de la distance entre les densités réelles et supposées.