puissance du test de fisher

Le logiciel StatPC offre la possibilité d’effectuer un test de Fisher sur le coefficient de corrélation en vérifiant que les hypothèses nécessaires à son application sont satisfaites.

La démarche est la suivante :

·      on vérifie la normalité des distributions des variables étudiées par des tests d’ajustement du c2 programmés dans StatPC;

·      on examine la représentation graphique des couples d’observations ;

·      on calcule le coefficient de corrélation, la statistique F et la probabilité critique ;

·      on décide d’accepter ou rejeter l’hypothèse de nullité du coefficient de corrélation suivant les résultats précédents et le risque de première espèce choisi.

 

Cette démarche a été suivie dans le chapitre 5 pour analyser la liaison entre les revenus et l’âge des clients d’Euromarket. On pourra la suivre pour analyser la liaison entre deux séries de notes données aux voitures ou entre deux variables quelconques des données Euromarket.

 

Nous proposons ici l’application Puissance du test du F dans le même esprit : on peut, par simulation d’un grand nombre d’échantillons de couples suivant la loi binormale, obtenir une approximation du risque de seconde espèce b ou, ce qui est équivalent, de la puissance p du test du F.

Comme on peut le lire dans la fenêtre ci-dessous, nous avons simulé 100 séries de 50 couples chacun. Les conditions d’application du test sont vérifiées a priori : la loi des couples simulés est la loi binormale par construction.

En effectuant le test du F sur ces séries de couples pour un risque de première espèce égal à 0.05, on obtient :

L’étoile placée dans certains cas à droite de l’écran indique les échantillons pour lesquels le test a provoqué le refus de l’hypothèse de nullité du coefficient de corrélation. Cette décision est juste puisque le coefficient réel est égal à 0.2. Le pourcentage de ces échantillons par rapport aux 100 simulés donne une approximation de la puissance, de l’ordre donc de 0.29, ou du risque de seconde espèce b, égal à la probabilité d’accepter l’hypothèse nulle alors qu’elle est fausse, de l’ordre de 0.71. 

La puissance n’est guère élevée, mais cela s’explique par le fait que la loi du F dans le cas d’un coefficient de corrélation nulle n’est pas très différente de la loi du F dans le cas d’un coefficient de corrélation égal à 0.2,comme le montre l’histogramme ci-dessous :

On remplira le tableau ci-dessous à l’aide du logiciel, pour un coefficient de corrélation théorique fixé : 

 

nombre de couples

% de rejet

a = 0.01

% de rejet

a = 0.05

% de rejet

a = 0.10

100

 

29%

 

200

 

 

 

300

 

 

 

400

 

 

 

500

 

 

 

600

 

 

 

700

 

 

 

800

 

 

 

900

 

 

 

1000

 

 

 

 

Le terme 29% correspond, comme nous l’avons expliqué, au pourcentage de rejets de la nullité du coefficient de corrélation lorsque sa valeur théorique est égale à 0.2 et que l’on dispose de 50 observations.

 

On pourra ainsi répondre à des questions du type suivant : combien faut-il de couples pour qu’on rejette l’hypothèse de nullité dans au moins un cas sur deux, lorsque le coefficient de corrélation est égal à 0.2 ?