TO BE OR NOT TO BE (vivant)

Les données médicales figurant dans l’ouvrage de Saporta et analysées dans l’étude de cas Le marché du myocarde donnent en fait les mesures médicales effectuées sur deux groupes de patients,. Le premier (patients de 1 à 51) réunit des personnes qui n’ont pas survécu à l’infarctus et le second les gens qui ont survécus à la suite de cet infarctus. Saporta analyse ce tableau par l’analyse discriminante. Nous effectuons le même traitement, dans le cadre de l’analyse factorielle discriminante, en étudiant les effets de différentes procédures telles que choix des composantes principales, de la règle d’affectation, test par la chaotisation. Le logiciel utilisé est StatPC.

Rappelons qu’il s’agit de données médicales constituées de 7 variables : fréquence cardiaque (frcar), index cardiaque (incar), index systolique (insys), pression diastolique (prdia), pression artérielle pulmonaire (papul), pression ventriculaire (pvent), et résistance pulmonaire (répul). Il n’est pas utile, pour répondre aux questions posées, de connaître précisément la nature de ces variables.

1) Effectuer l’analyse discriminante des deux groupes sur les données initiales. En déduire les moyennes des variables par groupe, les rapports de corrélation. Quelle est la variable qui discrimine le mieux les deux groupes de patients ?

2) Choisir comme règle d’affectation la régle de la distance la plus petite au centre de gravité. En déduire le tableau de classement et le pourcentage de bien-classés.

3) Tester la règle en procédant par chaotisation.

4) Le logiciel StatPC permet de sélectionner les composantes principales sur lesquelles on effectue l’analyse discriminante. Déterminer les composantes principales les plus pertinentes.

5) Effectuer l’analyse discriminante sur les composantes principales retenues. Choisir comme règle d’affectation la régle de la distance au centre de gravité, et calculer le tableau de classement et le pourcentage de bien classés. Tester cette règle par chaotisation.

6) Même question en considérant la règle fondée sur le maximum de vraisemblance (distance normalisée). Conclure.