1. description des valeurs propres.

1) On sait que la somme des valeurs propres est égale au nombre de variables considérées lorsque l’ACP est « normée », c’est-à-dire effectuée sur les valeurs centrées réduites des observations.

La somme des valeurs propres est donc égale à 6 :

2.38 + 2.12 + 0.55 + 0.41 + 0.33 + l6 = 6

On en déduit :

l6 = 0.21

Le diagramme des valeurs propres montre seuls les deux premiers axes sont significatifs :

l

%

S%

 

2.380

40

40

************************************************************

2.120

35

75

*****************************************************

0.550

9

84

*************

0.410

7

91

**********

0.330

6

97

********

0.210

4

100

*****

2) On donne ci-dessous les diagrammes des valeurs propres et leurs interprétations .

cas n°1 :

l

%

S%

 

2.326

47

47

************************************************************

2.054

41

88

****************************************************

0.423

8

96

**********

0.182

4

100

****

0.015

0

100

 

Les deux premiers axes sont interprétables. ils expliquent 88% de l’information totale contenue dans les données, et on constate une forte diminution entre la deuxième et la troisième valeur propre. La cinquième valeur propre est très faible : elle montre l’existence d’une liaison quasi linéaire entre les variables.

cas n°2 :

l

%

S%

 

3.541

39

39

************************************************************

2.126

24

63

************************************

1.510

17

80

*************************

0.632

7

87

**********

0.414

5

91

*******

0.305

3

95

*****

0.225

2

97

***

0.182

2

99

***

0.065

1

100

*

La diminution de la quatrième valeur propre par rapport à la troisième paraît élevée : on se limite aux trois premiers axes qui permettent de reconstruire 80% de la somme des carrés des distances.

cas n°3 :

 

l

%

S%

 

3.125

28

28

************************************************************

3.101

28

57

***********************************************************

1.984

18

75

**************************************

1.823

17

91

***********************************

0.541

5

96

**********

0.220

2

98

****

0.110

1

99

**

0.050

0

100

 

0.025

0

100

 

0.015

0

100

 

0.006

0

100

 

Les deux premières valeurs propres sont nettement plus grandes que les autres ; les axes asociés sont certainement significatifs, mais le premier plan ne représente que 57% de la somme des carrés des distances. On pourra donc étudier les deux axes suivants, pour obtenir plus d’information. Les axes de rang 5 et ultérieurs ne représentent vraisemblablement pas de propriété générale. Ils caractérisent des liaisons quasi linéaires entre les variables. Ces liaisons sont indépendantes les unes des autres : la matrice de corrélation, de dimension  11 x 11, est dite de « rang » 7 (11 – 4) (en mathématiques, cela signifie que 4 valeurs propres sont strictement égales à 0 ; l’égalité exacte à 0 ne se produit quasiment jamais en statistique).

cas n°4 :

l

%

S%

 

2.154

31

31

************************************************************

1.453

21

52

****************************************

1.213

17

69

*********************************

0.646

9

78

*****************

0.541

8

86

***************

0.532

8

93

**************

0.461

7

100

************

On a visiblement trois axes principaux à analyser. On note l’absence de valeurs propres très faibles : lers variables statistiques étudiées ne sont pas très liées. La matrice de corrélation est de rang 7.