1) On sait que la somme des valeurs propres est égale au nombre de variables considérées lorsque l’ACP est « normée », c’est-à-dire effectuée sur les valeurs centrées réduites des observations.
La somme des valeurs propres est donc égale à 6 :
2.38 + 2.12 + 0.55 + 0.41 + 0.33 + l6 = 6
On en déduit :
l6 = 0.21 |
Le diagramme des valeurs propres montre seuls les deux premiers axes sont significatifs :
l |
% |
S% |
|
2.380 |
40 |
40 |
************************************************************ |
2.120 |
35 |
75 |
***************************************************** |
0.550 |
9 |
84 |
************* |
0.410 |
7 |
91 |
********** |
0.330 |
6 |
97 |
******** |
0.210 |
4 |
100 |
***** |
2) On donne ci-dessous les diagrammes des valeurs propres et leurs interprétations .
cas n°1 :
l |
% |
S% |
|
2.326 |
47 |
47 |
************************************************************ |
2.054 |
41 |
88 |
**************************************************** |
0.423 |
8 |
96 |
********** |
0.182 |
4 |
100 |
**** |
0.015 |
0 |
100 |
|
Les deux premiers axes sont interprétables. ils expliquent 88% de l’information totale contenue dans les données, et on constate une forte diminution entre la deuxième et la troisième valeur propre. La cinquième valeur propre est très faible : elle montre l’existence d’une liaison quasi linéaire entre les variables.
cas n°2 :
l |
% |
S% |
|
3.541 |
39 |
39 |
************************************************************ |
2.126 |
24 |
63 |
************************************ |
1.510 |
17 |
80 |
************************* |
0.632 |
7 |
87 |
********** |
0.414 |
5 |
91 |
******* |
0.305 |
3 |
95 |
***** |
0.225 |
2 |
97 |
*** |
0.182 |
2 |
99 |
*** |
0.065 |
1 |
100 |
* |
La diminution de la quatrième valeur propre par rapport à la troisième paraît élevée : on se limite aux trois premiers axes qui permettent de reconstruire 80% de la somme des carrés des distances.
cas n°3 :
l |
% |
S% |
|
3.125 |
28 |
28 |
************************************************************ |
3.101 |
28 |
57 |
*********************************************************** |
1.984 |
18 |
75 |
************************************** |
1.823 |
17 |
91 |
*********************************** |
0.541 |
5 |
96 |
********** |
0.220 |
2 |
98 |
**** |
0.110 |
1 |
99 |
** |
0.050 |
0 |
100 |
|
0.025 |
0 |
100 |
|
0.015 |
0 |
100 |
|
0.006 |
0 |
100 |
|
Les deux premières valeurs propres sont nettement plus grandes que les autres ; les axes asociés sont certainement significatifs, mais le premier plan ne représente que 57% de la somme des carrés des distances. On pourra donc étudier les deux axes suivants, pour obtenir plus d’information. Les axes de rang 5 et ultérieurs ne représentent vraisemblablement pas de propriété générale. Ils caractérisent des liaisons quasi linéaires entre les variables. Ces liaisons sont indépendantes les unes des autres : la matrice de corrélation, de dimension 11 x 11, est dite de « rang » 7 (11 – 4) (en mathématiques, cela signifie que 4 valeurs propres sont strictement égales à 0 ; l’égalité exacte à 0 ne se produit quasiment jamais en statistique).
cas n°4 :
l |
% |
S% |
|
2.154 |
31 |
31 |
************************************************************ |
1.453 |
21 |
52 |
**************************************** |
1.213 |
17 |
69 |
********************************* |
0.646 |
9 |
78 |
***************** |
0.541 |
8 |
86 |
*************** |
0.532 |
8 |
93 |
************** |
0.461 |
7 |
100 |
************ |
On a visiblement trois axes principaux à analyser. On note l’absence de valeurs propres très faibles : lers variables statistiques étudiées ne sont pas très liées. La matrice de corrélation est de rang 7.