Téléphones
mobiles
Nous reprenons ici les données sur les téléphones mobiles que nous avons analysées par ACP dans une autre application.
Rappelons qu’il s’agit des résultats d’une enquête auprès d’un échantillon de 100 personnes auxquelles on a posé la question suivante :
Notez de 1 (pas d’importance) à 5 (très important) les qualités d’un téléphone mobile ci-dessous :
Forme (For)
Robustesse (Rob)
Légèreté (Lég)
Plusieurs couleurs (Cou)
Petite taille (Pet)
Mémoire importante (Mém)
Fonctions nombreuses (Fon)
Facilité d’emploi (Fac)
Connexion Internet (Int)
à la Mode (Mod)
Les données figurent sur le fichier MOBILES.DAT (fichier de paramètres MOBILES.PAR). Ce sont des mesures quantitatives positives, qui peuvent être techniquement analysées par l’analyse factorielle des correspondances.
Pour la première question, on choisira l’option Tris croisés et tris à plat du programme Dépouillement d’enquêtes. Pour les suivantes, on utilisera les programmes d’analyse en composantes principales et d’analyse factorielle des correspondances de StatPC.
1) Donner la répartition des notes de chaque critère. Sélectionner les critères sur lesquels les avis sont les plus partagés en examinant les diagrammes.
2) On donne ci-dessous un extrait du tableau de données :
n° |
For |
Rob. |
Lég |
Cou |
Pet |
Mém |
Fon |
Fac |
Int |
Mod |
30 |
2 |
3 |
4 |
1 |
5 |
2 |
4 |
5 |
5 |
2 |
32 |
3 |
3 |
3 |
3 |
4 |
3 |
4 |
4 |
4 |
4 |
47 |
4 |
4 |
2 |
5 |
3 |
3 |
3 |
4 |
2 |
5 |
53 |
3 |
3 |
4 |
3 |
2 |
3 |
3 |
3 |
2 |
4 |
77 |
2 |
5 |
5 |
4 |
5 |
3 |
2 |
5 |
1 |
4 |
87 |
1 |
1 |
2 |
3 |
2 |
4 |
5 |
3 |
4 |
1 |
Calculer les carrés des distances d2(30, 77), d2(30, 87) considérées en AFC (distances du c2) et en ACP (distances normées). De quel individu 77 ou 87 l’individu 30 est-il le plus proche en AFC ? en ACP ?
Calculer dans chaque cas les carrés des distances d2(53,77), d2(53, 87). En déduire les distances, et les représenter sous la forme d’un triangle. Ces deux analyses donnent-elles les mêmes proximités ?
3) On analyse maintenant les réponses des individus X, Y :
n° |
For |
Rob. |
Lég |
Cou |
Pet |
Mém |
Fon |
Fac |
Int |
Mod |
X |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
Y |
5 |
5 |
5 |
5 |
5 |
5 |
5 |
5 |
5 |
5 |
Leurs critères de choix d’un dentifrice sont-ils différents ? Existe-t-il en ACP deux individus dont la distance soit supérieure à celle de X et Y ? Que peut-on dire de la distance du c2 entre X et Y ?
4) Quel est le nombre de facteurs principaux a priori
significatifs en analyse factorielle des correspondances ? Permettent-ils
une bonne conservation des distances ?
5) Représenter les profils colonnes sur le
plan principal 1 x 2. Proposer une interprétation de chaque axe. Vérifier que la moyenne de leurs coordonnées
sur un axe est égale à 0. Quelle est leur variance ?
6) On étudie maintenant les profils
lignes. Représenter graphiquement le plan principal 1 x 2. Quel genre de
téléphone recherche l’individu n° 6 ? Le n° 97 ? Reconstituer
approximativement les notes attribuées aux dix critères par ces deux individus.
7) Quel est le profil ligne caractérisé
par l’origine des axes (on précisera les valeurs numériques) ? Quel est
l’individu caractérisé par l’origine des axes en ACP ?
8) Calculer les coordonnées des individus X et Y précédents
(3e question) sur les trois premiers axes principaux obtenus par
analyse des correspondances et par analyse en composantes principales. Expliquer les résultats.
9) Examiner les poids des individus. Expliquer pourquoi les
deux analyses donnent des résultats comparables.
correction
1) Le tri à plat des
questionnaires donne la répartition des réponses suivant les notes atribuées à
chaque critère :
|
1 |
2 |
3 |
4 |
5 |
Forme |
4 |
29 |
40 |
16 |
11 |
Robuste |
3 |
15 |
37 |
30 |
15 |
Léger |
1 |
22 |
30 |
32 |
15 |
Couleurs |
1 |
17 |
48 |
26 |
8 |
Petit |
1 |
13 |
34 |
43 |
9 |
|
1 |
2 |
3 |
4 |
5 |
Mémoire |
0 |
6 |
52 |
37 |
5 |
Fonctions |
1 |
11 |
44 |
36 |
8 |
Facilité |
1 |
7 |
25 |
47 |
20 |
Internet |
16 |
33 |
14 |
31 |
6 |
Mode |
7 |
24 |
2 |
55 |
12 |
Il n’y a guère que deux critères dont
l’importance est appréciée très diversement :
·
l’accès à internet :
note |
% |
|
1 |
16 |
******************************** |
2 |
33 |
***************************************************************** |
3 |
14 |
**************************** |
4 |
31 |
************************************************************* |
5 |
6 |
************ |
Les personnes interrogées
émettent un avis assez diversifié sur l’importance de l’accès à internet :
le tiers environ le considère comme important ou peu important.
·
à la mode :
note |
% |
|
1 |
7 |
******** |
2 |
24 |
**************************** |
3 |
2 |
** |
4 |
55 |
***************************************************************** |
5 |
12 |
************** |
On constate que les avis
sont encore plus partagés sur le critère à la mode : très peu de personnes
le considèrent come moyennement important.
2) Les carrés des
distances sont donnés dans les tableaux ci-dessous :
n° |
30 |
32 |
47 |
53 |
77 |
30 |
0 |
|
|
|
|
32 |
0.128 |
0 |
|
|
|
47 |
0.453 |
0.122 |
0 |
|
|
53 |
0.319 |
0.087 |
0.092 |
0 |
|
77 |
0.351 |
0.207 |
0.182 |
0.147 |
0 |
87 |
0.330 |
0.250 |
0.507 |
0.406 |
0.655 |
Carrés des distances du c2 (AFC)
n° |
30 |
32 |
47 |
53 |
77 |
30 |
0 |
|
|
|
|
32 |
15.716 |
0 |
|
|
|
47 |
53.271 |
14.580 |
0 |
|
|
53 |
36.239 |
11.800 |
14.580 |
0 |
|
77 |
38.938 |
24.750 |
24.35*9 |
26.569 |
0 |
87 |
42.919 |
25.499 |
47.835 |
28.899 |
71.998 |
Carrés des distances normées (ACP)
En AFC, l’individu 30 est plus proche de l’individu 87 que de l’individu 77. En ACP, c’est le contraire : l’ordre des distances est modifié.
Les distances entre les individus 53, 77 et 79 sont les suivantes :
n° |
53 |
77 |
87 |
53 |
0 |
|
|
77 |
0.383 |
0 |
|
87 |
0.637 |
0.809 |
0 |
distances du c2 (AFC)
n° |
53 |
77 |
87 |
53 |
0 |
|
|
77 |
5.155 |
0 |
|
87 |
5.376 |
8.485 |
0 |
distances normées (ACP)
Nous donnons ci-dessous les deux triangles représentant ces distances :
On constate que ces deux triangles ne sont pas homothétiques : le choix de la distance exerce une influence forte sur les proximités.
3) Pour les individus X et Y, tous les critères proposés ont la même importance. On peut penser que les notes ne sont pas caractéristiques, qu’elles sont mal choisies : tout autre critère supplémentaire serait considéré comme plus important pour X, et moins important pour Y : cela n’a guère de sens, puisque c’est par rapport à des critères ne figurant pas dans la liste proposée que ces deux individus se déterminent. n’importe lequel pour X, aucun pour Y.
Il n’existe pas en ACP deux individus dont la distance soit supérieure à celle de X et Y, puisque pour chaque modalité, l’écart entre les observations est le plus grand possible. La distance du c2 entre X et Y est celle de leurs profils : leurs profils étant les mêmes, cette distance est nulle.
En conclusion, ces deux individus X et X sont les éloignés possibles en ACP et confondus en AFC. Le choix de la méthode repose sur la décision de les considérer comme opposés ou identiques .
4) Nous donnons ci-dessous le diagramme des valeurs propres :
l |
% |
% cum. |
************************************************** |
0.0360 |
46 |
46 |
************************************************** |
0.0201 |
26 |
72 |
*************************** |
0.0067 |
9 |
81 |
********* |
0.0046 |
6 |
87 |
****** |
0.0035 |
5 |
91 |
**** |
0.0022 |
3 |
94 |
*** |
0.0018 |
2 |
96 |
** |
0.0016 |
2 |
98 |
** |
0.0012 |
2 |
100 |
* |
On se limite à l’étude des deux premiers axes principaux. Ils conservent plus de 70% de la somme des carrés des distances, ce qui est satisfaisant.
5) Les profils colonnes se regroupent de façon assez claire :
axe horizontal 1 (l1 = 0.036), axe vertical 2 (l2 = 0.020)
L’axe 1 caractérise le degré d’utilisation de l’appareil : utilisation de moins en moins pointue lorsque l’on parcourt l’axe de la gauche vers la droite.
L’axe 2 montre un critère indépendant du précédent : il oppose la commodité (léger, petit, facile à utiliser à l’esthétique de l’appareil).
Le tableau ci-dessous donne les coordonnées des profils colonnes sur les trois premiers axes principaux.
|
poids |
axe 1 |
axe 2 |
axe 3 |
|||||||
|
|
c1(j) |
cos2 |
cont. |
c2(j) |
cos2 |
cont. |
c3(j) |
cos2 |
cont. |
|
Forme |
0.0906 |
-0.041 |
0.020 |
0.4 |
-0.239 |
0.686 |
25.8 |
0.014 |
0.002 |
0.2 |
|
Robus |
0.1020 |
0.200 |
0.683 |
11.4 |
0.005 |
0.000 |
0.0 |
-0.050 |
0.043 |
3.8 |
|
Léger |
0.1017 |
0.167 |
0.323 |
7.9 |
0.178 |
0.367 |
16.1 |
-0.143 |
0.237 |
31.2 |
|
Coule |
0.0972 |
0.040 |
0.028 |
0.4 |
-0.171 |
0.512 |
14.1 |
0.051 |
0.045 |
3.7 |
|
Petit |
0.1041 |
0.107 |
0.197 |
3.3 |
0.129 |
0.289 |
8.7 |
0.131 |
0.297 |
26.8 |
|
Mém |
0.1026 |
-0.135 |
0.398 |
5.2 |
0.047 |
0.049 |
1.2 |
-0.090 |
0.176 |
12.4 |
|
Fonct |
0.1020 |
-0.252 |
0.814 |
18.0 |
0.063 |
0.051 |
2.0 |
0.040 |
0.020 |
2.4 |
|
Facil |
0.1137 |
0.141 |
0.365 |
6.3 |
0.111 |
0.227 |
7.0 |
0.097 |
0.172 |
15.9 |
|
Inter |
0.0836 |
-0.434 |
0.925 |
43.7 |
0.052 |
0.013 |
1.1 |
-0.016 |
0.001 |
0.3 |
|
Mode |
0.1026 |
0.109 |
0.151 |
3.4 |
-0.217 |
0.601 |
24.0 |
-0.045 |
0.026 |
3.2 |
|
La moyenne des coordonnées sur chaque axe est effectivement égale à 0 à condition de pondérer les coordonnées par les poids. Les variances sont les valeurs propres : la pondération est là aussi indispensable pour vérifier numériquement cette propriété.
6) Sur le plan 1 x 2 ci-dessous, les individus 6 et 97 sont visiblement à l’opposé l’un de l’autre. L’individu 6 préfère les appareils très modernes, à la mode, “branchés”, inversement à l’individu 97 qui privilégie la simplicité et la commodité.
Les notes données par ces deux individus sont les suivantes :
n° |
For |
Rob. |
Lég |
Cou |
Pet |
Mém |
Fon |
Fac |
Int |
Mod |
6 |
4 |
2 |
2 |
4 |
1 |
4 |
5 |
1 |
5 |
4 |
97 |
1 |
3 |
4 |
2 |
4 |
3 |
2 |
5 |
1 |
1 |
axe horizontal 1 (l1 = 0.036), axe vertical 2 (l2 = 0.020)
7) Les profils caractérisés par l’origine des axes en analyse factorielle des correspondances sont les profils marginaux. En ce qui concerne les profils lignes, les termes marginaux sont les sommes des termes des colonnes. Le centre de gravité est défini par le profil déduit de ces termes marginaux :
n° |
For |
Rob. |
Lég |
Cou |
Pet |
Mém |
Fon |
Fac |
Int |
Mod |
Marge |
0.091 |
0.102 |
0.102 |
0.097 |
0.104 |
0.103 |
0.102 |
0.114 |
0.084 |
0.103 |
En analyse en composantes principales, l’origine des axes caractérise l’individu défini par les moyennes des variables initiales.
n° |
For |
Rob. |
Lég |
Cou |
Pet |
Mém |
Fon |
Fac |
Int |
Mod |
Moyenne |
3.01 |
3.39 |
3.38 |
3.23 |
3.46 |
3.41 |
3.39 |
3.78 |
2.78 |
3.41 |
On constate sans difficulté que l’individu caractérisé par l’origine des axes est le même dans les deux analyses : il suffit de calculer le profil du second pour obtenir le premier.
8) Le calcul donne les résultats suivants (les coordonnées de X et de Y sur les axes principaux obtenus par AGC sont égales) :
|
axe 1 |
axe 2 |
axe 3 |
|||
|
c1(j) |
cos2 |
c2(j) |
cos2 |
c3(j) |
cos2 |
X,Y(AFC) |
-0.052 |
0.427 |
-0.028 |
0.123 |
-0.015 |
0.037 |
X (ACP) |
1.745 |
0.045 |
2.365 |
0.083 |
3.155 |
0.148 |
Y (ACP) |
-0.557 |
0.009 |
-2.274 |
0.158 |
-2.259 |
0.156 |
On observe que les individus X et Y ont des coordonnées
complètement opposées en ACP, alors qu’ils sont confondus en AFC. On retrouve
ici les résultats de la 3e question.
9) Les deux analyses, bien qu’elles représentent des
distances différentes comme on a pu le constater précédemment, donnent des interprétations globales
analogues. On retrouve les mêmes groupes de variables, de critères, et
l’interprétation des axes est la même. Le cas précédent de deux points
totalement opposés en ACP et confondus en AFC ne se produit pas en fait. On
peut le vérifier en examinant les moyennes des notes attribuées à l’ensemble
des critères par chaque individu.
Dans le cas de X cette moyenne est égale à 1, dans le cas de
Y à 5. Or, parmi les observations, la plus petite moyenne est égale à 2.6 et la
plus grande à 3.9 : il n’existe donc pas dans les données d’individus
analogues à X et à Y.
La moyenne des notes données par un individu est
proportionnelle à son poids, et par suite, les poids varient peu, contrairement
à ceux de X et de Y. Dans ces conditions, les différences entre les deux
analyses sont relativement minces.
Il est donc indispensable, devant de telles données,
d’examiner les poiids des individus avant de choisir la méthode d’analyse.