LE
LOOK DES FUMEURS
Cette étude de cas est
extraite de l’ouvrage de J.P. Benzecri « Analyse des données. Tome 2 :
l’analyse des correspondances ». Il s’agit d’une étude réelle, dont nous
avons complété les objectifs à des fins pédagogiques. Parmi les questions, qui
sont toutes de notre initiative, certaines ne concernent pas spécifiquement
l’analyse statistique ; elles sont destinées à faciliter l’interprétation des
résultats de l’A.F.C..
Une enquête a été effectuée
auprès de cent fumeurs afin de choisir les noms de deux nouvelles marques de
cigarettes. La première marque est destinée à une clientèle masculine : l’homme
ciblé est un connaisseur distingué, raffiné mais viril, de niveau
socio-économique élevé. La seconde vise un public féminin, élégant, assuré,
dynamique.
Douze marques possibles ont
été retenues : Orly (Orl), Alezan (Ale), Corsaire (Cor), Directoire (Dir),
Ducat (Duc), Fontenoy (Fon), Icare (Ica), Zodiac (Zod), Pavois (Pav), Cocker
(Coc), Escale (Esc), Hôtesse (Hôt). Pour évaluer leur image auprès du public,
onze attributs ont été proposés aux fumeurs : vieillot-désuet (V-D),
nouveau-riche (N-R), sobre-élégant (S-E), cocasse-ridicule (C-R), racé (Rac),
mièvre (Miè), distingué (Dis), vulgaire-commun (V-C), pour un homme (PuH), pour
une femme (PuF), pour une petite nature (PPN).
Chaque personne interrogée
devait successivement pour chaque attribut, désigner une ou plusieurs marques
lui correspondant.
Le tableau de données est le
suivant :
|
Orl |
Ale |
Cors |
Dir |
Duc |
Fon |
Ica |
Zod |
Pav |
Coc |
Esc |
Hôt |
Vieillot-désuet |
1 |
2 |
14 |
38 |
18 |
10 |
9 |
5 |
9 |
4 |
0 |
1 |
Nouveau-riche |
20 |
9 |
1 |
11 |
10 |
9 |
1 |
1 |
20 |
9 |
7 |
12 |
Sobre-élégant |
9 |
23 |
1 |
15 |
7 |
11 |
6 |
2 |
7 |
12 |
3 |
17 |
Cocasse-ridicule |
1 |
3 |
15 |
15 |
6 |
5 |
12 |
18 |
4 |
25 |
2 |
2 |
Racé |
4 |
33 |
7 |
8 |
3 |
6 |
6 |
4 |
5 |
15 |
5 |
3 |
Mièvre |
3 |
9 |
1 |
7 |
7 |
5 |
12 |
9 |
6 |
9 |
6 |
13 |
Distingué |
11 |
9 |
1 |
17 |
4 |
21 |
6 |
1 |
5 |
4 |
5 |
27 |
Vulgaire-commun |
4 |
4 |
32 |
2 |
6 |
0 |
9 |
7 |
3 |
10 |
12 |
7 |
Pour un Homme |
9 |
12 |
23 |
4 |
7 |
13 |
5 |
5 |
10 |
5 |
13 |
9 |
Pour une Femme |
9 |
3 |
9 |
8 |
4 |
2 |
6 |
8 |
1 |
6 |
23 |
33 |
Pour une Petite nature |
7 |
5 |
2 |
7 |
11 |
2 |
6 |
11 |
9 |
24 |
10 |
5 |
1) Le tableau de données
est-il un tableau de contingence ? Quelles sont les marques les plus
fréquemment citées ? Que signifie le fait qu’elles soient le plus fréquemment
citées ? Que peut-on dire des attributs ?
2) Les publics visés ont-ils des points communs ? Quels sont les attributs correspondants ? Pourquoi a-t-on proposé des attributs ne leur correspondant pas ?
3) On donne en annexe les
distances du c² entre les marques. Quelles sont les marques dont les distances sont
les plus faibles ? Les plus élevées ? Comment interpréter ces résultats ?
4) En examinant les valeurs
propres et leur diagramme, déterminer les axes principaux qu’il faut conserver
dans les analyses.
5) A l’aide du plan 1x2,
expliquer la différence entre les marques les plus distantes les unes des
autres, et la ressemblance entre les marques les plus proches. Quelles sont les
marques bien représentées sur le plan 1x 2 (dont le cosinus carré est supérieur
à 0.5) ? Quelles sont les marques
importantes dans l’interprétation des axes 1 et 2 ?
6) Que peut-on dire des
attributs ? De quel côté de l’axe 1 se trouvent les marques qui correspondent
aux publics visés?
7) Quelle interprétation
peut-on proposer à l’attribut « Pour une Femme » tel qu’il apparaît
le long de l’axe 2 ? De l’axe 4 ?
8) Que peut-on dire de l’axe
5 ?
ANNEXE : Résultats numériques de l’A.F.C.
|
Orl |
Ale |
Cor |
Dir |
Duc |
Fon |
Ica |
Zod |
Pav |
Coc |
Esc |
Hôt |
Orl |
0.000 |
|
|
|
|
|
|
|
|
|
|
|
Ale |
1.278 |
0.000 |
|
|
|
|
|
|
|
|
|
|
Cor |
2.213 |
2.479 |
0.000 |
|
|
|
|
|
|
|
|
|
Dir |
1.358 |
1.684 |
1.972 |
0.000 |
|
|
|
|
|
|
|
|
Duc |
0.883 |
1.515 |
1.396 |
0.327 |
0.000 |
|
|
|
|
|
|
|
Fon |
0.699 |
1.118 |
2.146 |
0.677 |
0.833 |
0.000 |
|
|
|
|
|
|
Ica |
1.287 |
1.252 |
1.076 |
0.704 |
0.466 |
0.958 |
0.000 |
|
|
|
|
|
Zod |
1.726 |
1.972 |
1.305 |
1.291 |
0.830 |
1.747 |
0.297 |
0.000 |
|
|
|
|
Pav |
0.333 |
1.251 |
1.958 |
0.889 |
0.363 |
0.736 |
0.981 |
1.363 |
0.000 |
|
|
|
Coc |
1.193 |
1.172 |
1.644 |
1.211 |
0.722 |
1.413 |
0.464 |
0.295 |
0.901 |
0.000 |
|
|
Esc |
0.833 |
1.775 |
1.287 |
1.899 |
1.170 |
1.604 |
0.971 |
1.086 |
1.290 |
1.188 |
0.000 |
|
Hôt |
0.651 |
1.665 |
2.378 |
1.475 |
1.356 |
0.889 |
1.075 |
1.641 |
1.386 |
1.601 |
0.592 |
0.000 |
Distances du c2 entre les marques
Inertie
totale: .5770398
|
l |
%exp |
%cumulé |
|
1 |
0.170 |
29 |
29 |
************************************************** |
2 |
0.134 |
23 |
53 |
*************************************** |
3 |
0.102 |
18 |
70 |
***************************** |
4 |
0.076 |
13 |
83 |
********************** |
5 |
0.057 |
10 |
93 |
**************** |
6 |
0.021 |
4 |
97 |
****** |
7 |
0.009 |
2 |
99 |
** |
8 |
0.005 |
1 |
99 |
* |
9 |
0.003 |
0 |
100 |
|
10 |
0.000 |
0 |
100 |
|
11 |
0.000 |
0 |
100 |
|
Inerties expliquées par les
axes (valeurs propres)
|
|
|
axe 1 |
|
|
axe 2 |
|
|
axe 3 |
|
|
axe 4 |
|
|
axe 5 |
|
|
poids |
Coord. |
cos² |
Cont |
coord. |
cos² |
cont |
coord. |
cos² |
cont |
coord. |
cos² |
cont |
coord. |
cos² |
cont |
V-D
|
0.096
|
0.204
|
0.045
|
2.3
|
0.687
|
0.507
|
33.7
|
-0.592
|
0.377
|
32.9
|
0.158
|
0.027
|
3.1
|
-0.074
|
0.006
|
0.9
|
N-R |
0.095 |
-0.480 |
0.402 |
12.8 |
0.056 |
0.005 |
0.2 |
-0.064 |
0.007 |
0.4 |
-0.010 |
0.000 |
0.0 |
0.570 |
0.568 |
53.8 |
S-E
|
0.097
|
-0.428
|
0.637
|
10.5
|
0.158
|
0.087
|
1.8
|
0.209
|
0.151
|
4.2
|
0.058
|
0.012
|
0.4
|
-0.142
|
0.070
|
3.4
|
C-R |
0.093 |
0.616 |
0.598 |
20.8 |
0.273 |
0.118 |
5.2 |
0.081 |
0.010 |
0.6 |
-0.314 |
0.156 |
12.1 |
-0.115 |
0.021 |
2.2 |
Rac |
0.085 |
-0.111 |
0.017 |
0.6 |
0.213 |
0.062 |
2.9 |
0.737 |
0.743 |
45.5 |
0.280 |
0.107 |
8.8 |
-0.172 |
0.041 |
4.4 |
Miè |
0.075 |
-0.044 |
0.009 |
0.1 |
0.000 |
0.000 |
0.0 |
0.087 |
0.035 |
0.6 |
-0.291 |
0.389 |
8.4 |
-0.168 |
0.130 |
3.7 |
Dis |
0.096 |
-0.610 |
0.640 |
20.9 |
-0.063 |
0.007 |
0.3 |
-0.283 |
0.138 |
7.5 |
0.036 |
0.002 |
0.2 |
-0.241 |
0.100 |
9.7 |
V-C |
0.083 |
0.769 |
0.648 |
28.8 |
-0.431 |
0.204 |
11.5 |
-0.030 |
0.001 |
0.1 |
0.337 |
0.124 |
12.4 |
0.059 |
0.004 |
0.5 |
PuH |
0.099 |
0.117 |
0.046 |
0.8 |
-0.236 |
0.188 |
4.1 |
-0.009 |
0.000 |
0.0 |
0.404 |
0.549 |
21.3 |
0.161 |
0.087 |
4.5 |
PuF |
0.096 |
-0.101 |
0.014 |
0.6 |
-0.744 |
0.742 |
39.9 |
-0.224 |
0.067 |
4.8 |
-0.234 |
0.073 |
6.9 |
-0.175 |
0.041 |
5.1 |
PPN |
0.085 |
0.187 |
0.083 |
1.8 |
0.082 |
0.016 |
0.4 |
0.206 |
0.101 |
3.6 |
-0.485 |
0.558 |
26.4 |
0.281 |
0.187 |
11.8 |
|
|
|
axe 1 |
|
|
axe 2 |
|
|
axe 3 |
|
|
axe 4 |
|
|
axe 5 |
|
|
poids |
coord. |
Cos2 |
Cont. |
coord. |
Cos2 |
Cont. |
coord. |
Cos2 |
Cont. |
coord. |
Cos2 |
Cont. |
coord. |
Cos2 |
Cont. |
Orl |
0.0672 |
-0.478 |
0.466 |
9.0 |
-0.222 |
0.100 |
2.5 |
-0.024 |
0.001 |
0.0 |
0.013 |
0.000 |
0.0 |
0.438 |
0.390 |
22.5 |
Ale |
0.0965 |
-0.354 |
0.148 |
7.1 |
0.156 |
0.029 |
1.8 |
0.726 |
0.623 |
50.0 |
0.345 |
0.140 |
15.1 |
-0.184 |
0.040 |
5.7 |
Cors |
0.0913 |
0.836 |
0.630 |
37.6 |
-0.268 |
0.065 |
4.9 |
-0.140 |
0.018 |
1.8 |
0.556 |
0.279 |
37.2 |
0.024 |
0.001 |
0.1 |
Dir |
0.1137 |
-0.069 |
0.009 |
0.3 |
0.551 |
0.553 |
25.8 |
-0.418 |
0.319 |
19.5 |
-0.003 |
0.000 |
0.0 |
-0.181 |
0.060 |
6.5 |
Duc |
0.0715 |
0.105 |
0.040 |
0.5 |
0.321 |
0.375 |
5.5 |
-0.247 |
0.222 |
4.3 |
-0.053 |
0.010 |
0.3 |
0.196 |
0.141 |
4.8 |
Fon |
0.0724 |
-0.459 |
0.423 |
9.0 |
0.196 |
0.077 |
2.1 |
-0.188 |
0.071 |
2.5 |
0.231 |
0.107 |
5.1 |
-0.118 |
0.028 |
1.8 |
Ica |
0.0672 |
0.291 |
0.357 |
3.3 |
0.082 |
0.028 |
0.3 |
0.007 |
0.000 |
0.0 |
-0.133 |
0.075 |
1.6 |
-0.260 |
0.286 |
7.9 |
Zod |
0.0612 |
0.565 |
0.544 |
11.5 |
0.010 |
0.000 |
0.0 |
0.111 |
0.021 |
0.7 |
-0.463 |
0.364 |
17.2 |
-0.099 |
0.017 |
1.1 |
Pav |
0.0680 |
-0.218 |
0.113 |
1.9 |
0.228 |
0.123 |
2.6 |
-0.023 |
0.001 |
0.0 |
0.030 |
0.002 |
0.1 |
0.547 |
0.715 |
35.7 |
Coc |
0.1059 |
0.284 |
0.186 |
5.0 |
0.154 |
0.055 |
1.9 |
0.396 |
0.361 |
16.3 |
-0.370 |
0.315 |
19.1 |
0.078 |
0.014 |
1.1 |
Esc |
0.0741 |
0.085 |
0.012 |
0.3 |
-0.711 |
0.851 |
28.0 |
-0.016 |
0.000 |
0.0 |
-0.068 |
0.008 |
0.5 |
0.090 |
0.014 |
1.0 |
Hôt |
0.1111 |
-0.469 |
0.336 |
14.4 |
-0.546 |
0.456 |
24.7 |
-0.209 |
0.067 |
4.8 |
-0.161 |
0.040 |
3.8 |
-0.246 |
0.092 |
11.7 |
| V-D
|
|
|
Dir |
|
|
|
|
|
|
|
Duc
| C-R
Pav |
Fon Rac
|
S-E Ale |
| Coc
|
N-R | PPN Ica
|
---------------------------------------------Miè-|---------------------------------------------Zod-----------------
|
Dis
|
|
|
|
Orl |
| PuH
| Cor
|
|
|
| V-C
|
|
|
Hôt |
|
|
|
|
PuF | Esc
Plan principal 1x 2 :
axe horizontal 1 (l1
= 0.170), axe vertical 2 (l2 = 0.134)
Cor |
|
|
|
|
PuH
| Ale
V-C|
| Rac
|
Fon |
|
V-D
|
|
|
| S-E
Dis
Pav
---------------Dir-------------------------------Orl|--------------------------------------------------------------
N-R |
Duc Esc
|
Ica
Hôt |
|
|
PuF |
| Miè
| C-R
|
|
Coc
|
|
| Zod PPN
Plan principal 3 x 4 : axe
horizontal 3 (l3
= 0.102), axe vertical 4 (l4 = 0.076)
QUELQUES
ELEMENTS DE REPONSES
1) Chaque personne
interrogée peut donner une ou plusieurs marques pour chaque attribut : le
tableau de données n’est donc pas un tableau de contingence stricto sensu. Il est clair que les
réponses ne sont pas indépendantes les unes des autres puisque chaque ligne
donne les réponses des mêmes personnes. Pour déterminer les marques les plus
fréquemment citées, il suffit de calculer les termes marginaux égaux à la somme
des lignes, que l’on peut trouver dans « l’étude des colonnes du
tableau ». Ces marques sont celles dont les images sont les plus fortes
parmi les personnes interrogées. De même, les attributs associés au plus grand
nombre de marques sont les plus marquants en terme d’image.
2) Les publics visés ont
évidemment des points communs : . Ils cherchent un produit élégant, racé,
distingué, féminin ou masculin. Les attributs « Vieillot-désuet »,
« Nouveau -riche », « Cocasse-ridicule » etc. ne leur
conviennent évidement pas, mais sont utiles pour donner du sens aux réponses et
pour écarter les marques dont l’image leur est associée.
3) Une faible distance du c2 entre les marques indique
une ressemblance des profils, tandis qu’une distance élevée montre que les
marques répondent aux attentes de clients différents. Les marques Corsaire et
Hôtesse (carré de la distance 2.378), Corsaire et Orly (2.213) ne visent pas la même clientèle : on le
comprend facilement. Inversement, Pavois et Orly (l’esprit de voyage ?) ,
Ducat et Directoire (un peu désuets), Cocker et Zodiac ont des images de
marques voisines. L’analyse factorielle des correspondances devrait permettre de
les préciser.
4) Le diagramme des valeurs
propres incite à examiner les cinq premiers axes principaux. La sixième valeur
propre est en effet nettement plus faible que la précédente. Ces cinq axes
principaux conservent 93% de l’inertie totale, ou, si l’on préfère, de la somme
des carrés des distances ; la réduction de la taille des données est donc
importante tout en permettant une très bonne approximation des distances.
5) Les marques les plus distantes sur le plan 1x2 : « Corsaire » et « Fontenoy », « Corsaire » et « Hôtesse » etc... sont celles dont les images sont très différentes. Les distances exactes entre ces marques sont supérieures aux distances observées sur le plan 1x2. Il faut être plus prudent dans l’interprétation des proximités, par exemple entre « Alezan » et « Fontenoy » : ces deux marques sont en réalité différentes l’une de l’autre (cf. plan 3x4). Les marques importantes dans l’interprétation du plan 1x2 sont celles dont les contributions sont les plus fortes.
6) On examine les proximités
entre les attributs de la même façon. Les marques qui correspondent aux publics
visés se trouvent du côté négatif de l’axe 1.
7) Les attributs « Pour
une femme » et « Pour un homme » ne s’opposent pas le long de
l’axe 2. Ils ne caractérisent donc pas les marques plus féminines que
masculines. En réalité, ils sont opposés à l’attribut
« Vieillot-désuet », surtout « Pour une femme ». Ils
correspondent à l’attribut « A la mode » qui ne figure pas dans la
liste proposée. C’est le long de l’axe 4 qu’ils sont opposés l’un à l’autre. On
observe d’ailleurs une proximité avec « Vulgaire-commun », qui
apparaît ici plus ou moins comme un critère de virilité., « Mièvre »
apparaissant comme plutôt féminin.
8) L’axe 5 permet de
distinguer les marques « Orly » et « Hôtesse »,
« Pavois » et « Icare », et les attributs « Nouveau
-riche » de « Distingué ». Les contributions montrent que c’est
surtout le caractère « Nouveau-riche » qui détermine l’axe 5. Les
marques « Orly » et « Pavois » font « Nouveau
riche », contrairement aux marques « Hôtesse » et
« Icare ».
Quelles marques proposer
finalement ? Pour les hommes, on peut penser à « Fontenoy » ou à
« Alezan », plus racé mais moins distingué. Associons
« Fontenoy » aux Mercedes et « Alezan » aux BMW pour fixer
les idées. Pour les femmes, le choix se limite à « Orly » ou
« Hôtesse ».Compte tenu de l’axe 5, on donnera la préférence à
« Hôtesse ».