Téléphones mobiles

(Analyse des correspondances)

Nous reprenons ici les données sur les téléphones mobiles que nous avons analysées par ACP dans une autre application.

Rappelons qu’il s’agit des résultats d’une enquête auprès d’un échantillon de 100 personnes auxquelles on a posé la question suivante :

Notez de 1 (pas d’importance) à 5 (très important) les qualités d’un téléphone mobile ci-dessous :


Forme (For)

Robustesse (Rob)

Légèreté (Lég)

Plusieurs couleurs (Cou)

Petite taille (Pet)

Mémoire importante (Mém)

Fonctions nombreuses (Fon)

Facilité d’emploi (Fac)

Connexion Internet (Int)

à la Mode (Mod)


Les données figurent sur le fichier MOBILES.DAT (fichier de paramètres MOBILES.PAR). Ce sont des mesures quantitatives positives, qui peuvent être techniquement analysées par l’analyse factorielle des correspondances.

Pour la première question, on choisira l’option Tris croisés et tris à plat du programme Dépouillement d’enquêtes. Pour les suivantes, on  utilisera les programmes d’analyse en composantes principales et d’analyse factorielle des correspondances de StatPC.

1) Donner la répartition des notes de chaque critère. Sélectionner les critères sur lesquels les avis sont les plus partagés en examinant les diagrammes.

2) On donne ci-dessous un extrait du tableau de données :

 

For

Rob.

Lég

Cou

Pet

Mém

Fon

Fac

Int

Mod

30

2

3

4

1

5

2

4

5

5

2

32

3

3

3

3

4

3

4

4

4

4

47

4

4

2

5

3

3

3

4

2

5

53

3

3

4

3

2

3

3

3

2

4

77

2

5

5

4

5

3

2

5

1

4

87

1

1

2

3

2

4

5

3

4

1

 

Calculer les carrés des distances d2(30, 77), d2(30, 87) considérées en AFC (distances du c2) et en ACP (distances normées). De quel individu 77 ou 87 l’individu 30 est-il le plus proche en AFC ? en ACP ?

Calculer dans chaque cas les carrés des distances d2(53,77), d2(53, 87). En déduire les distances, et les représenter sous la forme d’un triangle. Ces deux analyses donnent-elles les mêmes proximités ?

3) On analyse maintenant les réponses des individus X, Y :

For

Rob.

Lég

Cou

Pet

Mém

Fon

Fac

Int

Mod

X

1

1

1

1

1

1

1

1

1

1

Y

5

5

5

5

5

5

5

5

5

5

Leurs critères de choix d’un dentifrice sont-ils différents ? Existe-t-il en ACP deux individus dont la distance soit supérieure à celle de X et Y ? Que peut-on dire de la distance du c2 entre X et Y ?

4) Quel est le nombre de facteurs principaux a priori significatifs en analyse factorielle des correspondances ? Permettent-ils une bonne conservation des distances ?

5) Représenter les profils colonnes sur le plan principal 1 x 2. Proposer une interprétation de chaque axe.  Vérifier que la moyenne de leurs coordonnées sur un axe est égale à 0. Quelle est leur variance ?

6) On étudie maintenant les profils lignes. Représenter graphiquement le plan principal 1 x 2. Quel genre de téléphone recherche l’individu n° 6 ? Le n° 97 ? Reconstituer approximativement les notes attribuées aux dix critères par ces deux individus.

7) Quel est le profil ligne caractérisé par l’origine des axes (on précisera les valeurs numériques) ? Quel est l’individu caractérisé par l’origine des axes en ACP ?

8) Calculer les coordonnées des individus X et Y précédents (3e question) sur les trois premiers axes principaux obtenus par analyse des correspondances et par analyse en composantes principales.  Expliquer les résultats.

9) Examiner les poids des individus. Expliquer pourquoi les deux analyses donnent des résultats comparables.


correction

1) Le tri à plat des questionnaires donne la répartition des réponses suivant les notes atribuées à chaque critère :


 

1

2

3

4

5

Forme

4

29

40

16

11

Robuste

3

15

37

30

15

Léger

1

22

30

32

15

Couleurs

1

17

48

26

8

Petit

1

13

34

43

9

 

1

2

3

4

5

Mémoire

0

6

52

37

5

Fonctions

1

11

44

36

8

Facilité

1

7

25

47

20

Internet

16

33

14

31

6

Mode

7

24

2

55

12


Il n’y a guère que deux critères dont l’importance est appréciée très diversement :

·        l’accès à internet :

note

%

 

1

16

********************************

2

33

*****************************************************************

3

14

****************************

4

31

*************************************************************

5

6

************

Les personnes interrogées émettent un avis assez diversifié sur l’importance de l’accès à internet : le tiers environ le considère comme important ou peu important.

·        à la mode :

note

%

 

1

7

********

2

24

****************************

3

2

**

4

55

*****************************************************************

5

12

**************

On constate que les avis sont encore plus partagés sur le critère à la mode : très peu de personnes le considèrent come moyennement important.

 

2) Les carrés des distances sont donnés dans les tableaux ci-dessous :


30

32

47

53

77

30

0

 

 

 

 

32

0.128

0

 

 

 

47

0.453

0.122

0

 

 

53

0.319

0.087

0.092

0

 

77

0.351

0.207

0.182

0.147

0

87

0.330

0.250

0.507

0.406

0.655

Carrés des distances du c2 (AFC)

30

32

47

53

77

30

0

 

 

 

 

32

15.716

0

 

 

 

47

53.271

14.580

0

 

 

53

36.239

11.800

14.580

0

 

77

38.938

24.750

24.35*9

26.569

0

87

42.919

25.499

47.835

28.899

71.998

Carrés des distances normées (ACP)



En AFC, l’individu 30 est plus proche de l’individu 87 que de l’individu 77. En ACP, c’est le contraire : l’ordre des distances est modifié.

Les distances entre les individus 53, 77 et 79 sont les suivantes :


53

77

87

53

0

 

 

77

0.383

0

 

87

0.637

0.809

0

distances du c2 (AFC)


53

77

87

53

0

 

 

77

5.155

0

 

87

5.376

8.485

0

distances normées (ACP)


Nous donnons ci-dessous les deux triangles représentant ces distances :

 

 

On constate que ces deux triangles ne sont pas homothétiques : le choix de la distance exerce une influence forte sur les proximités.

3) Pour les individus X et Y, tous les critères proposés ont la même importance. On peut penser que les notes ne sont pas caractéristiques, qu’elles sont mal choisies : tout autre critère supplémentaire serait considéré comme plus important pour X, et moins important pour Y :  cela n’a guère de sens, puisque c’est par rapport à des critères ne figurant pas dans la liste proposée que ces deux individus se déterminent. n’importe lequel pour X, aucun pour Y.

Il n’existe pas en ACP deux individus dont la distance soit supérieure à celle de X et Y, puisque pour chaque modalité, l’écart entre les observations est le plus grand possible. La distance du c2 entre X et Y est celle de leurs profils : leurs profils étant les mêmes, cette distance est nulle.

En conclusion, ces deux individus X et X sont les éloignés possibles en ACP et confondus en AFC. Le choix de la méthode repose sur la décision de les considérer comme opposés ou identiques .

4) Nous donnons ci-dessous le diagramme des valeurs propres :

l

%

% cum.

**************************************************

0.0360

46

46

**************************************************

0.0201

26

72

***************************

0.0067

9

81

*********

0.0046

6

87

******

0.0035

5

91

****

0.0022

3

94

***

0.0018

2

96

**

0.0016

2

98

**

0.0012

2

100

*

On se limite à l’étude des deux premiers axes principaux. Ils conservent plus de 70% de la somme des carrés des distances, ce qui est satisfaisant.


5) Les profils colonnes se regroupent de façon assez claire :

axe horizontal 1 (l1 = 0.036), axe vertical 2 (l2 = 0.020)

L’axe 1 caractérise le degré d’utilisation de l’appareil : utilisation de moins en moins pointue lorsque l’on parcourt l’axe de la gauche vers la droite.

L’axe 2 montre un critère indépendant du précédent : il oppose la commodité (léger, petit, facile à utiliser à l’esthétique de l’appareil).

Le tableau ci-dessous donne les coordonnées des profils colonnes sur les trois premiers axes principaux.

 

poids

axe 1

axe 2

axe 3

 

 

c1(j)

cos2

cont.

c2(j)

cos2

cont.

c3(j)

cos2

cont.

Forme

0.0906

-0.041

0.020

0.4

-0.239

0.686

25.8

0.014

0.002

0.2

Robus

0.1020

0.200

0.683

11.4

0.005

0.000

0.0

-0.050

0.043

3.8

Léger

0.1017

0.167

0.323

7.9

0.178

0.367

16.1

-0.143

0.237

31.2

Coule

0.0972

0.040

0.028

0.4

-0.171

0.512

14.1

0.051

0.045

3.7

Petit

0.1041

0.107

0.197

3.3

0.129

0.289

8.7

0.131

0.297

26.8

Mém

0.1026

-0.135

0.398

5.2

0.047

0.049

1.2

-0.090

0.176

12.4

Fonct

0.1020

-0.252

0.814

18.0

0.063

0.051

2.0

0.040

0.020

2.4

Facil

0.1137

0.141

0.365

6.3

0.111

0.227

7.0

0.097

0.172

15.9

Inter

0.0836

-0.434

0.925

43.7

0.052

0.013

1.1

-0.016

0.001

0.3

Mode

0.1026

0.109

0.151

3.4

-0.217

0.601

24.0

-0.045

0.026

3.2

 

La moyenne des coordonnées sur chaque axe est effectivement égale à 0 à condition de pondérer les coordonnées par les poids. Les variances sont les valeurs propres : la pondération est là aussi indispensable pour vérifier numériquement cette propriété.

6) Sur le plan 1 x 2 ci-dessous, les individus 6 et 97 sont visiblement à l’opposé l’un de l’autre. L’individu 6 préfère les appareils très modernes, à la mode, “branchés”, inversement à l’individu 97 qui privilégie la simplicité et la commodité.

Les notes données par ces deux individus sont les suivantes :

For

Rob.

Lég

Cou

Pet

Mém

Fon

Fac

Int

Mod

6

4

2

2

4

1

4

5

1

5

4

97

1

3

4

2

4

3

2

5

1

1

 

axe horizontal 1 (l1 = 0.036), axe vertical 2 (l2 = 0.020)

7) Les profils caractérisés par l’origine des axes en analyse factorielle des correspondances sont les profils marginaux. En ce qui concerne les profils lignes,  les termes marginaux sont les sommes des termes des colonnes. Le centre de gravité est défini par le profil déduit de ces termes marginaux :

For

Rob.

Lég

Cou

Pet

Mém

Fon

Fac

Int

Mod

Marge

0.091

0.102

0.102

0.097

0.104

0.103

0.102

0.114

0.084

0.103

En analyse en composantes principales, l’origine des axes caractérise l’individu défini par les moyennes des variables initiales.

For

Rob.

Lég

Cou

Pet

Mém

Fon

Fac

Int

Mod

Moyenne

3.01

3.39

3.38

3.23

3.46

3.41

3.39

3.78

2.78

3.41

On constate sans difficulté que l’individu caractérisé par l’origine des axes est le même dans les deux analyses : il suffit de calculer le profil du second pour obtenir le premier.

8) Le calcul donne les résultats suivants (les coordonnées de X et de Y sur les axes principaux obtenus par AGC sont égales) :

 

axe 1

axe 2

axe 3

 

c1(j)

cos2

c2(j)

cos2

c3(j)

cos2

X,Y(AFC)

-0.052

0.427

-0.028

0.123

-0.015

0.037

X (ACP)

1.745

0.045

2.365

0.083

3.155

0.148

Y (ACP)

-0.557

0.009

-2.274

0.158

-2.259

0.156

 

On observe que les individus X et Y ont des coordonnées complètement opposées en ACP, alors qu’ils sont confondus en AFC. On retrouve ici les résultats de la 3e question.

 

9) Les deux analyses, bien qu’elles représentent des distances différentes comme on a pu le constater précédemment,  donnent des interprétations globales analogues. On retrouve les mêmes groupes de variables, de critères, et l’interprétation des axes est la même. Le cas précédent de deux points totalement opposés en ACP et confondus en AFC ne se produit pas en fait. On peut le vérifier en examinant les moyennes des notes attribuées à l’ensemble des critères par chaque individu.

Dans le cas de X cette moyenne est égale à 1, dans le cas de Y à 5. Or, parmi les observations, la plus petite moyenne est égale à 2.6 et la plus grande à 3.9 : il n’existe donc pas dans les données d’individus analogues à X et à Y.

La moyenne des notes données par un individu est proportionnelle à son poids, et par suite, les poids varient peu, contrairement à ceux de X et de Y. Dans ces conditions, les différences entre les deux analyses sont relativement minces.

Il est donc indispensable, devant de telles données, d’examiner les poiids des individus avant de choisir la méthode d’analyse.