Téléphones mobiles

(Analyse en composantes principales)

Une entreprise de distribution de téléphones mobiles a procédé à une enquête auprès d’un échantillon de 100 personnes dont le numéro de téléphone portable a été tiré au hasard dans les annuaires des principaux réseaux.

La question posée était la suivante : Notez de 1 (pas d’importance) à 5 (très important) les qualités d’un téléphone mobile ci-dessous :

Forme (For)

Mémoire (Mém)

Robustesse (Rob)

Fonctions (Fon)

Légèreté (Lég)

Facilité (Fac)

Plusieurs couleurs (Cou)

Connexion Internet (Int)

Petite taille (Pet)

à la Mode (Mode)

Les données figurent sur le fichier MOBILES.DAT (fichier de paramètres MOBILES.PAR)

1) Calculer les moyennes, les variances et les corrélations  des notes attribuées à chaque critère.

Construire le diagramme de chacune des séries de notes suivantes : Fonctions, Facilité, Internet, Mode.

2) Calculer les carrés des distances utilisées en ACP d2(32,53), d2(77,87), d2(47,30) connaissant :

 

For

Rob.

Lég

Cou

Pet

Mém

Fon

Fac

Int

Mod

30

2

3

4

1

5

2

4

5

5

2

32

3

3

3

3

4

3

4

4

4

4

47

4

4

2

5

3

3

3

4

2

5

53

3

3

4

3

2

3

3

3

2

4

77

2

5

5

4

5

3

2

5

1

4

87

1

1

2

3

2

4

5

3

4

1

3) On effectue l’analyse en composantes principales. Quelles sont les composantes principales à retenir pour l’analyse ? Obtient-on alors une approximation satisfaisante de la somme des carrés des distances ?

4) On considère maintenant le cercle de corrélation. Combien peut-on former de groupes de variables fortement corrélées positivement entre elles ? Quelles sont les variables appartenant à chaque groupe ? Donner un qualificatif caractéristique de ces groupes. Quelles sont les relations entre ces groupes  ?

5) Quelle est la moyenne de ces coordonnées sur l’axe 1 ? Sur l’axe 2 ? Quels sont les écarts-types ? Peut-il exister une liaison linéaire entre les deux premières composantes principales ? Peut-on considérer qu’il y a indépendance ?

6) Donner le rang des unités statistiques dont la coordonnée sur l’axe 1 est grande ou très grande, puis petite ou très petite. Ces unités statistiques sont-elles bien représentées par leurs projections sur le plan ? Idem sur l’axe 2.

7) En déduire des groupes homogènes d’unités statistiques et les caractériser suivant l’interprétation des composantes principales. 

8) Que peut-on dire des valeurs approchées sur le plan principal 1x2 des carrés des distances d2(32,53), d2(77,87), d2(47,30) par rapport aux distances exactes ? Confirmer par le calcul.

9) Kiagem commercialise l’appareil Memonet +, noir et gris ; Sany propose au public les appareils Small et Minismart,  sans fonctionnalité particulière. Notel veut lancer le modèle e-Look . En raisonnant à partir des dénominations de ces appareils, croyez-vous que le modèle e-Look entre en concurrence avec les précédents ?

 

correction

L’objectif de l’analyse est d’étudier les parts de marché occupées par les concurrents d’un téléphone mobile que l’entreprise Kiagem envisage de commercialiser.

On peut considérer que les données étudiées sont des notes sur 5, et qu’elles sont donc de nature quantitative : le calcul des moyennes, des variances et des coefficients de corrélation vont donner quelques informations sur la façon dont les caractéristiques des appareils sont perçues.

Ces paramètres sont donnés en intégralité en annexe. Nous analysons ici les attentes dont ces paramètres donnent des informations pertinentes, en laissant au lecteur la construction de ceux qui sont demandés. Il s’agit de :

·           l’accès à internet : les avis sur cette option sont divergents (écart type élevé).

Notes données à l’attente accès à internet

La clientèle est ici segmentée en deux : les utilisateurs d’internet, auxquels il est indispensable de fournir une connexion, et les autres, pour lesquels elle est superflue

·             La mémoire rassemble un grand nombre d’avis positifs, et constitue une attente de la quasi totalité des clients moyenne supérieure à 3, écart type faible)

Notes données à l’attente mémoire

·           La mode est un facteur de choix important pour une majorité de clients, nettement moins pour d’autres.

Notes données à l’attente à la mode

On note parmi les corrélations des coefficients particulièrement élevés en valeur absolue , entre la forme, la mode et la couleur par exemple (de l’ordre de 0.6). L’analyse en composantes principales donnera des résultats et des graphiques pour décrire ces corrélations.

Les distances demandées sont calculées directement par le logiciel StatPC :

 

30

32

47

53

77

87

30

0

15.72

53.27

36.24

38.94

42.92

32

15.72

0

14.58

11.80

24.75

25.50

47

53.27

14.58

0

14.58

24.36

47.83

53

36.24

11.80

14.58

0

12.79

28.90

77

38.94

24.75

24.36

12.79

0

72.00

87

42.92

25.50

47.83

28.90

72.00

0

Carrés des distances entre les individus 30, 32, 467, 53, 77, 87

Les deux premiers axes suffisent pour visualiser 65% de l’information contenue dans les données (cf. annexe). Les deux axes suivants pourraient les compléter utilement, compte tenu de la différence relativement importante entre la 4ième et la 5ième valeur propre. Le tableau des corrélations entre les variables et les composantes principales montre une certaine importance simultanée accordée à la légèreté, à la robustesse et la mémoire (troisième composante principale). On peut contester effectivement la technicité de cette dernière, au contraire bien commode et facile à utiliser. La quatrième traduit une opposition entre la petitesse et la couleur : un appareil de couleur doit être remarqué. Notons qu’on aurait pu construire le cercle de corrélation 3x4. Les autres axes ne présentent vraisemblablement que peu d’intérêt, et l’information qu’ils contiennent n’est pas généralisable à la clientèle toute entière.

Les cercles de corrélation représentent la matrice de corrélation entre les attentes, en utilisant les composantes principales comme référence : lorsque deux attentes sont représentées par des points proches l’un de l’autre et proches du cercle, leur coefficient de corrélation est élevé. Si elles sont diamétralement opposées, il est proche de –1.

La figure ci-dessous met en évidence trois groupes d’attentes faciles à identifier : les perfectionnements du mobile (mémoire, internet, fonctions), qui s’opposent à sa maniabilité (léger, facile, taille), et l’esthétique (couleur, forme, à la mode) indépendante plus ou moins des deux critères généraux précédents.

On peut donc penser que les clients se déterminent en fonction de deux critères simultanément :

·           le premier correspond à la nature de l’utilisation de l’appareil, par un simple utilisateur, qui recherche un appareil simple, commode, robuste, jusque par  un utilisateur averti intéressé par les fonctionnalités.

·           l’esthétique d’autre part est considérée par certains clients comme un facteur important au même titre que les vêtements, les bijoux etc.

 

Cercle de corrélation 1x2

Ces deux facteurs sont indépendants, l’exigence au plan technique n’ayant rien à voir avec l’exigence au plan esthétique. Cette indépendance est visible sur le plan principal 1x2 sur lequel nous avons représenté les clients interrogés en fonction de leurs réponses :

Plan principal 1x2 (l1 = 4.126, l2 = 2.382)

 

L’absence de liaison révélée par ce plan confirme l’indépendance des deux facteurs.

On peut noter quelques points particuliers : le client 6 a par exemple de fortes exigences dans les fonctionnalités et dans l’esthétique de l’appareil, tandis que le 37 ne recherche, avec l’esthétique, que les fonctions de base.

Les points  situés en haut du graphique (97, 30) caractérisent des individus qui se sentent visiblement peu concernés par les mobiles : indifférents à l’esthétique, accordant une importance moyenne au degré de technicité de l’appareil.

 

Memonet +, d’après son nom, est un appareil très perfectionné, avec beaucoup de mémoire et offre une connexion internet. Ce sont bien évidemment les utilisateurs avertis qui sont visés par ce mobile. Le choix des couleurs est limité à gris et noir, et l’esthétique guère recherchée. On peut penser que le segment de clientèle intéressé est constitué par les clients 56, 14, 24, 38, 61, 87.

Les appareils Small et Minismart de Sony sont destinés à des utilisateurs recherchant la simplicité d’emploi. Minismart introduit une notion d’esthétique, tandis que Small insiste sur sa petite taille.

Le modèle e-Look vise une clientèle visiblement “branchée” : connexion internet, esthétique. Il n’est pas en concurrence avec les précédents.

 

ANNEXES

Variable active

moyenne

écart-type

variance

Forme

3.01

1.024646

1.0499

Robus

3.39

1.00891

1.0179

Léger

3.38

1.017644

1.0356

Coule

3.23

.8585453

.7371

Petit

3.46

.8651012

.7484

Mémoi

3.41

.6796323

.4619

Fonct

3.39

.8233469

.6779

Facil

3.78

.8784077

.7716

Inter

2.78

1.213095

1.4716

Mode

3.41

1.175542

1.3819

Moyennes, écarts types et variances des attentes

 

Forme

Robus

Léger

Coule

Petit

Mémoi

Fonct

Facil

Inter

Mode

Forme

1.000

 

 

 

 

 

 

 

 

 

Robus

0.151

1.000

 

 

 

 

 

 

 

 

Léger

-0.282

0.586

1.000

 

 

 

 

 

 

 

Coule

0.554

0.312

-0.272

1.000

 

 

 

 

 

 

Petit

-0.152

0.459

0.347

-0.142

1.000

 

 

 

 

 

Mémoi

0.095

-0.233

-0.095

-0.162

-0.457

1.000

 

 

 

 

Fonct

-0.005

-0.604

-0.583

-0.325

-0.336

0.376

1.000

 

 

 

Facil

-0.164

0.492

0.440

0.014

0.581

-0.469

-0.642

1.0000

 

 

Inter

0.066

-0.551

-0.491

-0.278

-0.390

0.498

0.857

-0.618

1.000

 

Mode

0.619

0.573

0.096

0.650

0.119

-0.085

-0.310

0.116

-0.217

1.000

Matrice des corrélations


Lambda

%exp

%cum

 

4.126

41

41

**************************************************

2.382

24

65

****************************

1.104

11

76

*************

0.854

9

85

**********

0.437

4

89

*****

0.370

4

93

****

0.299

3

96

***

0.203

2

98

**

0.139

1

99

*

0.088

1

100

*

Valeurs propres (variances des composantes principales)

 

 

axe

1

axe

2

axe

3

axe

4

 

r(Xj,C1)

r2

r(Xj,C2)

r2

r(Xj,C3)

r2

r(Xj,C4)

r2

Forme

-0.018

0.000

-0.854

0.729

-0.016

0.000

0.189

0.036

Robustesse

-0.805

0.648

-0.195

0.038

-0.337

0.113

0.210

0.044

Légèreté

-0.630

0.397

0.389

0.152

-0.583

0.340

-0.027

0.001

Couleur

-0.292

0.085

-0.830

0.689

0.218

0.048

-0.245

0.060

Petitesse

-0.618

0.381

0.314

0.098

0.196

0.039

0.607

0.369

Mémoire

0.555

0.308

-0.121

0.015

-0.702

0.493

-0.044

0.002

Fonctions

0.876

0.767

0.018

0.000

0.079

0.006

0.374

0.140

Faci

-0.779

0.607

0.274

0.075

0.161

0.026

0.065

0.004

Internet

0.857

0.734

-0.058

0.003

-0.099

0.010

0.370

0.137

à la Mode

-0.445

0.198

-0.764

0.583

-0.172

0.029

0.247

0.061

Tableau des corrélations entre composantes principales et variables initiales