9. analyse factorielle des correspondances.

Pour poursuivre l’analyse du risque financier dans sa clientèle , la banque a effectué une enquête plus importante sur sa clientèle. On étudie maintenant le tableau donnant la répartition de la clientèle suivant les produits financiers qu’elle détient et le groupe de risque auquel elle appartient, auquel on a ajouté le groupe 4 constitué des nouveaux clients dont le risque n’est pas connu.

 

risque élevé

Groupe 1

risque moyen

Groupe 2

risque faible

Groupe 3

risque inconnu

Groupe 4

PEA

27

40

25

17

Assurance vie

15

46

70

22

épargne logement

10

35

66

19

Compte titre

22

33

25

13

CODEVI

29

35

43

18

Autres

11

41

13

9

Aucun

81

39

41

27

1) Le tableau de données est un tableau de contingence. Il est établi par comptage  des unités statistiques suivant deux critères (on dit souvent tri croisé). 

Loi marginale en ligne :

 

risque élevé

Groupe 1

risque moyen

Groupe 2

risque faible

Groupe 3

risque inconnu

Groupe 4

Total

pop. totale

0.224

0.308

0.325

0.143

1

pop. totale

22.4%

30.8%

32.5%

14.3%

100%

Figure 1 : Répartition de la clientèle suivant le degré de risque

Un quart de l’ensemble des clients (en bleu) présente un risque élevé et un peu plus d’un tiers un risque moyen. La banque peut s’inquiéter de cette majorité de clients à risque.

Loi marginale en colonne :

 

PEA

Ass. vie

épar.log.

Cpte titres

Codevi

autres

aucun

total

Pop. totale

0.1250

0.1755

0.1491

0.1067

.01433

0.0849

0.2156

1

Pop. totale

12.50%

17.55%

14.91%

10.67%

1.433%

8.49%

21.56%

100%

Figure 2 : Répartition de la clientèle suivant le type d’épargne

2) Le profil des titulaires d’un PEA est la conditionnelle en première ligne :

 

risque élevé

risque moyen

risque faible

risque inconnu

total

PEA

24.8%

36.7%

22.9%

15.6%

100%

Le profil des clients à risque élevé (groupe 1) est la loi conditionnelle en première colonne :

 

PEA

Ass. vie

épar.log.

Cpte titres

Codevi

autres

aucun

total

G1

13.85%

7.69%

5.13%

11.28%

14.87%

5.64%

41.54%

100%

Pour comparer ces profils aux profils moyens correspondants, on les représente sur les mêmes graphiques comme ci-dessus ou sur un graphique dont l’unité est la même sur l’axe des ordonnées.

Le risque présenté par les titulaires d’un PEA semble légèrement plus élevé que dans la clientèle totale (figure 1, en rouge).

Par contre l’absence d’épargne chez les clients à risque élevé est beaucoup plus fréquente : elle passe de 22% à 41%. Inversement, l’assurance-vie, présente chez 18% des clients, n’ a été souscrite que par 8% des clients de risque élevé.

3) Les trois premières valeurs propres obtenues par l’analyse factorielle des correspondances de ce tableau. sont les suivantes :

l1 = 0.10148

l2 = 0.03929

l3 = 0.00035

Il n’y a pas d’autre valeur propre, puisqu’il y a quatre colonnes dans le tableau. Le diagramme est le suivant :

l

%exp

S%

 

0.1015

72

72

**************************************************

0.0393

28

100

*******************

0.0004

0

100

 

Le pourcentage d’inertie expliquée par les deux premiers axes est égal à 100%.Il est clair que le troisième axe, associé à la troisième valeur propre quasiment nulle, ne contribue presque pas à la reconstruction des distances entre les profils. 

Le produit de l’inertie totale (0.14111212) par la somme du tableau (872) est égal à la statistique x2 calculée dans la procédure de test du c2 de contingence :

x²= 123.05 = 872 x 0.14111212

Cette valeur x2 est élevée puisque la probabilité critique (ou p-value) est égale à :

P( X2 > 123.05) =0 pour un degré de liberté n égal à 18 (=(7 – 1) x (4 – 1)

Le test du c2 montre donc une liaison entre les deux caractères : le risque et le type d’épargne sont liés. On l’a déjà constaté en analysant la figure 2.

Les coordonnées des profils (lignes ou colonnes) sur le troisième axe sont de moyenne nulle et de variance l3 = 0.0004. L’ordre de grandeur des coordonnées des profils risque ou épargne sur cet axe est donc l’écart-type s = 0.02.

4) Les profils représentés par l’origine des axes sur le schéma ci-dessous sont les répartitions marginales calculées dans la première question.

 

Représentation simultanée des profils d’épargne (en noir) et de risque (en rouge)
sur le plan principal 1x2

Examinons le profil risque des titulaires d’un PEA : on constate sa proximité avec l’origine des axes, c’est-à-dire avec le profil moyen. Posséder un PEA ne donne aucune information sur le risque du client.

De même, la nature de l’épargne des clients présentant un risque élevé (élevé) est très éloignée du centre de gravité : ils ont un profil d’épargnant particulier. Cette particularité s’explique par la proximité entre le risque élevé et l’absence d’épargne (aucun). Nous avons là une explication du lien détecté par le test du c2. De même, les clients présentant un risque faible (faible) investissent leur épargne en assurance vie ou en épargne logement nettement plus souvent que les autres.

5) Le groupe 4 est mal représenté sur le plan 1 x 2. La somme des cosinus carré avec les axes 1 et 2 est en effet égale à 0.307. Mais la taille de la quatrième valeur propre est tellement faible que la proximité avec le centre de gravité est réelle. Les nouveaux clients semblent des épargnants ordinaires, et ne privilégient pas de placement particulier par rapport à la clientèle totale. La banque a tout intérêt à orienter sa politique de façon à attirer de nouveaux clients investissant en épargne logement ou en assurance-vie pour éviter les clients à risque.

6) L’approximation du carré de la distance du c2 entre les profils Assurance vie et Épargne logement est donnée par la somme des carrés de différences de leurs coordonnées. Cette propriété est une conséquence directe de l’orthonormalisation des axes (même unité). On trouve :

d2(Ass.vie, épargne log.) =  0.0130

Cette approximation est très précise : les points sont très bien représentés sur le plan principal 1 x 2, comme toutes les approximations de ce type d’ailleurs puisque le plan 1 x 2 représente la quasi totalité des carrés des distances.

7) Le premier axe met finalement en évidence la liaison entre la nature de l’épargne d’un client et le risque financier qu’il présente, échelonné de faible à élevé de droite à gauche. On peut l’appeler l’échelle de risque de l’épargnant.