Chapitre 9

ANALYSE FACTORIELLE DES CORRESPONDANCES

1. NATURE DES DONNÉES ÉTUDIÉES.

1.1 Données initiales.

·        Tableaux de contingence obtenus par tri croisé d’un échantillon ou assimilés

·        Tableaux de mesures positives

·        Tableaux disjonctifs complets (analyse des correspondances multiples)

Exemple de tableau de contingence:

X : 3 modalités

Y : 4 modalités

brunes : fumeur de brunes

mm : mineur masculin

blondes : fumeur de blondes

mf : mineur féminin

non fumeur

MF majeur féminin

 

MM : majeur masculin

 

 

 

 

Y

 

 

 

 

 

mm

mf

MF

MM

 

 

brunes

63

37

41

47

 

X

blondes

36

55

39

38

 

 

non fumeur

34

27

72

38

 

Notations :

Dans le cas général, le tableau des proportions est noté PIJ :

 

 

 

 

 

Y

 

 

 

 

y1

y2

yj

yq

 

x1

p11

p12

p1j

p1q

 

x2

p21

p22

p2j

p2q

 

X

xi

pi1

pii

pij

piq

 

 

xp

pp1

pp2

ppj

ppq

On a évidemment : pij=nij / N en notant nij l’effectif figurant à la ligne i (modalité xi) et la colonne j (modalité yj) , et N l’effectif total.

1.2 unités statistiques.

Définition : les marges du tableau sont les répartitions suivantes :

·        PI = (pi.) i = 1, …, p: répartition des réponses à la question X suivant les modalités x1, x2, …(en proportions)

pi. = somme des pij pour i fixé

·        PJ = (p.j) j = 1, …, q : répartition des réponses à la question Y suivant les modalités y1, y2, …(en proportions)

p.j = somme des pij pour j fixé

Définition des profils

Les profils lignes sont les répartitions suivant les modalités en colonnes des individus donnés en lignes :

 

mm

mf

MF

MM

total

profil brunes

0.335

0.197

0.218

0.250

1

profil blondes

0.214

0.327

0.232

0.226

1

profil non fumeur

0.199

0.158

0.421

0.222

1

centre de gravité PJ

0.252

0.226

0.288

0.233

1

profils lignes PJi

La notation est la suivante :

 

 

 

 

 

Y

 

 

 

 

y1

y2

yj

yq

 

PJ1

p11

p21

pj1

pq1

 

PJ2

p12

p22

pj2

pq2

 

X

PJi

p1i

p2i

pji

pqi

 

 

PJp

p1p

p2p

pjp

pqp

 

PJ

p.2

p.3

p.4

p.5

Les profils colonnes sont les répartitions suivant les modalités en lignes des individus donnés en colonnes.

 

profil mm

profil mf

profil MF

profil MM

centre

de gravité PI

brunes

0.474

0.311

0.270

0.382

0.357

blondes

0.271

0.462

0.257

0.309

0.319

non fumeur

0.256

0.227

0.474

0.309

0.324

total

1

1

1

1

1

profils colonnes PIj

La notation est la suivante :

 

 

 

 

 

Y

 

 

 

 

 

PI1

PI2

PIj

PIq

centre

de gravité PI

 

x1

p11

p12

p1j

p1q

p1.

 

x2

p21

p22

p2j

p2q

p2.

 

X

xi

pi1

pi2

pij

piq

pi.

 

 

xp

pp1

pp2

ppj

ppq

pp.

 

 

1

1

 

1

 

1

 

2. PRéSENTATION DE LA MéTHODE.   

2.1 Notion de distance entre deux profils.

Définitions :

·        La distance du c2 entre deux profils lignes PJi et PJi’ est définie par son carré de la façon suivante :

 

 

q

 

d2(i,i’)

=

S

[ pji – pji’]2 / p.j

 

 

j = 1

 

 

·        La distance du c2 entre deux profils colonnes PIj et PIj’ est définie par son carré de la façon suivante :

 

 

p

 

d2(i,i’)

=

S

[ pij – pij’]2 / pi.

 

 

j = 1

 

Exemples :

 

x1

x2

x3

x1

0.000

 

 

x2

0.136

0.000

 

x3

0.226

0.252

0.000

Distances entre les profils lignes

 

 

y1

y2

y3

y4

y1

0.000

 

 

 

y2

0.192

0.000

 

 

y3

0.264

0.325

0.000

 

y4

0.037

0.109

0.128

0.000

Distances entre les profils colonnes

2.2 Description d'un ensemble de profils. Définitions.

·        Recherche des axes les plus proches des points (critère des moindres carrés)

·        Axes principaux et composantes principales : facteurs principaux.

·        Inertie = variance des facteurs

·        somme des inertie : c2/N (N : somme du tableau)

·        Valeur propre « triviale » égale à 0 ou 1 suivant le logiciel.

·        c2 = 35.726, P(X²>x²)= 0.0000

·        l1 = 0.04495,  l2 = 0.02284, l3 = 0.00000, l4 = 0

2.3 Propriété de dualité.

·        Cette propriété relie les profils colonnes et les profils lignes.

·        Les ensembles de profils ont les mêmes valeurs propres.

·        Il existe une relation entre les facteurs sur les profils lignes et les facteurs sur les profils colonnes.

3. INTERPRéTATION DES RéSULTATS.

3.1 Représentation graphique. Plans principaux.

3.2 Paramètres d'aide à l'interprétation.

Poids : chaque profil intervient d’autant plus dans l’analyse que son poids, égal à la somme pi. (profil ligne) ou p.j (profil colonne) est élevé.

contributions : les contributions mesurent l’influence des profils dans le calcul des axes principaux.

Moyennes et variances des facteurs : comme en ACP, les moyennes des facteurs sont nulles, les variances égales aux valeurs propres, et les coovariances à 0. On n’oubliera pas de pondérer les profils dans les calculs.

Coordonnées des profils lignes :

 

poids

C(i)

Cos²(i)

Contrib(i)

C(i)

Cos²(i)

Contrib(i)

brunes

0.357

-0.128

0.331

12.9

-0.181

0.669

51.4

blondes

0.319

-0.168

0.449

20.0

0.186

0.551

48.2

ne fume pas

0.324

0.305

0.997

67.1

0.017

0.003

0.4

Coordonnées des profils colonnes :

 

poids

C(j)

Cos²(j)

Contrib(j)

C(j)

Cos²(j)

Contrib(j)

mm

0.252

-0.131

0.286

9.7

-0.207

0.714

47.5

mf

0.226

-0.226

0.513

25.7

0.220

0.487

48.0

MF

0.288

0.316

0.980

64.1

0.045

0.020

2.5

MM

0.233

-0.030

0.312

0.5

-0.044

0.688

2.0