ANALYSE FACTORIELLE DES CORRESPONDANCES
· Tableaux de contingence obtenus par tri croisé d’un échantillon ou assimilés
· Tableaux de mesures positives
· Tableaux disjonctifs complets (analyse des correspondances multiples)
Exemple de tableau de contingence:
X : 3 modalités |
Y : 4 modalités |
|||||||
brunes : fumeur de brunes |
mm : mineur masculin |
|||||||
blondes : fumeur de blondes |
mf : mineur féminin |
|||||||
non fumeur |
MF majeur féminin |
|||||||
|
MM : majeur masculin |
|||||||
|
|
|
|
Y |
|
|
|
|
|
|
mm |
mf |
MF |
MM |
|
||
|
brunes |
63 |
37 |
41 |
47 |
|
||
X |
blondes |
36 |
55 |
39 |
38 |
|
||
|
non fumeur |
34 |
27 |
72 |
38 |
|
||
Notations :
Dans le cas général, le tableau des proportions est noté PIJ :
|
|
|
|
|
Y |
|
|
|
|
y1 |
y2 |
… |
yj |
… |
yq |
|
x1 |
p11 |
p12 |
… |
p1j |
… |
p1q |
|
x2 |
p21 |
p22 |
… |
p2j |
… |
p2q |
|
… |
… |
… |
… |
… |
… |
… |
X |
xi |
pi1 |
pii |
… |
pij |
… |
piq |
|
… |
… |
… |
… |
… |
… |
… |
|
xp |
pp1 |
pp2 |
… |
ppj |
… |
ppq |
On a évidemment : pij=nij / N en notant nij l’effectif figurant à la ligne i (modalité xi) et la colonne j (modalité yj) , et N l’effectif total.
Définition : les marges du tableau sont les répartitions suivantes :
· PI = (pi.) i = 1, …, p: répartition des réponses à la question X suivant les modalités x1, x2, …(en proportions)
pi. = somme des pij pour i fixé
· PJ = (p.j) j = 1, …, q : répartition des réponses à la question Y suivant les modalités y1, y2, …(en proportions)
p.j = somme des pij pour j fixé
Définition
des profils
Les profils lignes sont les répartitions suivant les modalités en colonnes des individus donnés en lignes :
|
mm |
mf |
MF |
MM |
total |
profil brunes |
0.335 |
0.197 |
0.218 |
0.250 |
1 |
profil blondes |
0.214 |
0.327 |
0.232 |
0.226 |
1 |
profil non fumeur |
0.199 |
0.158 |
0.421 |
0.222 |
1 |
centre de gravité PJ |
0.252 |
0.226 |
0.288 |
0.233 |
1 |
profils
lignes PJi
La notation est la suivante :
|
|
|
|
|
Y |
|
|
|
|
y1 |
y2 |
… |
yj |
… |
yq |
|
PJ1 |
p11 |
p21 |
… |
pj1 |
… |
pq1 |
|
PJ2 |
p12 |
p22 |
… |
pj2 |
… |
pq2 |
|
… |
… |
… |
… |
… |
… |
… |
X |
PJi |
p1i |
p2i |
… |
pji |
… |
pqi |
|
… |
… |
… |
… |
… |
… |
… |
|
PJp |
p1p |
p2p |
… |
pjp |
… |
pqp |
|
PJ |
p.2 |
p.3 |
… |
p.4 |
… |
p.5 |
Les profils colonnes sont les répartitions suivant les modalités en lignes des individus donnés en colonnes.
|
profil
mm |
profil
mf |
profil
MF |
profil MM |
centre
de
gravité PI |
brunes |
0.474 |
0.311 |
0.270 |
0.382 |
0.357 |
blondes |
0.271 |
0.462 |
0.257 |
0.309 |
0.319 |
non
fumeur |
0.256 |
0.227 |
0.474 |
0.309 |
0.324 |
total |
1 |
1 |
1 |
1 |
1 |
profils
colonnes PIj
La notation est la suivante :
|
|
|
|
|
Y |
|
|
|
|
|
PI1 |
PI2 |
… |
PIj |
… |
PIq |
centre de
gravité PI |
|
x1 |
p11 |
p12 |
… |
p1j |
… |
p1q |
p1. |
|
x2 |
p21 |
p22 |
… |
p2j |
… |
p2q |
p2. |
|
… |
… |
… |
… |
… |
… |
… |
… |
X |
xi |
pi1 |
pi2 |
… |
pij |
… |
piq |
pi. |
|
… |
… |
… |
… |
… |
… |
… |
… |
|
xp |
pp1 |
pp2 |
… |
ppj |
… |
ppq |
pp. |
|
|
1 |
1 |
|
1 |
|
1 |
|
Définitions :
· La distance du c2 entre deux profils lignes PJi et PJi’ est définie par son carré de la façon suivante :
|
|
q |
|
d2(i,i’) |
= |
S |
[ pji – pji’]2
/ p.j |
|
|
j = 1 |
|
· La distance du c2 entre deux profils colonnes PIj et PIj’ est définie par son carré de la façon suivante :
|
|
p |
|
d2(i,i’) |
= |
S |
[ pij – pij’]2
/ pi. |
|
|
j = 1 |
|
Exemples :
|
x1 |
x2 |
x3 |
x1 |
0.000 |
|
|
x2 |
0.136 |
0.000 |
|
x3 |
0.226 |
0.252 |
0.000 |
Distances entre les profils lignes
|
y1 |
y2 |
y3 |
y4 |
y1 |
0.000 |
|
|
|
y2 |
0.192 |
0.000 |
|
|
y3 |
0.264 |
0.325 |
0.000 |
|
y4 |
0.037 |
0.109 |
0.128 |
0.000 |
Distances entre les profils colonnes
· Recherche des axes les plus proches des points (critère des moindres carrés)
· Axes principaux et composantes principales : facteurs principaux.
· Inertie = variance des facteurs
· somme des inertie : c2/N (N : somme du tableau)
· Valeur propre « triviale » égale à 0 ou 1 suivant le logiciel.
· c2 = 35.726, P(X²>x²)= 0.0000
· l1 = 0.04495, l2 = 0.02284, l3 = 0.00000, l4 = 0
· Cette propriété relie les profils colonnes et les profils lignes.
· Les ensembles de profils ont les mêmes valeurs propres.
· Il existe une relation entre les facteurs sur les profils lignes et les facteurs sur les profils colonnes.
Poids : chaque profil intervient d’autant plus dans l’analyse que son poids, égal à la somme pi. (profil ligne) ou p.j (profil colonne) est élevé.
contributions : les contributions mesurent l’influence des profils dans le calcul des axes principaux.
Moyennes et variances des facteurs : comme en ACP, les moyennes des facteurs sont nulles, les variances égales aux valeurs propres, et les coovariances à 0. On n’oubliera pas de pondérer les profils dans les calculs.
Coordonnées
des profils lignes :
|
poids |
C(i) |
Cos²(i) |
Contrib(i) |
C(i) |
Cos²(i) |
Contrib(i) |
brunes |
0.357 |
-0.128 |
0.331 |
12.9 |
-0.181 |
0.669 |
51.4 |
blondes |
0.319 |
-0.168 |
0.449 |
20.0 |
0.186 |
0.551 |
48.2 |
ne fume pas |
0.324 |
0.305 |
0.997 |
67.1 |
0.017 |
0.003 |
0.4 |
Coordonnées
des profils colonnes :
|
poids |
C(j) |
Cos²(j) |
Contrib(j) |
C(j) |
Cos²(j) |
Contrib(j) |
mm |
0.252 |
-0.131 |
0.286 |
9.7 |
-0.207 |
0.714 |
47.5 |
mf |
0.226 |
-0.226 |
0.513 |
25.7 |
0.220 |
0.487 |
48.0 |
MF |
0.288 |
0.316 |
0.980 |
64.1 |
0.045 |
0.020 |
2.5 |
MM |
0.233 |
-0.030 |
0.312 |
0.5 |
-0.044 |
0.688 |
2.0 |