Corrélation et représentation

 

L’application Corrélation et représentation a pour objectif de relier la valeur du coefficient de corrélation à la représentation graphique des couples.

On peut utiliser quatre jeux de données différents : des données bancaires (10 lignes et 4 colonnes), des données commerciales(12 lignes et 4 colonnes), sur la sécurité routière (5 lignes et 12 colonnes) et les données Euromarket. On pourra utiliser ensuite l’application Représentation graphique d'une suite d'échantillons de couples simulés pour compléter cette application.

L’exemple que nous donnons ci-dessous concerne les données bancaires.

Ces données sont définies par quatre variables quantitatives : l’âge, le revenu, le patrimoine, le montant de l’emprunt demandé et une variable qualitative en 3 modalités (1 : clients sans risque, 2 : à risque moyen, 3 : à haut risque).

La variable qualitative n’est pas exploitable dans les calculs.

Nous regardons tout d’abord la représentation des couples (âge, revenu) :

 

 

Cette représentation graphique montre que la relation de type croissant entre les deux variables âge et revenu est due aux clients de rangs 7 et 5 (très jeunes, revenus faibles), et de rang 1 (âgé, revenu élevé).

Les tableaux ci-dessous sont établis par le programme Etude d’une série de couples dans le dossier Analyse Statistique Descriptive.  Ce programme donne le coefficient de corrélation et permet d’analyser les calculs en étudiant la contribution de chaque individu à la valeur de la moyenne, de la variance et de la covariance.

On trouve :

coefficient de corrélation : 0.58

 

 

Pour distinguer les clients dont le revenu et l’âge augmentent la valeur du coefficient de corrélation, on examine le tableau suivant : 

 

 

On observe, dans la colonne (x-mx) (y - my), trois termes particulièrement élevés, correspondants aux points détectés dans l’interprétation de la représentation graphique (rangs 1, 5 et 7). Ils sont tous trois positifs, et chacun vérifie la relation de type croissant constatée sur les autres. Ce ne sont pas des points aberrants.