une propriété mathématique des résidus.

Nous démontrons ici une propriété mathématique des résidus obtenus dans la régression linéaire d’une variable expliquée Y par une variable explicative X, propriété qui se généralise d’ailleurs au cas de la régression linéaire multiple (plusieurs variables explicatives X1, X2, …, Xp de la variable Y). Cette propriété permet d’interpréter le résidu ei comme une mesure de l’influence de l’observation xi sur le coefficient de corrélation des deux variables.

La démonstration repose sur des dérivations de fonctions élémentaires connues en principe de tout étudiant de terminale de toute section. L’interprétation des formules repose sur la propriété de la dérivée d’une fonction :

f(x+h) - f(x) = h f’(x) + e

e tend vers 0 lorsque h tend vers 0. La dérivée f’(x) caractérise donc la variation de f(x) lorsque x varie d’une faible valeur h.

1) On considère la moyenne mx de la série (xi) i = 1, …, n. Cette moyenne est fonction d’une observation xi considérée donc comme une variable. Calculer la dérivée de mx par rapport à xi.

2) Soit sx2 la variance de la série (xi). On utilisera la formule de calcul de la variance pour calculer la dérivée de sx2. En déduire la dérivée de sx par rapport à xi (en fonction de sx) et commenter ce résultat.

2) Soit sxy la covariance des deux séries. Calculer la dérivée de sxy par rapport à xi. Commenter le résultat.

3) En déduire la dérivée du coefficient de corrélation r(x,y) entre les deux séries. Commenter le résultat.