une
propriété mathématique des résidus.
Nous démontrons ici une
propriété mathématique des résidus obtenus dans la régression linéaire d’une
variable expliquée Y par une variable explicative X, propriété qui se généralise
d’ailleurs au cas de la régression linéaire multiple (plusieurs variables
explicatives X1, X2, …, Xp de la variable Y).
Cette propriété permet d’interpréter le résidu ei comme une mesure
de l’influence de l’observation xi sur le coefficient de corrélation
des deux variables.
La démonstration repose sur
des dérivations de fonctions élémentaires connues en principe de tout étudiant
de terminale de toute section. L’interprétation des formules repose sur la
propriété de la dérivée d’une fonction :
f(x+h) - f(x) = h f’(x) + e
où e tend vers 0 lorsque h tend vers 0. La dérivée f’(x) caractérise donc la variation de f(x) lorsque x varie d’une faible valeur h.
1) On considère la moyenne mx
de la série (xi) i = 1, …, n. Cette moyenne est fonction d’une
observation xi considérée donc comme une variable. Calculer la
dérivée de mx par rapport à xi.
2) Soit sx2
la variance de la série (xi). On utilisera la formule de calcul de
la variance pour calculer la dérivée de sx2. En déduire
la dérivée de sx par rapport à xi (en fonction de sx)
et commenter ce résultat.
2) Soit sxy la
covariance des deux séries. Calculer la dérivée de sxy par rapport à
xi. Commenter le résultat.
3) En déduire la dérivée du
coefficient de corrélation r(x,y) entre les deux séries. Commenter le résultat.