gestion d’un portefeuille international d’actions et d’obligations
par la régression linéaire multiple
Un fonds de placements internationaux gère son portefeuille d’actions et d’obligations en fonction des critères économiques, démographiques et sociaux des 50 pays dans lesquels une partie des souscriptions qui lui sont confiées sont investies ou en voie de l’être. Pour cela, il dispose des statistiques suivantes sur les 50 pays :
SR : taux moyen d'épargne par personnes entre 1960 et1970
POP15 :
pourcentage de la population de moins de 15 ans
POP75 :
pourcentage de la population de plus de 75 ans
DPI : revenu moyen par personne de 1960 à 1970
DDPI : taux moyen de croissance du revenu moyen par personne.
Les données sont extraites de l’ouvrage de Belsley et coll. Regression diagnostics (cf. bibl.). On donne en annexe les résultats numériques et graphiques nécessaires. Les données et les paramètres se trouvent dans les fichiers Belsley.dat et Belsley.par.
1) Comment, en supposant connu l’avenir de la structure démographique de la population et du développement économique des pays, peut-on déterminer les pays dont le taux d’épargne va augmenter ?
2) étudier les représentations graphiques de la forme (variable explicative, variable expliquée) (on donne en annexe la représentation des couples POP15 x SR et DDPI x SR).
3) Effectuer la régression linéaire multiple du taux moyen d’épargne SR par l’accroissement du revenu moyen par personne (DDPI) et les pourcentages de population de moins de 15 ans et de plus de 75 ans (POP15 et POP75). Expliquer les résultats
4) Calculer le taux moyen d’épargne des pays de rang 7 et 46 estimé par le modèle et en déduire les résidus. Que peut-on en dire ?
5) étudier les résidus. Que peut-on en déduire ?
6) Que peut-on dire des coefficients de corrélation entre le taux moyen d’épargne et les pourcentages de population de moins de 15 ans et de plus de 75 ans ? Comment interpréter les signes des coefficients de régression correspondants ?
7) Recommencer la régression en remplaçant les variables explicatives POP15 et POP75 par une seule variable.
8) Les économistes prévoient à l’horizon 2010 pour les pays n° 23, 37 et 38 les valeurs suivantes :
|
POP15 |
POP75 |
DPI |
DDPI |
2 |
23.32 |
4.41 |
1507.99 |
3.93 |
23 |
17.01 |
13.01 |
1457.28 |
9.10 |
37 |
21.92 |
9.45 |
650.96 |
6.67 |
38 |
28.24 |
1.98 |
735.79 |
2.35 |
Parmi ces pays, quels sont ceux dont le taux d’épargne augmentera le plus si ces prévisions se réalisent ?
Tableau de données
n° |
|
SR |
POP15 |
POP75 |
DPI |
DDPI |
n° |
|
SR |
POP15 |
POP75 |
DPI |
DDPI |
1 |
Australie |
11.43 |
29.35 |
2.87 |
2329.68 |
2.87 |
26 |
Malte |
15.48 |
32.54 |
2.47 |
601.05 |
8.12 |
2 |
Autriche |
12.07 |
23.32 |
4.41 |
1507.99 |
3.93 |
27 |
Norvège |
10.25 |
25.95 |
3.67 |
2231.03 |
3.62 |
3 |
Belgique |
13.17 |
23.80 |
4.43 |
2108.47 |
3.82 |
28 |
Pays
Bas |
14.65 |
24.71 |
3.25 |
1740.70 |
7.66 |
4 |
Bolivie |
5.75 |
41.89 |
1.67 |
189.13 |
0.22 |
29 |
Nouvelle
Zélande |
10.67 |
32.61 |
3.17 |
1487.52 |
1.76 |
5 |
Brésil |
12.88 |
42.19 |
0.83 |
728.47 |
4.56 |
30 |
Nicaragua |
7.30 |
45.04 |
1.21 |
325.54 |
2.48 |
6 |
Canada |
8.79 |
31.72 |
2.85 |
2982.88 |
2.43 |
31 |
Panama |
4.44 |
43.56 |
1.20 |
568.56 |
3.61 |
7 |
Chili |
0.60 |
39.74 |
1.34 |
662.86 |
2.67 |
32 |
Paraguay |
2.02 |
41.18 |
1.05 |
220.56 |
1.03 |
8 |
Taïwan |
11.90 |
44.75 |
0.67 |
289.52 |
6.51 |
33 |
Pérou |
12.70 |
44.19 |
1.28 |
400.06 |
0.67 |
9 |
Colombie |
4.98 |
46.64 |
1.06 |
276.65 |
3.08 |
34 |
Philippines |
12.78 |
46.26 |
1.12 |
152.01 |
2.00 |
10 |
Costa
Rica |
10.78 |
47.64 |
1.14 |
471.24 |
2.80 |
35 |
Portugal |
12.49 |
28.96 |
2.85 |
579.51 |
7.48 |
11 |
Danemark |
16.85 |
24.42 |
3.93 |
2496.53 |
3.99 |
36 |
Afrique
du sud |
11.14 |
31.94 |
2.28 |
651.11 |
2.19 |
12 |
Equateur |
3.59 |
46.31 |
1.19 |
287.77 |
2.19 |
37 |
Rhodésie
du sud |
13.30 |
31.92 |
1.52 |
250.96 |
2.00 |
13 |
Finlande |
11.24 |
27.84 |
2.37 |
1681.25 |
4.32 |
38 |
Espagne |
11.77 |
27.74 |
2.87 |
768.79 |
4.35 |
14 |
France |
12.64 |
25.06 |
4.70 |
2213.82 |
4.52 |
39 |
Suède |
6.86 |
21.44 |
4.54 |
3299.49 |
3.01 |
15 |
RFA |
12.55 |
23.31 |
3.35 |
2457.12 |
3.44 |
40 |
Suisse |
14.13 |
23.49 |
3.73 |
2630.96 |
2.70 |
16 |
Grèce |
10.67 |
25.62 |
3.10 |
870.85 |
6.28 |
41 |
Turquie |
5.13 |
43.42 |
1.08 |
389.66 |
2.96 |
17 |
Guatemala |
3.01 |
46.05 |
0.87 |
289.71 |
1.48 |
42 |
Tunisie |
2.81 |
46.12 |
1.21 |
249.87 |
1.13 |
18 |
Honduras |
7.70 |
47.32 |
0.58 |
232.44 |
3.19 |
43 |
Royaume
Uni |
7.81 |
23.27 |
4.46 |
1813.93 |
2.01 |
19 |
Islande |
1.27 |
34.03 |
3.08 |
1900.10 |
1.12 |
44 |
Etats
Unis |
7.56 |
29.81 |
3.43 |
4001.89 |
2.45 |
20 |
Inde |
9.00 |
41.31 |
0.96 |
88.94 |
1.54 |
45 |
Vénézuela |
9.22 |
46.40 |
0.90 |
813.39 |
0.53 |
21 |
Irlande |
11.34 |
31.16 |
4.19 |
1139.95 |
2.99 |
46 |
Zambie |
18.56 |
45.25 |
0.56 |
138.33 |
5.14 |
22 |
Italie |
14.28 |
24.52 |
3.48 |
1390.00 |
3.54 |
47 |
Jamaïque |
7.72 |
41.12 |
1.73 |
380.47 |
10.23 |
23 |
Japon |
21.10 |
27.01 |
1.91 |
1257.28 |
8.21 |
48 |
Uruguay |
9.24 |
28.13 |
2.72 |
766.54 |
1.88 |
24 |
Corée |
3.98 |
41.74 |
0.91 |
207.68 |
5.81 |
49 |
Libye |
8.89 |
43.69 |
2.07 |
123.58 |
16.71 |
25 |
Luxembourg |
10.35 |
21.80 |
3.73 |
2449.39 |
1.57 |
50 |
Malaisie |
4.71 |
47.20 |
0.66 |
242.69 |
5.08 |
Correction
1) Une méthode possible pour déterminer le taux d’épargne en fonction de la structure démographique et du développement économique consiste à effectuer la régression linéaire multiple en considérant :
· comme variable expliquée le taux moyen d’épargne par personne SR ;
· comme variables explicatives correspondant à l’avenir démographique du pays les pourcentages de population POP15 et POP75 : ces pourcentages peuvent être évalués pour les années à venir ;
· comme variables explicatives caractéristiques du développement économique le revenu moyen DPI et son taux moyen de croissance DDPI, dans la mesure où ils peuvent être estimés par des projections économiques.
La régression linéaire donne une équation qui permet d’estimer le taux moyen d’épargne en fonction des prévisions de ces quatre variables. On pourra ainsi distinguer ceux dont le taux moyen d’épargne devrait augmenter.
2) On donne ci-desssous en figure 1 la représentation graphique des pays suivant le taux d’épargne et le pourcentage de population de moins de 15 ans :
23 |SR
|
|
| 46
11
|
|
26 |
40 22
|
3 37 | 5
2 14 35
| 33 8 34
13 1
2136 |
25 16
29 * 10
my=-9.671-------48-----------------------*-------------20------------45----
6 |
49 POP15
43 44 | 47
30 18
39 |
| 4 41
| 31
950
| 24
12
| 17
19 | 32
| 7
|
|
Représentation graphique des couples SR, POP15
r=-.456, nb. d'obs.: 50
Elle montre l’existence de deux groupes distincts, le premier rassemblant des pays jeunes à faible taux d’épargne, le second des pays plus vieux à taux d’épargne élevé. On ne distingue pas de points aberrants pouvant perturber la régression.
Le second schéma montre que le taux d’épargne a tendance à augmenter en fonction de l’accroissement du revenu disponible : les pays dans lesquels cet accroissement est rapide bénéficie d’un plus fort taux d’épargne. Par contre, on distingue deux pays particuliers, le 47 et surtout le 49. Il faudra contrôler les résultats de la régression.
|SR 23
|
|
| 46
11
|
|
26
40 22 | 28
37 3 5
33
34 15 2 14 8
35
36 1 |13
25 10 27*
16
45-2048-------------*--------------------------------------------------DDPI
6 | 49
4330 18 | 47
39 |
4 41 |
9 31| 50
12 | 24
4217 |
19 |
7 |
Représentation graphique des couples DDPI, SR (50 pays)
r= .305, nb. d'obs.: 50
3) Le modèle donne la formule du taux d’épargne en fonction des trois variables explicatives choisies :
SR = -0.4518 POP15 + 0.4278 DDPI – 1.8354 POP75 + 28.1248
Le coefficient de détermination est égal à 0.3365, Cette valeur est largement significative (f = 7.778, P(F>7.778 = 0.0003 pour des ddl égaux à 3 et 46).
La variance résiduelle estimée est égale à 14.19. La connaissance des valeurs des variables explicatives permet donc de reconstituer le taux d’épargne avec une erreur approximative de l’ordre de 3.77 = 14.191/2. En l’absence de toute information, la valeur reconstituée est la moyenne avec une erreur de l’ordre de 4.43 = 19.671/2: le modèle améliore l’estimation .
4) En appliquant cette formule aux pays de rang 7 et 46, on obtient l’estimation de leur taux d’épargne :
SR(7) = 8.8539 SR(46) = 8.8530
Et on en déduit les résidus :
e7 = 0.6 - 8.8539= -8.2539 e46 = 18.56 - 8.8530 = 9.707
Ces résidus sont largement supérieurs à l’écart-type des résidus, s = 3.61, et le taux d’épargne du pays 7 est largement surestimé par le modèle : normalement, ce pays devrait avoir un taux d’épargne supérieur, à l’inverse du pays 46.
5) L’analyse des résidus montre que l’effet des pays 46 et 49 est négligeable sur l’estimation des paramètres. L’histogramme des résidus est proche de la loi normale, et le nombre de résidus en dehors de l’intervalle +/- 2 s est égal à 2 (pays 7 et 46), soit 4%, et 17 en dehors de l’intervalle +/- s soit 34% : ils sont proches des pourcentages correspondant à la loi normale (5% et 30%).
Histogramme
des résidus (50 valeurs)
Densité de la loi
de Gauss de mêmes paramètres
Le test d’ajustement du c2 aboutit largement à l’acceptation d’une répartition normale. Les calculs ci-dessous ont été effectués sur les résidus observés en considérant 7 classes de même amplitude et en réunissant les classes 1 et 2, puis les classes 6 et 7 :
Test du Chi-2: X2 = 1.7470 Ddl: 3 P(c2>1.747) = 0.6265
La répartition des résidus peut donc être considérée comme normale et on peut calculer les intervalles de confiance du taux d’épargne. Le test précédent sur le F est justifié.
6) La présence d’un coefficient de corrélation élevé (-0.9085) entre les variables explicatives POP15 et POP75 complique l’interprétation de leurs coefficients de régression. Les signes sont tous deux négatifs, alors que les coefficients de corrélation avec le taux d’épargne sont opposés. C’est ainsi que, d’après le coefficient de corrélation, le taux d’épargne devrait augmenter en fonction du pourcentage de la population de plus de 75 ans (coefficient de corrélation positif), alors que dans la formule de régression, c’est le contraire qui apparaît (coefficient de régression négatif). Cela s’explique par le fait que ces deux variables, qui caractérisent la démographie de chaque pays, sont liées entre elles par la relation ci-dessous :
POP15 + POP75 + POPA = 100%
expression dans laquelle POPA est le pourcentage de population âgée de plus de 15 et de moins de 75 ans. Dans la mesure où ce pourcentage ne varie pas beaucoup, une valeur élevée de POP75 correspond à une valeur faible de POP15 : ces deux valeurs se compensent au niveau du modèle de régression.
7) On peut
résoudre cette difficulté en considérant comme variable explicative
POPA = 100-POP15-POP75 au lieu de POP15 et POP75. On obtient l’équation
ci-dessous :
SR = 0.2554 POPA + 0.4398 DDPI – 7.9764
avec un coefficient de détermination égal à 0.3002, un peu moins élevé que le précédent (0.3365). La variance résiduelle estimée est égale à 14.645 au lieu de 14.19 : le modèle est légèrement moins bon suivant ces deux critères, mais son interprétation est beaucoup plus facile puisque le taux d’épargne augmente en fonction du pourcentage POPA qui correspond plus ou moins au pourcentage de la population active.
8) On donne dans le tableau ci-dessous la prévision SR du taux d’épargne des pays 2, 23, 37 et 38 suivie des bornes de l’intervalle de confiance à 95%, le taux d’épargne actuel et la différence :
|
POP15 |
POP75 |
POPA |
DDPI |
SRpre |
SR1 |
SR2 |
SRact |
SRpre
- SRact |
2 |
23.32 |
4.41 |
72.27 |
3.93 |
12.21 |
4.31 |
20.10 |
12.07 |
0.14 |
23 |
17.01 |
13.01 |
69.98 |
9.10 |
13.90 |
5.80 |
22.00 |
21.10 |
-8.20 |
37 |
21.92 |
9.45 |
68.63 |
6.67 |
12.48 |
4.59 |
20.39 |
11.14 |
1.34 |
38 |
28.24 |
1.98 |
69.78 |
2.35 |
10.88 |
3.01 |
18.75 |
13.30 |
-2.42 |
Il n’y a guère que dans le pays 37 que le taux d’épargne devrait augmenter.