Gestion d’un
portefeuille international
d’actions et
d’obligations
Un fonds de placements internationaux gère son portefeuille d’actions et d’obligations en fonction des critères économiques et sociaux des 50 pays dans lesquels une partie des souscriptions qui lui sont confiées sont investies ou en voie de l’être. Pour cela, il dispose des statistiques suivantes sur les 50 pays :
SR: |
taux moyen d'épargne par personnes entre 1960 et1970 |
POP15: |
pourcentage de la population de moins de 15 ans |
POP75: |
pourcentage de la population de plus de 75 ans |
DPI: |
revenu moyen par personne de 1960 à 1970 (en dollars) |
DDPI: |
taux moyen de croissance du revenu moyen par personne. |
Les données réelles (fichier de paramètres Belsley.par) sont extraites de l’ouvrage de Belsley et coll. Regression diagnostics (Wiley). On utilisera le programme Régression linéaire simple du menu Analyse Statistique Descriptive pour effectuer les calculs et construire les représentations graphiques.
1) Calculer les coefficients d’asymétrie et d’aplatissement des cinq variables. Quelles sont les variables dont la répartition peut être considérée comme normale ? Vérifier en construisant un histogramme.
2) Représenter graphiquement les 50 couples de la forme SR x POP15. Que peut-on en dire ? Combien de représentations graphiques de ce type peut-on construire ? Examiner ces représentations graphiques : les liaisons paraissent-elles linéaires ? Existe-t-il des points aberrants ?
3) Calculer la matrice de corrélation entre les cinq variables. Quels sont les coefficients de corrélation dont la taille peut être considérée comme grande en valeur absolue ? Que peut-on dire de cette interprétation ?
4) Expliciter la relation entre les couples POP15, POP75.
5) L’objectif de l’analyse est d’étudier le taux d’épargne SR en fonction d’une des autres variables. Donner l’équation générale du modèle, en précisant les variables mises en jeu et les hypothèses initiales.
6) Que peut-on dire de la relation entre SR et POP15 ?
7) On effectue la régression linéaire du taux d’épargne en considérant comme variable explicative le pourcentage de population de moins de 15 ans POP15. Calculer les coefficients de régression b et a de la droite de régression y = b x + a.
8) Calculer la variance des résidus obtenus en effectuant la régression de SR par chacune des quatre autres variables. Expliquer le choix de la variable explicative POP15.
9) Construire l’histogramme des résidus en les répartissant dans des classes de même effectif (on choisira le nombre de classes).
10) Peut-on considérer que la répartition des résidus est proche de la courbe en cloche (on calculera les coefficients d’asymétrie et d’aplatissement des résidus) ?
11) Déterminer les résidus particulièrement élevés en valeur absolue. Justifier la règle choisie.
12) Quelle autre hypothèse est nécessaire pour que l’on puisse effectuer des estimations et des prévisions par intervalles de confiance ? Cette hypothèse est-elle vérifiée ?
13) Le taux d’épargne de l’Islande (n° 19 sur les graphiques) est de 1.27 et le pourcentage de population de moins de quinze ans de 34.03. Quel est le taux d’épargne estimé par le modèle ? Que peut-on dire du résidu ?
14) Le gestionnaire préfère investir dans des pays ayant un fort taux d’épargne compte tenu de leur pourcentage de population de moins de quinze ans. Déterminer ces pays.
Tableau de
données
n° |
|
SR |
POP15 |
POP75 |
DPI |
DDPI |
n° |
|
SR |
POP15 |
POP75 |
DPI |
DDPI |
1 |
Australie |
11.43 |
29.35 |
2.87 |
2329.68 |
2.87 |
26 |
Malte |
15.48 |
32.54 |
2.47 |
601.05 |
8.12 |
2 |
Autriche |
12.07 |
23.32 |
4.41 |
1507.99 |
3.93 |
27 |
Norvège |
10.25 |
25.95 |
3.67 |
2231.03 |
3.62 |
3 |
Belgique |
13.17 |
23.80 |
4.43 |
2108.47 |
3.82 |
28 |
Pays
Bas |
14.65 |
24.71 |
3.25 |
1740.70 |
7.66 |
4 |
Bolivie |
5.75 |
41.89 |
1.67 |
189.13 |
0.22 |
29 |
Nouvelle
Zélande |
10.67 |
32.61 |
3.17 |
1487.52 |
1.76 |
5 |
Brésil |
12.88 |
42.19 |
0.83 |
728.47 |
4.56 |
30 |
Nicaragua |
7.30 |
45.04 |
1.21 |
325.54 |
2.48 |
6 |
Canada |
8.79 |
31.72 |
2.85 |
2982.88 |
2.43 |
31 |
Panama |
4.44 |
43.56 |
1.20 |
568.56 |
3.61 |
7 |
Chili |
0.60 |
39.74 |
1.34 |
662.86 |
2.67 |
32 |
Paraguay |
2.02 |
41.18 |
1.05 |
220.56 |
1.03 |
8 |
Taïwan |
11.90 |
44.75 |
0.67 |
289.52 |
6.51 |
33 |
Pérou |
12.70 |
44.19 |
1.28 |
400.06 |
0.67 |
9 |
Colombie |
4.98 |
46.64 |
1.06 |
276.65 |
3.08 |
34 |
Philippines |
12.78 |
46.26 |
1.12 |
152.01 |
2.00 |
10 |
Costa Rica |
10.78 |
47.64 |
1.14 |
471.24 |
2.80 |
35 |
Portugal |
12.49 |
28.96 |
2.85 |
579.51 |
7.48 |
11 |
Danemark |
16.85 |
24.42 |
3.93 |
2496.53 |
3.99 |
36 |
Afrique
du sud |
11.14 |
31.94 |
2.28 |
651.11 |
2.19 |
12 |
Equateur |
3.59 |
46.31 |
1.19 |
287.77 |
2.19 |
37 |
Rhodésie
du sud |
13.30 |
31.92 |
1.52 |
250.96 |
2.00 |
13 |
Finlande |
11.24 |
27.84 |
2.37 |
1681.25 |
4.32 |
38 |
Espagne |
11.77 |
27.74 |
2.87 |
768.79 |
4.35 |
14 |
France |
12.64 |
25.06 |
4.70 |
2213.82 |
4.52 |
39 |
Suède |
6.86 |
21.44 |
4.54 |
3299.49 |
3.01 |
15 |
RFA |
12.55 |
23.31 |
3.35 |
2457.12 |
3.44 |
40 |
Suisse |
14.13 |
23.49 |
3.73 |
2630.96 |
2.70 |
16 |
Grèce |
10.67 |
25.62 |
3.10 |
870.85 |
6.28 |
41 |
Turquie |
5.13 |
43.42 |
1.08 |
389.66 |
2.96 |
17 |
Guatemala |
3.01 |
46.05 |
0.87 |
289.71 |
1.48 |
42 |
Tunisie |
2.81 |
46.12 |
1.21 |
249.87 |
1.13 |
18 |
Honduras |
7.70 |
47.32 |
0.58 |
232.44 |
3.19 |
43 |
Royaume
Uni |
7.81 |
23.27 |
4.46 |
1813.93 |
2.01 |
19 |
Islande |
1.27 |
34.03 |
3.08 |
1900.10 |
1.12 |
44 |
Etats
Unis |
7.56 |
29.81 |
3.43 |
4001.89 |
2.45 |
20 |
Inde |
9.00 |
41.31 |
0.96 |
88.94 |
1.54 |
45 |
Vénézuela |
9.22 |
46.40 |
0.90 |
813.39 |
0.53 |
21 |
Irlande |
11.34 |
31.16 |
4.19 |
1139.95 |
2.99 |
46 |
Zambie |
18.56 |
45.25 |
0.56 |
138.33 |
5.14 |
22 |
Italie |
14.28 |
24.52 |
3.48 |
1390.00 |
3.54 |
47 |
Jamaïque |
7.72 |
41.12 |
1.73 |
380.47 |
10.23 |
23 |
Japon |
21.10 |
27.01 |
1.91 |
1257.28 |
8.21 |
48 |
Uruguay |
9.24 |
28.13 |
2.72 |
766.54 |
1.88 |
24 |
Corée |
3.98 |
41.74 |
0.91 |
207.68 |
5.81 |
49 |
Libye |
8.89 |
43.69 |
2.07 |
123.58 |
16.71 |
25 |
Luxembourg |
10.35 |
21.80 |
3.73 |
2449.39 |
1.57 |
50 |
Malaisie |
4.71 |
47.20 |
0.66 |
242.69 |
5.08 |
correction
1) Le logiciel donne les résultats suivants :
|
Asymétrie |
Aplatissement |
SR |
-0.0057 |
2.79 |
POP15 |
-0.0012 |
1.37 |
POP75 |
0.3146 |
1.74 |
DPI |
0.9788 |
3.03 |
DDPI |
2.2065 |
9.78 |
Pour 50 observations les valeurs limites (pour 5%) du coefficient d’asymétrie sont ±0.534 et celles du coefficient d’aplatissement 2.15 et 3.99.
La seule variable dont les deux coefficients ne sont pas à l’extérieur des intervalles est le taux d’épargne SR : c’est donc la seule dont la loi puisse être considérée comme la loi normale.
2) La représentation graphique des couples (POP15, SR) est donnée ci-dessous. On distingue clairement deux groupes de pays : à gauche de l’axe des ordonnées, du coté des abscisses négatives, les pays dont la population de moins de 15 est relativement faible, et à droite les pays jeunes, d’abscisses positives. Très peu de pays ont un pourcentage de population proche de la moyenne. Le pays de rang 46 est assez différent des autres. il mérite d’être examiné de près (Belsley et al. expliquent cette particularité par le peu de fiabilité des statistiques dans ce pays, la Zambie).
Représentation graphique des couples (POP15, SR)
(50 observations, origine au point moyen)
On peut construire 10 représentations graphiques de cette nature (5 x 4 / 2). Les liaisons entre le taux d’épargne et les pourcentages de population paraissent linéaires, mais les autres graphiques montrent une répartition asymétrique des données qui contredisent cette linéarité. Il existe un point aberrant (n°49) dans la représentation entre le taux d’épargne et l’accroissement du revenu DDPI.
3) On donne ci-dessous la matrice des corrélations :
|
POP15 |
POP75 |
DPI |
DDPI |
SR |
POP15 |
1.000 |
|
|
|
|
POP75 |
-0.908 |
1.000 |
|
|
|
DPI |
-0.756 |
0.787 |
1.000 |
|
|
DDPI |
-0.048 |
0.025 |
-0.129 |
1.000 |
|
SR |
-0.456 |
0.317 |
0.220 |
0.305 |
1.000 |
Les coefficients significatifs pour 50 observations sont ceux qui sont supérieurs en valeur absolue à 0.2759 (pour 5%). Les liaisons entre DDPI et les quatre variables SR, POP15, POP75 et DPI ne sont pas significatives. Les autres le sont. Mais cette interprétation est sujette à caution parce que les variables ne sont pas réparties comme la loi normale (cf. première question).
4) La relation entre POP15 et POP75 est très élevée (coefficient de corrélation égal à –0.908). Cette relation s’explique la nature des données, qui vérifient la relation :
POP15 + POPA + POP75 = 100%
POPA étant le pourcentage de population de 15 à 75 ans.
5) La variable expliquée Y est celle que l’on cherche à reconstruire en fonction d’une autre. C’est ici le taux d’épargne. La variable explicative X est choisie parmi les autres. Le modèle de régression consiste à poser :
Y = f(X) + e
La variable e est appelée variable résiduelle. On suppose qu’elle est de moyenne nulle, indépendante de la variable X, et répartie suivant la loi normale (courbe en cloche). .
6) La liaison entre SR et POP15 est donc réelle (figure 1). On distingue deux groupes de pays, les pays jeunes (forts pourcentages de population de moins de 15 ans, à droite du graphique) et les pays vieux (faibles pourcentages de population de moins de 15 ans, à gauche du graphique). Généralement, le taux d’épargne est important dans les pays vieux et faible dans les pays jeunes (coefficient de corrélation négatif).
Rien ne contredit l’hypothèse d’une relation linéaire entre SR et POP15. On distingue pas de point aberrant (sauf peut-être le n°46) ni de point influent. On peut donc effectuer la régression linéaire, mais il faudra vérifier que le point 46 ne perturbe pas les résultats.
7) Le coefficient directeur b de la droite y = b x + a et le coefficient constant a sont donnés par les formules :
b = r sy
/ sx |
a = my
– b mx |
On connaît r = -0.456, sx = 9.060 et sy = 4.435, my = 9.671 et mx = 35.0896.Le calcul donne :
b = -0.2230176 |
a = 17.4966 |
8) La variance des résidus est donnée par la formule :
s2
= (1 – r2) sy2 |
On effectue le calcul pour chaque valeur de r :
POP15 |
r = -0.456 |
s2 = 15.59 |
POP75 |
r = 0.317 |
s2 = 17.70 |
DPI |
r = 0.220 |
s2 = 18.71 |
DDPI |
r = 0.305 |
s2 = 17.85 |
La variable explicative choisie est POP15 parce que c’est celle qui donne les plus petits résidus et que l’hypothèse d’une relation linéaire est vraisemblable.
9) Pour 50 observations, on choisit cinq classes. On obtient la répartition suivante :
Classe |
Fréquence absolue |
en % |
Densité |
[-8.6373 , -3.3152 [ |
10 |
20 |
0.0376 |
[-3.3152 , -0.8595 [ |
10 |
20 |
0.0814 |
[-0.8595 , 0.7444 [ |
10 |
20 |
0.1247 |
[ 0.7444 , 2.7931 [ |
10 |
20 |
0.0976 |
[ 2.7931 , 11.1549 ] |
10 |
20 |
0.0239 |
On notera que les classes n’ont pas la même amplitude : la densité n’est pas proportionnelle à la proportion.
Histogramme des résidus en cinq classes de même effectif.
La classe modale est la classe 3, c’est-à-dire la classe centrale : l’histogramme est assez symétrique.
10) Les résultats numériques sont les suivants :
Coefficient d’asymétrie des résidus 0.335 |
Coefficient d’aplatissement |
3.521 |
La symétrie de l’histogramme est confirmée par le coefficient d’asymétrie relativement proche de 0 puisque inférieur en valeur absolue à 0.534. Le coefficient d’aplatissement est proche de 3 puisque compris entre 2.15 et 3.99. Ces coefficients et la forme de l’histogramme indiquent une répartition normale très vraisemblable.
11) On sait que les résidus sont de moyenne nulle. La valeur au-dessus de laquelle ils sont considérés comme grands est la moyenne plus l’écart type ou la moyenne moins l’écart type. La moyenne étant nulle, un résidu est considéré comme grand en valeur absolue s’il est supérieur à l’écart type, c’est-à-dire à 4.22. L’utilisation de cette règle est justifiée par le fait que la répartition des résidus est proche de la courbe en cloche.
Les résidus élevés en valeur absolue (indiqués par une étoile) et très élevés (deux étoiles) sont les suivants :
*5 |
4.792 |
*7 |
-8.034 |
*8 |
4.383 |
*11 |
4.799 |
*17 |
-4.217 |
**19 |
-8.637 |
**23 |
9.627 |
*24 |
-4.207 |
*26 |
5.240 |
*32 |
-6.293 |
*33 |
5.059 |
*34 |
5.600 |
*39 |
-5.855 |
*42 |
-4.401 |
*43 |
-4.497 |
**46 |
11.155 |
12) La régression suppose l’indépendance entre les résidus et la variable explicative. Pour la vérifier, le coefficient de corrélation ne suffit pas : on sait qu’il est nul. Il faut examiner le graphique. On constate ici qu’il n’existe pas de relation entre le pourcentage de population de moins de quinze ans et les résidus. Le modèle vérifie donc les hypothèses nécessaires.
Représentation graphique des couples (POP15, résidus)
(50 observations, origine au point moyen)
Dans ces graphiques : France : 14, Zambie : 46, Brésil : 5, Japon : 23, États-Unis : 44, Canada : 6, …
13) Pour calculer le taux d’épargne estimé par le modèle pour l’Islande, on applique la formule :
y = -0.2230 x 34.04 + 17.4966
Suivant cette formule, le taux d’épargne estimé pour l’Islande est égal à 9.907
Le résidu est égal à la différence entre le taux d’épargne réel de l’Islande et le taux d’épargne estimé précédent. On trouve :
résidu du taux d’épargne pour l’Islande = 1.27 – 9.907 = -8.6373
La valeur absolue de ce résidu est très supérieure à l’écart type : l’Islande est un cas particulier dont le taux d’épargne est très inférieur à ce qu’il devrait être compte tenu du pourcentage de population de moins de quinze ans dans ce pays.
14) les pays cherché sont ceux qui ont un taux d’épargne élevé compte tenu de leur population de moins de 15 ans. Ce sont les pays dont le résidu est particulièrement élevé. Les résidus sont les suivants :
On trouve les pays de rangs : 5, 8, 11, 23, 26, 33, 34, 46, c’est-à-dire : le Brésil, la Chine, le Danemark, le Japon, Malte, le Pérou, les Philippines, la Zambie. On notera la présence parmi ces pays de la Zambie dont nous avons déjà signalé les statistiques peu fiables.