Gestion d’un portefeuille international

d’actions et d’obligations

 

Un fonds de placements internationaux gère son portefeuille d’actions et d’obligations en fonction des critères économiques et sociaux des 50 pays dans lesquels une partie des souscriptions qui lui sont confiées sont investies ou en voie de l’être. Pour cela, il dispose des statistiques suivantes sur les 50 pays :

SR:

taux moyen d'épargne par personnes entre 1960 et1970

POP15:

pourcentage de la population de moins de 15 ans

POP75:

pourcentage de la population de plus de 75 ans

DPI:

revenu moyen par personne de 1960 à 1970 (en dollars)

DDPI:

taux moyen de croissance du revenu moyen par personne.

Les données réelles (fichier de paramètres Belsley.par) sont extraites de l’ouvrage de Belsley et coll. Regression diagnostics (Wiley). On utilisera le programme Régression linéaire simple du menu Analyse Statistique Descriptive pour effectuer les calculs et construire les représentations graphiques.

1) Calculer les coefficients d’asymétrie et d’aplatissement des cinq variables. Quelles sont les variables dont la répartition peut être considérée comme normale ? Vérifier en construisant un histogramme.

2) Représenter graphiquement les 50 couples de la forme SR x POP15. Que peut-on en dire ? Combien de représentations graphiques de ce type peut-on construire ? Examiner ces représentations graphiques : les liaisons paraissent-elles linéaires ? Existe-t-il des points aberrants ?

3) Calculer la matrice de corrélation entre les cinq variables. Quels sont les coefficients de corrélation dont la taille peut être considérée comme grande en valeur absolue ? Que peut-on dire de cette interprétation ?

4) Expliciter la relation entre les couples POP15, POP75.

5) L’objectif de l’analyse est d’étudier le taux d’épargne SR en fonction d’une des autres variables. Donner l’équation générale du modèle, en précisant les variables mises en jeu et les hypothèses initiales.

6) Que peut-on dire de la relation entre SR et POP15 ?

7) On effectue la régression linéaire du taux d’épargne en considérant comme variable explicative le pourcentage de population de moins de 15 ans POP15. Calculer les coefficients de régression b et a de la droite de régression y = b x + a.

8) Calculer la variance des résidus obtenus en effectuant la régression de SR par chacune des quatre autres variables. Expliquer le choix de la variable explicative POP15.

9) Construire l’histo­gramme des résidus en les répartissant dans des classes de même effectif (on choisira le nombre de classes).

10) Peut-on considérer que la répartition des résidus est proche de la courbe en cloche (on calculera les coefficients d’asymétrie et d’aplatissement des résidus) ?

11) Déterminer les résidus particulièrement élevés en valeur absolue. Justifier la règle choisie.

12) Quelle autre hypothèse est nécessaire pour que l’on puisse effectuer des estima­tions et des prévisions par intervalles de confiance ? Cette hypothèse est-elle vérifiée ?

13) Le taux d’épargne de l’Islande (n° 19 sur les graphiques) est de 1.27 et le pour­centage de population de moins de quinze ans de 34.03. Quel est le taux d’épargne estimé par le modèle ? Que peut-on dire du résidu ?

14) Le gestionnaire préfère investir dans des pays ayant un fort taux d’épargne compte tenu de leur pourcentage de population de moins de quinze ans. Déterminer ces pays.

 

Tableau de données

 

 

SR

POP15

POP75

DPI

DDPI

 

SR

POP15

POP75

DPI

DDPI

1

Australie

11.43

29.35

2.87

2329.68

2.87

26

Malte

15.48

32.54

2.47

601.05

8.12

2

Autriche

12.07

23.32

4.41

1507.99

3.93

27

Norvège

10.25

25.95

3.67

2231.03

3.62

3

Belgique

13.17

23.80

4.43

2108.47

3.82

28

Pays Bas

14.65

24.71

3.25

1740.70

7.66

4

Bolivie

5.75

41.89

1.67

189.13

0.22

29

Nouvelle Zélande

10.67

32.61

3.17

1487.52

1.76

5

Brésil

12.88

42.19

0.83

728.47

4.56

30

Nicaragua

7.30

45.04

1.21

325.54

2.48

6

Canada

8.79

31.72

2.85

2982.88

2.43

31

Panama

4.44

43.56

1.20

568.56

3.61

7

Chili

0.60

39.74

1.34

662.86

2.67

32

Paraguay

2.02

41.18

1.05

220.56

1.03

8

Taïwan

11.90

44.75

0.67

289.52

6.51

33

Pérou

12.70

44.19

1.28

400.06

0.67

9

Colombie

4.98

46.64

1.06

276.65

3.08

34

Philippines

12.78

46.26

1.12

152.01

2.00

10

Costa Rica

10.78

47.64

1.14

471.24

2.80

35

Portugal

12.49

28.96

2.85

579.51

7.48

11

Danemark

16.85

24.42

3.93

2496.53

3.99

36

Afrique du sud

11.14

31.94

2.28

651.11

2.19

12

Equateur

3.59

46.31

1.19

287.77

2.19

37

Rhodésie du sud

13.30

31.92

1.52

250.96

2.00

13

Finlande

11.24

27.84

2.37

1681.25

4.32

38

Espagne

11.77

27.74

2.87

768.79

4.35

14

France

12.64

25.06

4.70

2213.82

4.52

39

Suède

6.86

21.44

4.54

3299.49

3.01

15

RFA

12.55

23.31

3.35

2457.12

3.44

40

Suisse

14.13

23.49

3.73

2630.96

2.70

16

Grèce

10.67

25.62

3.10

870.85

6.28

41

Turquie

5.13

43.42

1.08

389.66

2.96

17

Guatemala

3.01

46.05

0.87

289.71

1.48

42

Tunisie

2.81

46.12

1.21

249.87

1.13

18

Honduras

7.70

47.32

0.58

232.44

3.19

43

Royaume Uni

7.81

23.27

4.46

1813.93

2.01

19

Islande

1.27

34.03

3.08

1900.10

1.12

44

Etats Unis

7.56

29.81

3.43

4001.89

2.45

20

Inde

9.00

41.31

0.96

88.94

1.54

45

Vénézuela

9.22

46.40

0.90

813.39

0.53

21

Irlande

11.34

31.16

4.19

1139.95

2.99

46

Zambie

18.56

45.25

0.56

138.33

5.14

22

Italie

14.28

24.52

3.48

1390.00

3.54

47

Jamaïque

7.72

41.12

1.73

380.47

10.23

23

Japon

21.10

27.01

1.91

1257.28

8.21

48

Uruguay

9.24

28.13

2.72

766.54

1.88

24

Corée

3.98

41.74

0.91

207.68

5.81

49

Libye

8.89

43.69

2.07

123.58

16.71

25

Luxembourg

10.35

21.80

3.73

2449.39

1.57

50

Malaisie

4.71

47.20

0.66

242.69

5.08


correction

1) Le logiciel donne les résultats suivants :

 

 

Asymétrie

Aplatissement

SR

-0.0057

2.79

POP15

-0.0012

1.37

POP75

0.3146

1.74

DPI

0.9788

3.03

DDPI

2.2065

9.78

 

Pour 50 observations les valeurs limites (pour 5%) du coefficient d’asymétrie sont ±0.534 et celles du coefficient d’aplatissement 2.15 et 3.99.

La seule variable dont les deux coefficients ne sont pas à l’extérieur des intervalles est le taux d’épargne SR : c’est donc la seule dont la loi puisse être considérée comme la loi normale.

2) La représentation graphique des couples (POP15, SR) est donnée ci-dessous. On distingue clairement deux groupes de pays : à gauche de l’axe des ordonnées, du coté des abscisses négatives, les pays dont la population de moins de 15 est relativement faible, et à droite les pays jeunes, d’abscisses positives. Très peu de pays ont un pourcentage de population proche de la moyenne. Le pays de rang 46 est assez différent des autres. il mérite d’être examiné de près (Belsley et al. expliquent cette particularité par le peu de fiabilité des statistiques dans ce pays, la Zambie).

 

Représentation graphique des couples (POP15, SR)

(50 observations, origine au point moyen)

 

On peut construire 10 représentations graphiques de cette nature (5 x 4 / 2). Les liaisons entre le taux d’épargne et les pourcentages de population paraissent linéaires, mais les autres graphiques montrent une répartition asymétrique des données qui contredisent cette linéarité. Il existe un point aberrant (n°49) dans la représentation entre le taux d’épargne et l’accroissement du revenu DDPI.


3) On donne ci-dessous la matrice des corrélations :

 

POP15

POP75

DPI

DDPI

SR

POP15

1.000

 

 

 

 

POP75

-0.908

1.000

 

 

 

DPI

-0.756

0.787

1.000

 

 

DDPI

-0.048

0.025

-0.129

1.000

 

SR

-0.456

0.317

0.220

0.305

1.000

Les coefficients significatifs pour 50 observations sont ceux qui sont supérieurs en valeur absolue à 0.2759 (pour 5%). Les liaisons entre DDPI et les quatre variables SR, POP15, POP75 et DPI ne sont pas significatives. Les autres le sont. Mais cette interprétation est sujette à caution parce que les variables ne sont pas réparties comme la loi normale (cf. première question).

4) La relation entre POP15 et POP75 est très élevée (coefficient de corrélation égal à –0.908). Cette relation s’explique la nature des données, qui vérifient la relation :

POP15 + POPA + POP75 = 100%

POPA étant le pourcentage de population de 15 à 75 ans.

 

5) La variable expliquée Y est celle que l’on cherche à reconstruire en fonction d’une autre. C’est ici le taux d’épargne. La variable explicative X est choisie parmi les autres. Le modèle de régression consiste à poser :

Y = f(X) + e

La variable e est appelée variable résiduelle. On suppose qu’elle est de moyenne nulle, indépendante de la variable X, et répartie suivant la loi normale (courbe en cloche). .

6) La liaison entre SR et POP15 est donc réelle (figure 1). On distingue deux groupes de pays, les pays jeunes (forts pourcentages de population de moins de 15 ans, à droite du graphique) et les pays vieux (faibles pourcentages de population de moins de 15 ans, à gauche du graphique). Généralement, le taux d’épargne est important dans les pays vieux et faible dans les pays jeunes (coefficient de corrélation négatif).

Rien ne contredit l’hypothèse d’une relation linéaire entre SR et POP15. On distingue pas de point aberrant (sauf peut-être le n°46) ni de point influent. On peut donc effectuer la régression linéaire, mais il faudra vérifier que le point 46 ne perturbe pas les résultats.

7) Le coefficient directeur b de la droite y = b x + a et le coefficient constant a sont donnés par les formules :

b = r sy / sx

a = my – b mx

On connaît r = -0.456, sx = 9.060 et sy = 4.435, my = 9.671 et mx = 35.0896.Le calcul donne :

b = -0.2230176

a = 17.4966

8) La variance des résidus est donnée par la formule :

s2 = (1 – r2) sy2

On effectue le calcul pour chaque valeur de r :

POP15

r = -0.456

s2 = 15.59

POP75

r =  0.317

s2 = 17.70

DPI

r =  0.220

s2 = 18.71

DDPI

r =  0.305

s2 = 17.85

La variable explicative choisie est POP15 parce que c’est celle qui donne les plus petits résidus et que l’hypothèse d’une relation linéaire est vraisemblable.

9) Pour 50 observations, on choisit cinq classes. On obtient la répartition suivante :

 

Classe

Fréquence absolue

en %

Densité

[-8.6373 , -3.3152 [

10

20

0.0376

[-3.3152 , -0.8595 [

10

20

0.0814

[-0.8595 ,  0.7444 [

10

20

0.1247

[ 0.7444 ,  2.7931 [

10

20

0.0976

[ 2.7931 , 11.1549 ]

10

20

0.0239

On notera que les classes n’ont pas la même amplitude : la densité n’est pas proportionnelle à la proportion.

 

Histogramme des résidus en cinq classes de même effectif.

 

La classe modale est la classe 3, c’est-à-dire la classe centrale : l’histogramme est assez symétrique.

10) Les résultats numériques sont les suivants :

Coefficient d’asymétrie des résidus 0.335

Coefficient d’aplatissement

3.521

La symétrie de l’histogramme est confirmée par le coefficient d’asymétrie relative­ment proche de 0 puisque inférieur en valeur absolue à 0.534. Le coefficient d’aplatissement est proche de 3 puisque compris entre 2.15 et 3.99. Ces coefficients et la forme de l’histogramme indiquent une répartition normale très vraisemblable.

11) On sait que les résidus sont de moyenne nulle. La valeur au-dessus de laquelle ils sont considérés comme grands est la moyenne plus l’écart type ou la moyenne moins l’écart type. La moyenne étant nulle, un résidu est considéré comme grand en valeur absolue s’il est supérieur à l’écart type, c’est-à-dire à 4.22. L’utilisation de cette règle est justifiée par le fait que la répartition des résidus est proche de la courbe en cloche.

Les résidus élevés en valeur absolue (indiqués par une étoile) et très élevés (deux étoiles) sont les suivants :

*5

4.792

*7

-8.034

*8

4.383

*11

4.799

*17

-4.217

**19

-8.637

**23

9.627

*24

-4.207

*26

5.240

*32

-6.293

*33

5.059

*34

5.600

*39

-5.855

*42

-4.401

*43

-4.497

**46

11.155

12) La régression suppose l’indépendance entre les résidus et la variable explicative. Pour la vérifier, le coefficient de corrélation ne suffit pas : on sait qu’il est nul. Il faut examiner le graphique. On constate ici qu’il n’existe pas de relation entre le pourcentage de population de moins de quinze ans et les résidus. Le modèle vérifie donc les hypothèses nécessaires.

Représentation graphique des couples (POP15, résidus)

(50 observations, origine au point moyen)

 

Dans ces graphiques : France : 14, Zambie : 46, Brésil : 5,       Japon : 23, États-Unis : 44, Canada : 6, …

13) Pour calculer le taux d’épargne estimé par le modèle pour l’Islande, on applique la formule :

y = -0.2230 x 34.04 + 17.4966

Suivant cette formule, le taux d’épargne estimé pour l’Islande est égal à 9.907

Le résidu est égal à la différence entre le taux d’épargne réel de l’Islande et le taux d’épargne estimé précédent. On trouve :

résidu du taux d’épargne pour l’Islande = 1.27 – 9.907 = -8.6373

La valeur absolue de ce résidu est très supérieure à l’écart type : l’Islande est un cas particulier dont le taux d’épargne est très inférieur à ce qu’il devrait être compte tenu du pourcentage de population de moins de quinze ans dans ce pays.

14) les pays cherché sont ceux qui ont un taux d’épargne élevé compte tenu de leur population de moins de 15 ans. Ce sont les pays dont le résidu est particulièrement élevé. Les résidus sont les suivants :

On trouve les pays de rangs : 5, 8, 11, 23, 26, 33, 34, 46, c’est-à-dire : le Brésil, la Chine, le Danemark, le Japon, Malte, le Pérou, les Philippines, la Zambie. On notera la présence parmi ces pays de la Zambie dont nous avons déjà signalé les statistiques peu fiables.