gestion d’un portefeuille international d’actions et d’obligations
par la régression linéaire multiple

Un fonds de placements internationaux gère son portefeuille d’actions et d’obligations en fonction des critères économiques, démographiques et sociaux des 50 pays dans lesquels une partie des souscriptions qui lui sont confiées sont investies ou en voie de l’être. Pour cela, il dispose des statistiques suivantes sur les 50 pays :

            SR                :    taux moyen d'épargne par personnes entre 1960 et1970

         POP15             :    pourcentage de la population de moins de 15 ans

         POP75             :    pourcentage de la population de plus de 75 ans

           DPI                :    revenu moyen par personne de 1960 à 1970

          DDPI              :    taux moyen de croissance du revenu moyen par personne.

Les données sont extraites de l’ouvrage de Belsley et coll. Regression diagnostics (cf. bibl.). On donne en annexe les résultats numériques et graphiques nécessaires. Les données et les paramètres se trouvent dans les fichiers Belsley.dat et Belsley.par.

1) Comment, en supposant connu l’avenir de la structure démographique de la population et du développement économique des pays, peut-on déterminer les pays dont le taux d’épargne va augmenter ?

2) étudier les représentations graphiques de la forme (variable explicative, variable expliquée) (on donne en annexe la représentation des couples POP15 x SR et DDPI x SR).

3) Effectuer la régression linéaire multiple du taux moyen d’épargne SR par l’accroissement du revenu moyen par personne (DDPI) et les pourcentages de population de moins de 15 ans et de plus de 75 ans (POP15 et POP75). Expliquer les résultats

4) Calculer le taux moyen d’épargne des pays de rang 7 et 46 estimé par le modèle et en déduire les résidus. Que peut-on en dire ?

5) étudier les résidus. Que peut-on en déduire ?

6) Que peut-on dire des coefficients de corrélation entre le taux moyen d’épargne et les pourcentages de population de moins de 15 ans et de plus de 75 ans ? Comment interpréter les signes des coefficients de régression correspondants ?

7) Recommencer la régression en remplaçant les variables explicatives POP15 et POP75 par une seule variable.

8) Les économistes prévoient à l’horizon 2010 pour les pays n° 23, 37 et 38 les valeurs suivantes :

 

POP15

POP75

DPI

DDPI

2

23.32

4.41

1507.99

3.93

23

17.01

13.01

1457.28

9.10

37

21.92

9.45

650.96

6.67

38

28.24

1.98

735.79

2.35

 

Parmi ces pays, quels sont ceux dont le taux d’épargne augmentera le plus si ces prévisions se réalisent ?


Tableau de données

 

 

SR

POP15

POP75

DPI

DDPI

 

SR

POP15

POP75

DPI

DDPI

1

Australie

11.43

29.35

2.87

2329.68

2.87

26

Malte

15.48

32.54

2.47

601.05

8.12

2

Autriche

12.07

23.32

4.41

1507.99

3.93

27

Norvège

10.25

25.95

3.67

2231.03

3.62

3

Belgique

13.17

23.80

4.43

2108.47

3.82

28

Pays Bas

14.65

24.71

3.25

1740.70

7.66

4

Bolivie

5.75

41.89

1.67

189.13

0.22

29

Nouvelle Zélande

10.67

32.61

3.17

1487.52

1.76

5

Brésil

12.88

42.19

0.83

728.47

4.56

30

Nicaragua

7.30

45.04

1.21

325.54

2.48

6

Canada

8.79

31.72

2.85

2982.88

2.43

31

Panama

4.44

43.56

1.20

568.56

3.61

7

Chili

0.60

39.74

1.34

662.86

2.67

32

Paraguay

2.02

41.18

1.05

220.56

1.03

8

Taïwan

11.90

44.75

0.67

289.52

6.51

33

Pérou

12.70

44.19

1.28

400.06

0.67

9

Colombie

4.98

46.64

1.06

276.65

3.08

34

Philippines

12.78

46.26

1.12

152.01

2.00

10

Costa Rica

10.78

47.64

1.14

471.24

2.80

35

Portugal

12.49

28.96

2.85

579.51

7.48

11

Danemark

16.85

24.42

3.93

2496.53

3.99

36

Afrique du sud

11.14

31.94

2.28

651.11

2.19

12

Equateur

3.59

46.31

1.19

287.77

2.19

37

Rhodésie du sud

13.30

31.92

1.52

250.96

2.00

13

Finlande

11.24

27.84

2.37

1681.25

4.32

38

Espagne

11.77

27.74

2.87

768.79

4.35

14

France

12.64

25.06

4.70

2213.82

4.52

39

Suède

6.86

21.44

4.54

3299.49

3.01

15

RFA

12.55

23.31

3.35

2457.12

3.44

40

Suisse

14.13

23.49

3.73

2630.96

2.70

16

Grèce

10.67

25.62

3.10

870.85

6.28

41

Turquie

5.13

43.42

1.08

389.66

2.96

17

Guatemala

3.01

46.05

0.87

289.71

1.48

42

Tunisie

2.81

46.12

1.21

249.87

1.13

18

Honduras

7.70

47.32

0.58

232.44

3.19

43

Royaume Uni

7.81

23.27

4.46

1813.93

2.01

19

Islande

1.27

34.03

3.08

1900.10

1.12

44

Etats Unis

7.56

29.81

3.43

4001.89

2.45

20

Inde

9.00

41.31

0.96

88.94

1.54

45

Vénézuela

9.22

46.40

0.90

813.39

0.53

21

Irlande

11.34

31.16

4.19

1139.95

2.99

46

Zambie

18.56

45.25

0.56

138.33

5.14

22

Italie

14.28

24.52

3.48

1390.00

3.54

47

Jamaïque

7.72

41.12

1.73

380.47

10.23

23

Japon

21.10

27.01

1.91

1257.28

8.21

48

Uruguay

9.24

28.13

2.72

766.54

1.88

24

Corée

3.98

41.74

0.91

207.68

5.81

49

Libye

8.89

43.69

2.07

123.58

16.71

25

Luxembourg

10.35

21.80

3.73

2449.39

1.57

50

Malaisie

4.71

47.20

0.66

242.69

5.08

 


Correction

 

1) Une méthode possible pour déterminer le taux d’épargne en fonction de la structure démographique et du développement économique consiste à effectuer la régression linéaire multiple en considérant :

·        comme variable expliquée le taux moyen d’épargne par personne SR ;

·        comme variables explicatives correspondant à l’avenir démographique du pays les pourcentages de population POP15 et POP75 : ces pourcentages peuvent être évalués pour les années à venir ;

·        comme variables explicatives caractéristiques du développement économique le revenu moyen DPI et son taux moyen de croissance  DDPI, dans la mesure où ils peuvent être estimés par des projections économiques.

La régression linéaire donne une équation qui permet d’estimer le taux moyen d’épargne en fonction des prévisions de ces quatre variables. On pourra ainsi distinguer ceux dont le taux moyen d’épargne devrait augmenter.

2) On donne ci-desssous en figure 1 la représentation graphique des pays suivant le taux d’épargne et le pourcentage de population de moins de 15 ans :

             23                        |SR

                                       |

                                       |

                                       |                          46

      11                               |

                                       |

                             26        |

   40 22                               |

     3                     37          |                  5

   2    14         35                  |                       33 8  34

                13   1   2136          |

25       16                  29        *                                 10

my=-9.671-------48-----------------------*-------------20------------45----

                            6          |                      49      POP15

  43                 44                |              47         30     18

39                                     |

                                       |                 4   41

                                       |                     31        950

                                       |                24           12

                                       |                            17

                                  19   |              32

                                       |           7

                                       |

                                       |

                                       

Représentation graphique des couples SR, POP15

r=-.456, nb. d'obs.: 50

Elle montre l’existence de deux groupes distincts, le premier rassemblant des pays jeunes à faible taux d’épargne, le second des pays plus vieux à taux d’épargne élevé. On ne distingue pas de points aberrants pouvant perturber la régression.

Le second schéma montre que le taux d’épargne a tendance à augmenter en fonction de l’accroissement du revenu disponible : les pays dans lesquels cet accroissement est rapide bénéficie d’un plus fort taux d’épargne. Par contre, on distingue deux pays particuliers, le 47 et surtout le 49. Il faudra contrôler les résultats de la régression.


 

               |SR                23

               |

               |

               |    46

              11

               |

               |                 26

        40  22 |               28

     37        3  5

33   34     15 2 14        8  35

      36  1    |13

   25    10  27*         16

45-2048-------------*--------------------------------------------------DDPI

        6      |                                                         49

     4330  18  |                           47

          39   |

4         41   |

           9 31|   50

      12       |       24

 4217          |

 19            |

         7     |

 

Représentation graphique des couples DDPI, SR (50 pays)

r= .305, nb. d'obs.: 50

 

3) Le modèle donne la formule du taux d’épargne en fonction des trois variables explicatives choisies :

SR = -0.4518 POP15 + 0.4278 DDPI – 1.8354 POP75 + 28.1248

 

Le coefficient de détermination est égal à 0.3365, Cette valeur est largement significative (f = 7.778, P(F>7.778 = 0.0003 pour des ddl égaux à 3 et 46).

La variance résiduelle estimée est égale à 14.19. La connaissance des valeurs des variables explicatives permet donc de reconstituer le taux d’épargne avec une erreur approximative de l’ordre de 3.77 = 14.191/2.  En l’absence de toute information, la valeur reconstituée est la moyenne avec une erreur de l’ordre de 4.43 = 19.671/2: le modèle améliore l’estimation .

4) En appliquant cette formule aux pays de rang 7 et 46, on obtient l’estimation de leur taux d’épargne :

          SR(7) = 8.8539         SR(46) = 8.8530

Et on en déduit les résidus :

e7 = 0.6 - 8.8539= -8.2539                        e46 = 18.56 - 8.8530 = 9.707

Ces résidus sont largement supérieurs à l’écart-type des résidus, s = 3.61, et le taux d’épargne du pays 7 est largement surestimé par le modèle : normalement, ce pays devrait avoir un taux d’épargne supérieur, à l’inverse du pays 46.

5) L’analyse des résidus montre que l’effet des pays 46 et 49 est négligeable sur l’estimation des paramètres. L’histogramme des résidus est proche de la loi normale, et le nombre de résidus en dehors de l’intervalle +/- 2 s est égal à 2 (pays 7 et 46), soit 4%, et 17 en dehors de l’intervalle +/- s soit 34% : ils sont proches des pourcentages correspondant à la loi normale (5% et 30%).

 

Histogramme des résidus (50 valeurs)

Densité de la loi de Gauss de mêmes paramètres

Le test d’ajustement du c2 aboutit largement à l’acceptation d’une répartition normale. Les calculs ci-dessous ont été effectués sur les résidus observés en considérant 7 classes de même amplitude et en réunissant les classes 1 et 2, puis les classes 6 et 7 :

     Test du Chi-2: X2 = 1.7470          Ddl: 3          P(c2>1.747) = 0.6265

La répartition des résidus peut donc être considérée comme normale et on peut calculer les intervalles de confiance du taux d’épargne. Le test précédent sur le F est justifié.

6) La présence d’un coefficient de corrélation élevé (-0.9085) entre les variables explicatives POP15 et POP75 complique l’interprétation de leurs coefficients de régression. Les signes sont tous deux négatifs, alors que les coefficients de corrélation avec le taux d’épargne sont opposés. C’est ainsi que, d’après le coefficient de corrélation, le taux d’épargne devrait augmenter en fonction du pourcentage de la population de plus de 75 ans (coefficient de corrélation positif), alors que dans la formule de régression, c’est le contraire qui apparaît (coefficient de régression négatif). Cela s’explique par le fait que ces deux variables, qui caractérisent la démographie de chaque pays, sont liées entre elles par la relation ci-dessous :

POP15 + POP75 + POPA = 100%

expression dans laquelle POPA est le pourcentage de population âgée de plus de 15 et de moins de 75 ans. Dans la mesure où ce pourcentage ne varie pas beaucoup, une valeur élevée de POP75 correspond à une valeur faible de POP15 : ces deux valeurs se compensent au niveau du modèle de régression.

7) On peut résoudre cette difficulté en considérant comme variable explicative
POPA = 100-POP15-POP75 au lieu de POP15 et POP75. On obtient l’équation ci-dessous :

 

SR = 0.2554 POPA + 0.4398 DDPI – 7.9764

 

avec un coefficient de détermination égal à 0.3002, un peu moins élevé que le précédent (0.3365). La variance résiduelle estimée est égale à 14.645 au lieu de 14.19 : le modèle est légèrement moins bon suivant ces deux critères, mais son interprétation est beaucoup plus facile puisque le taux d’épargne augmente en fonction du pourcentage POPA qui correspond plus ou moins au pourcentage de la population active.

8) On donne dans le tableau ci-dessous la prévision SR du taux d’épargne des pays 2, 23, 37 et 38 suivie des bornes de l’intervalle de confiance à 95%, le taux d’épargne actuel et la différence  : 

 

 

POP15

POP75

POPA

DDPI

SRpre

SR1

SR2

SRact

SRpre - SRact

2

23.32

4.41

72.27

3.93

12.21

4.31

20.10

12.07

0.14

23

17.01

13.01

69.98

9.10

13.90

5.80

22.00

21.10

-8.20

37

21.92

9.45

68.63

6.67

12.48

4.59

20.39

11.14

1.34

38

28.24

1.98

69.78

2.35

10.88

3.01

18.75

13.30

-2.42

 

Il n’y a guère que dans le pays 37 que le taux d’épargne devrait augmenter.