Exercices sur le chapitre 2

1. moyennes et variances.

On considère la série de données (xi) i = 1, …, 10 suivante :

x1 = 1, x2 = 3, x3 = 2, x4 = 7, x5 = 6, x6 = 5, x7 = 10, x8 = 9, x9 = 8, x10 = 4

1) Calculer la moyenne et la variance de la série (xi) i = 1, …, 10.

2) On pose, pour tout i = 1, …, 10 : yi = xi + 2. Calculer la moyenne et la variance de la série (yi) i = 1, …, 10.

3) On pose, pour tout i = 1, …, 10 : zi = 3 x xi. Calculer la moyenne et la variance de la série (zi) i = 1, …, 10.

4) Montrer que si mx est la moyenne et sx2 la variance d’une série (xi), i = 1, …, n, la moyenne my et la variance sy2 d’une série (yi) i = 1, …, n définie par : yi = xi + k pour i = 1, …, n où le terme k représente un nombre constant, sont de la forme :

my = mx + k

sy2 = sx2

5) Montrer que la moyenne mz et la variance sz2 d’une série (zi) i = 1, …, n définie par zi = k x xi pour i = 1, …, n où le terme k représente un nombre constant, sont de la forme :

mz = k x mx

sz2 = k2 x sx2

6) On considère maintenant la série de données (yi) i = 1, …, 10 suivante :

y1 = 9, y2 = 3, y3 = 1, y4 = 10, y5 = 5, y6 = 3, y7 = 3, y8 = 9, y9 = 7, y10 = 6

Calculer la moyenne et la variance de la série définie par (xi + yi) i = 1, …, 10.

7) Montrer que si mx est la moyenne d’une série (xi), i = 1, …, n, et my la moyenne d’une série (yi), i = 1, …, n, la moyenne mx+y de la série (xi + yi) est de la forme

mx+y = mx + my

8) On considère la série (zi’) i = 1, …, n définie par

zi’ = xi – mx + yi – my

Calculer la moyenne mz’ de la série (zi) i = 1, …n. Montrer que la variance sz’2 de la série (zi’) i = 1, …, n est égale à :

 

2

n

 

sz’2 = sx2 + sy2 +

–––

S

(xi – mx)(yi – my)

 

n

i = 1

 

En déduire la moyenne et la variance de la série (zi) i = 1, …n. définie par :

zi = xi + yi

 

2. des paramètres statistiques aux Diagrammes .

1) 100 personnes donnent une note comprise entre 1 et 5 à quatre spécialités de film suivant leurs préférences :

film d’aventure, de science fiction, policier, psychologique.

On obtient les répartitions suivantes :

Note

1

2

3

4

5

Aventure

10

20

40

20

10

Science-fiction

10

30

20

30

10

Policier

10

20

5

35

30

Psychologique

40

20

10

20

10

Calculer les moyennes et les variances des notes dans chaque cas.

2) Construire les diagrammes correspondants et indiquer le signe des coefficients d’asymétrie dans chaque cas.

3. des diagrammes aux paramètres statistiques.

Dans l’exercice 3 du chapitre 1 on a construit des diagrammes représentant la répartition des notes données par la clientèle à des attentes sur les caractéristiques d’un emballage. Nous étudions ici les mêmes données, que nous considérons comme quantitatives et établissons une relation entre un diagramme en bâtons et la moyenne et l’écart-type de la série.

1) Examiner les diagrammes des notes données à l’attente « recyclable » et à l’attente « réutilisation ». Que peut-on en déduire sur la moyenne et l’écart-type ?

2) Vérifier par le calcul.

4. moyennes et variances dans le cas de données classées.

On considère les achats des clients de l’hypermarché donnés dans l’exercice 1 du chapitre 1. Il s’agit de données classées : on ne connaît pas les montants individuels, mais seulement les classes auxquelles ils appartiennent. Pour calculer une valeur approximative de la moyenne et de la variance, on caractérise en général chaque classe par son centre et l’on effectue les calculs sur les données (nl, cl), où nl est l’effectif de la classe l de centre cl.

1) Compléter le tableau de calcul ci-dessous concernant les achats en droguerie-quincaillerie :

Cl.

ni

inf.

sup.

Centre ci

ni ci

ni ci²

1

25

0

50

25

625

15625

2

50

50

100

75

3750

281250

3

50

100

150

125

6250

 

4

10

150

200

175

 

 

5

15

200

300

250

 

 

Calculer la moyenne, la variance et l’écart-type des achats en droguerie quincaillerie. Déterminer la médiane ou préciser dans quelle classe elle se trouve.

2) Effectuer le même calcul pour les autres achats.

5. densité de l’âge de la clientèle d’euromarket.

On considère l’âge des 50 clients d’EUROMARKET :

24

29

33

36

38

39

40

42

45

53

26

30

34

37

38

39

41

42

48

57

28

31

34

37

39

40

41

43

48

62

29

31

34

37

39

40

41

43

48

67

29

33

35

38

39

40

42

45

51

68

1) Regrouper les clients par âge. Sous quelle forme se présentent alors les données ? Calculer la moyenne, la variance et l’écart-type. Répartir les observations suivant leur âge par rapport à la moyenne (on utilisera la règle donnée dans le cours).

2) Calculer la médiane et les quintiles en expliquant la procédure choisie.

3) Construire l’histogramme suivant la répartition donnée ci-dessous :

[20,30 [,

[30, 40 [,

[ 40, 50 [,

[ 50, 60 [,

[ 60, 70 ]

Les coefficients d’asymétrie et d’aplatissement sont as = 1.11 , ap = 4.50. Est-ce conforme aux résultats de la première question et à la forme de l’histogramme ?

6. Fonction de répartition et courbe de concentration.

On donne ci-dessous les revenus en francs des 50 clients d’EUROMARKET.

72999

86468

95116

103971

128456

74036

87227

95625

104264

130187

76865

87674

96017

107808

134822

80352

87866

96145

110246

138648

81459

90280

96818

110827

143346

82005

91429

96885

112475

155989

84294

91656

98075

116520

161352

84329

93263

98096

117101

190465

84480

93745

98302

117663

195888

84812

94435

103220

121489

196484

1) Calculer la moyenne et l’écart-type. En déduire le coefficient de variation.

2) Calculer la médiane mé et les déciles d1, d2, …, d9, d10. En comparant la médiane et la moyenne, apprécier la symétrie de la répartition des observations.

3) Représenter la fonction de répartition en d1, d2, …, d9, d10. En déduire graphiquement une valeur approximative des quartiles. Cette valeur est-elle proche des quartiles de la série (on expliquera la procédure de calcul) ?

4) Le coefficient d’asymétrie est égal à 1.59 et le coefficient d’aplatissement à 5.06. La répartition des observations peut-elle être proche de la courbe en cloche ? Est-ce conforme à la médiane ? aux quartiles ? aux déciles ?

5) Calculer les rapports (i) de la somme des dix plus petits revenus à la somme des dix plus grands et (ii) du plus petit au plus grand. Quel est le plus significatif ? Que peut-on dire a priori du coefficient de concentration ?

7. coefficients d’aplatissement et d’asymétrie.

Nous reprenons dans cet exercice les données publiées dans la revue Automoto (cf. exercice III du chapitre 1) et figurant en annexe.

Rappelons que l’on dispose sur ces voitures de 15 notes comprises entre 0 et 20 pour les critères suivants : moteur, performances, comportement, freinage, conduite en ville, sur autoroute, sur route, confort, habitabilité, équipement, finition, budget, prix, revente en occasion, consommation. On donne les coefficients d’asymétrie et d’aplatissement :

 

asymétrie

aplatissement

 

asymétrie

aplatissement

moteur

-0.286

3.143

conf.

0.076

2.647

perf.

 

inconnu

habit.

-0.141

2.893

camp.

-0.102

2.051

équip.

0.373

3.198

frein.

-0.391

1.986

finit.

0.395

2.771

ville

-0.451

2.235

bud.

-0.833

4.724

autor.

-0.020

2.710

prix

-0.292

3.507

route

inconnu

3.023

occas.

-1.219

4.072

Nous admettrons qu’un coefficient d’asymétrie supérieur à 0.534 en valeur absolue est très différent de 0 de même qu’un coefficient d’aplatissement inférieur à 2.15 ou supérieur à 3.99 (ces valeurs sont données par une table statistique).

1) On considère le critère « conduite sur route ». Construire l’histogramme des notes suivant 5 classes de même amplitude. Que peut-on dire du coefficient d’asymétrie ?

2) Construire l’histogramme du critère performance suivant 5 classes de même amplitude. Que peut-on dire de son coefficient d’asymétrie ? De son coefficient d’aplatissement ?

3) Quels sont les critères suivant lesquels les notes ne sont pas réparties suivant la loi normale ?

4) Que peut-on dire des notes de conduite en ville ?

8. qualité et coût d’une automobile.

Les données étudiées ici sont les mêmes que dans l’exercice précédent, mais, pour simplifier, on a défini deux notes supplémentaires auxquelles on limite l’analyse. La première caractérise l’ensemble des qualités techniques et de confort de la voiture : c’est la « qualité générale » définie par la moyenne des onze premières note. . La seconde mesure le « coût global » : c’est la moyenne des quatre dernières.

1) Que peut-on dire a priori des coefficients d’asymétrie des notes de qualité et de coût au vu des histogrammes de la quali et du coût ?

2) Calculer la variance des notes de qualité générale du groupe des petites voitures. Calculer la moyenne des notes de coût global du groupe des petites familiales. Déduire des résultats donnés en annexe la moyenne totale (sur les 67 modèles) des notes de qualité.

3) Quels sont les segments dont les modèles sont les plus homogènes en qualité ? Les plus hétérogènes en coût ? Expliquer pourquoi.

4) Déterminer les modèles de voiture très particuliers au plan de la qualité ou du coût en expliquant la procédure choisie.

Notes moyennes des segments en qualité et en coût

 

 

Qualité

générale

Coût

global

Segments

Effectif

Moyenne

Variance

Moyenne

Variance

Petites

5

14.49

 

14.45

1.285

Petites familiales

8

14.55

0.219

 

0.512

Petites familiales diesel

5

14.44

0.332

15.15

0.165

Petites familiales turbo diesel

5

15.31

0.680

13.95

0.285

Familiales

5

15.71

0.130

12.60

0.640

Familiales turbo diesel

8

15.35

1.114

13.63

0.875

Routières

5

15.69

0.151

10.95

0.185

Routières diesel

8

16.01

0.143

12.75

0.938

Breaks

5

13.65

0.405

14.15

1.565

Monospaces

8

14.50

1.184

13.09

2.780

Prestige

5

16.93

1.162

6.10

0.365

Notes de qualité générale et de coût global par segment

 

Petites

 

 

Petites

familiales

 

 

Petites

familiales

diesel

 

Rang

Qual.

Coût

Rang

Qual.

Coût

Rang

Qual.

Coût

1

14.45

16.00

6

15.36

14.00

14

15.09

15.50

2

14.55

15.25

7

15.00

13.75

15

15.18

14.75

3

14.09

14.50

8

14.82

13.75

16

13.91

15.75

4

14.27

13.75

9

14.36

14.25

17

14.09

15.00

5

15.09

12.75

10

14.55

13.50

18

13.91

14.75

 

 

 

11

14.09

13.75

 

 

 

 

 

 

12

13.82

13.75

 

 

 

 

 

 

13

14.36

11.75

 

 

 

 

Petites

familiales TD

 

 

Familiales

 

 

Familiales TD

 

Rang

Qual.

Coût

Rang

Qual.

Coût

Rang

Qual.

Coût

19

16.09

14.25

24

15.27

13.75

29

16.36

13.75

20

16.09

13.75

25

16.09

12.25

30

16.73

13.00

21

15.73

13.00

26

16.00

12.25

31

16.18

13.00

22

14.45

14.50

27

15.27

13.25

32

15.73

13.00

23

14.18

14.25

28

15.91

11.50

33

14.18

15.00

 

 

 

 

 

 

34

14.91

13.50

 

 

 

 

 

 

35

13.45

15.25

 

 

 

 

 

 

36

15.27

12.50

 

Routières

 

 

Routières

diesel

 

 

Breaks

 

Rang

Qual.

Coût

Rang

Qual.

Coût

Rang

Qual.

Coût

37

15.64

11.75

42

16.36

13.50

50

14.82

14.25

38

16.36

10.75

43

16.27

13.50

51

13.00

16.50

39

15.82

10.75

44

15.82

13.75

52

13.55

13.75

40

15.27

11.00

45

15.82

13.25

53

13.73

13.25

41

15.36

10.50

46

15.64

13.25

54

13.18

13.00

 

 

 

47

16.36

11.50

 

 

 

 

 

 

48

16.45

11.00

 

 

 

 

 

 

49

15.36

12.25

 

 

 

 

Monospaces

 

 

Prestige

 

 

 

 

Rang

Qual.

Coût

Rang

Qual.

Coût

 

 

 

55

14.00

15.75

63

18.27

6.50

 

 

 

56

15.64

13.25

64

17.73

5.75

 

 

 

57

15.09

13.75

65

17.18

6.00

 

 

 

58

14.64

12.75

66

16.18

7.00

 

 

 

59

13.55

14.00

67

15.27

5.25

 

 

 

60

16.36

9.50

 

 

 

 

 

 

61

13.91

12.25

 

 

 

 

 

 

62

12.82

13.50

 

 

 

 

 

 

9. Propriétés des paramètres statistiques.

On considère une suite de n observations (xi) i=1, ..., n.

1) On considère la moyenne m2’ des carrés des écarts entre la médiane mé et les observations :

m2’ = [(x1 – mé)2 + (x2 - mé)2 + … + (xn-mé)2] / n

Comparer m2’ et la variance s2 des observations.

2) On note m la moyenne de la série. Montrer la relation ci-dessous :

1

n

 

 

1

n

 

___

S

(xi – x)2

=

___

S

(xi – m)2 + (x – m)2

n

i = 1

 

 

n

i = 1

 

On suppose dans les questions suivantes que les observations sont réparties en trois groupes I1, I2 et I3 d’effectifs n1, n2 et n3. On supposera pour simplifier que les observations numérotées de 1 à n1 appartiennent au groupe I1, de n1+1 à n1+n2 au groupe I2, de n1+n2+1 à n1+n2+n3 = n au groupe I3.

3) on note m1, m2 et m3 les moyennes des observations dans chaque groupe et m la moyenne totale. Montrer la relation :

m = [ n1 m1 + n2 m2 + n3 m3 ]/n

4) Soit sm2 la variance des moyennes pondérées par les effectifs. Donner la formule définissant cette variance et la formule en facilitant le calcul.

5) Soient s12, s22, s32 les variances des observations dans chaque groupe. Calculer la somme ci-dessous en fonction des observations xi et des moyennes m, m1, m2 et m3 :

sm2 + [ n1 s12 + n2 s22 + n3 s32 ] /n

Comparer cette somme à la variance de la totalité des observations.

10. Application des résultats de l’exercice 9.

Trois groupes de clients d’une grande marque d’automobile ont décerné des notes concernant la qualité du service après-vente des concessionnaires : les propriétaires d’une petite voiture, d’une voiture de taille moyenne et d’une voiture de grande taille.

On conservera si possible toutes les décimales dans les calculs.

1) calculer la moyenne et la variance dans chaque groupe et sur la totalité des valeurs à l’aide des résultats suivants :

 

groupe 1

groupe 2

groupe 3

totalité

effectif

50

50

25

125

somme des valeurs

595.89

702.53

364.87

1663.29

somme des carrés

7311.174

10004.86

5344.00

22660.04

2) calculer la variance des trois notes moyennes. En déduire la somme dont la formule est donnée dans la question 3 de la partie I. Que peut-on en conclure ?

3) On donne ci-dessous les déciles des 125 notes. Donner la médiane et des valeurs approchées des quartiles. Sachant que la note la plus faible est 7.07 et la plus élevée 17.77, construire une représentation graphique approximative de la fonction de répartition des notes et vérifier graphiquement les valeurs proposées précédemment.

d1= 10.355

d2= 11.38

d3= 12.34

d4= 13.035

d5= 13.475

d6= 14.05

d7= 14.48

d8= 15.17

d9= 15.61

4) A quelle valeur 20% des observations sont-elles inférieures ? 40% ? 60% ? 80% ? Comment s’appellent ces valeurs ? Construire l’histogramme des notes en 5 classes de même effectif (on prendra pour plus petite borne 5 et pour plus grande 20). Que peut-on dire des coefficients d’asymétrie et d’aplatissement ?

11. Histogramme et paramètres de données continues.

On analyse les achats en euros de 144 clients d’un magasin que l’on a répartis dans les intervalles ci-dessous :

Classes

Effectifs

Classes

Effectifs

[0, 10]

16

]30, 40]

16

]10, 20]

16

]40, 60]

16

]20, 25]

16

]60, 80]

16

]25, 30]

16

]80, 100]

16

 

 

]100, 150]

16

1) Construire l’histogramme. Le coefficient d’asymétrie est égal à 0.798. Que peut-on en dire ? Donner une valeur approximative de la médiane.

2) Calculer la moyenne, la variance et le coefficient de variation à partir des résultats suivants :

Somme des valeurs

Somme des carrés

7040

541 800

Quel est l’ordre de grandeur des achats ?

3) Un client a acheté pour 92 euros de marchandises. Calculer la valeur centrée réduite de son achat. Est-ce un client important ? Même question pour un client dont les achats s’élèvent à 5 euros. Quand peut-on dire qu’un achat est très faible ? Très élevé ? Conclure en commentant la règle.

4) Construire la fonction de répartition aux points connus et en déduire par interpolation linéaire les valeurs limites des très petites et des très grandes valeurs définies par la seconde règle de classification.

12. comparaison de fonctions de répartition.

On considère la série 1 de données constituées de la taille de 63 étudiants (de sexe masculin) et la série 2 donnant les tailles de 90 adultes de quarante ans et plus et de sexe masculin. Les observations sont données ci-dessous.

1) Ordonner les deux séries suivant les valeurs croissantes. Quel est le pourcentage d’étudiants de moins de 1.75m ? D’adultes de 40 ans ?

2) Construire sur un même graphique les fonctions de répartitions F1 et F2 des séries 1 et 2. Déterminer graphiquement et par le calcul pour chaque série la médiane et les quartiles.

3) Que peut-on dire des deux fonctions de répartition ?

4) Comparer les moyennes. Y-a-t-il une relation avec la propriété précédente ?

1:184

2:175

3:188.5

4:173

5:169

6:175

7:164

8:190

9:174

10:184

11:168

12:179

13:174

14:163

15:172

16:176

17:190

18:172

19:178

20:173

21:175

22:168

23:180

24:175

25:184

26:181

27:169

28:174

29:175

30:175

31:180

32:172

33:179

34:183

35:170

36:178

37:168

38:188

39:177

40:165

41:172

42:173

43:176

44:177

45:180

46:170

47:184

48:175

49:181

50:175

51:162

52:176

53:187

54:180

55:173

56:172

57:171

58:170

59:172

60:180

61:172

62:178

63:173

 

 

 

 

 

 

 

Taille des 63 étudiants (en cm)

 

1:165

2:163

3:168

4:173

5:170

6:175

7:170

8:170

9:170

10:176

11:172

12:167

13:165

14:173

15:173

16:173

17:165

18:165

19:175

20:162

21:170

22:165

23:172

24:166

25:170

26:171

27:177

28:172

29:165

30:168

31:180

32:161

33:180

34:166

35:170

36:175

37:180

38:175

39:178

40:162

41:162

42:172

43:170

44:170

45:180

46:161

47:170

48:165

49:172

50:170

51:160

52:175

53:175

54:172

55:168

56:178

57:165

58:170

59:180

60:166

61:168

62:180

63:169

64:160

65:166

66:165

67:175

68:163

69:165

70:172

71:163

72:175

73:162

74:175

75:171

76:173

77:169

78:170

79:174

80:178

81:165

82:172

83:171

84:163

85:170

86:169

87:178

88:163

89:163

90:160

Taille des 90 adultes (en cm)