On considère la série de données (xi) i = 1, …, 10 suivante :
x1 = 1, x2 = 3, x3 = 2, x4
= 7, x5 = 6, x6 = 5, x7 = 10, x8 =
9, x9 = 8, x10 = 4
1) Calculer la moyenne et la variance de la série (xi)
i = 1, …, 10.
2) On pose, pour tout i = 1, …, 10 : yi = xi
+ 2. Calculer la moyenne et la variance de la série (yi) i = 1, …,
10.
3) On pose, pour tout i = 1, …, 10 : zi = 3 x xi.
Calculer la moyenne et la variance de la série (zi) i = 1, …, 10.
4) Montrer que si mx est la moyenne et sx2 la variance d’une série (xi), i = 1, …, n, la moyenne my et la variance sy2 d’une série (yi) i = 1, …, n définie par : yi = xi + k pour i = 1, …, n où le terme k représente un nombre constant, sont de la forme :
my = mx + k |
sy2 = sx2 |
5) Montrer que la moyenne mz et la variance sz2 d’une série (zi) i = 1, …, n définie par zi = k x xi pour i = 1, …, n où le terme k représente un nombre constant, sont de la forme :
mz = k x mx |
sz2 = k2 x sx2 |
6) On considère maintenant la série de données (yi) i = 1, …, 10 suivante :
y1 = 9, y2 = 3, y3 = 1, y4
= 10, y5 = 5, y6 = 3, y7 = 3, y8 =
9, y9 = 7, y10 = 6
Calculer la moyenne et la variance de la série définie par (xi + yi) i = 1, …, 10.
7) Montrer que si mx est la moyenne d’une série (xi), i = 1, …, n, et my la moyenne d’une série (yi), i = 1, …, n, la moyenne mx+y de la série (xi + yi) est de la forme
mx+y = mx + my
8) On considère la série (zi’) i = 1, …, n définie par
zi’ = xi – mx + yi – my
Calculer la moyenne mz’ de la série (zi) i = 1, …n. Montrer que la variance sz’2 de la série (zi’) i = 1, …, n est égale à :
|
2 |
n |
|
sz’2 = sx2 + sy2 + |
––– |
S |
(xi – mx)(yi
– my) |
|
n |
i = 1 |
|
En déduire la moyenne et la variance de la série (zi) i = 1, …n. définie par :
zi = xi + yi
1) 100 personnes donnent une note comprise entre 1 et 5 à quatre spécialités de film suivant leurs préférences :
film d’aventure, de science fiction, policier, psychologique.
On obtient les répartitions suivantes :
Note |
1 |
2 |
3 |
4 |
5 |
Aventure |
10 |
20 |
40 |
20 |
10 |
Science-fiction |
10 |
30 |
20 |
30 |
10 |
Policier |
10 |
20 |
5 |
35 |
30 |
Psychologique |
40 |
20 |
10 |
20 |
10 |
Calculer les moyennes et les variances des notes dans chaque cas.
2) Construire les diagrammes correspondants et indiquer le signe des coefficients d’asymétrie dans chaque cas.
Dans l’exercice 3 du chapitre 1
on a construit des diagrammes représentant la
répartition des notes données par la clientèle à des attentes sur les caractéristiques
d’un emballage. Nous étudions ici les mêmes données, que nous considérons comme quantitatives et
établissons une relation entre un diagramme en bâtons et la moyenne et l’écart-type de la série.
1)
Examiner les diagrammes des notes données à l’attente « recyclable »
et à l’attente « réutilisation ». Que peut-on en déduire sur la
moyenne et l’écart-type ?
2)
Vérifier par le calcul.
On considère les achats des
clients de l’hypermarché donnés dans l’exercice 1 du chapitre 1. Il
s’agit de données classées
: on ne connaît pas les montants individuels, mais seulement
les classes auxquelles ils appartiennent. Pour calculer une valeur
approximative de la moyenne et de la variance, on caractérise en général chaque
classe par son centre et l’on effectue les calculs sur les données (nl, cl), où nl
est l’effectif de la classe l de
centre cl.
1) Compléter le tableau de calcul ci-dessous concernant les
achats en droguerie-quincaillerie :
Cl. |
ni |
inf. |
sup. |
Centre ci |
ni
ci |
ni
ci² |
1 |
25 |
0 |
50 |
25 |
625 |
15625 |
2 |
50 |
50 |
100 |
75 |
3750 |
281250 |
3 |
50 |
100 |
150 |
125 |
6250 |
|
4 |
10 |
150 |
200 |
175 |
|
|
5 |
15 |
200 |
300 |
250 |
|
|
Calculer
la moyenne, la variance
et l’écart-type des achats en droguerie quincaillerie. Déterminer la médiane ou
préciser dans quelle classe elle se trouve.
2)
Effectuer le même calcul pour les autres achats.
On
considère l’âge des 50 clients d’EUROMARKET :
24 |
29 |
33 |
36 |
38 |
39 |
40 |
42 |
45 |
53 |
26 |
30 |
34 |
37 |
38 |
39 |
41 |
42 |
48 |
57 |
28 |
31 |
34 |
37 |
39 |
40 |
41 |
43 |
48 |
62 |
29 |
31 |
34 |
37 |
39 |
40 |
41 |
43 |
48 |
67 |
29 |
33 |
35 |
38 |
39 |
40 |
42 |
45 |
51 |
68 |
1)
Regrouper les clients par âge. Sous quelle forme se présentent alors les
données ? Calculer la moyenne, la variance et l’écart-type. Répartir les
observations suivant leur âge par rapport à la moyenne (on utilisera la règle
donnée dans le cours).
2)
Calculer la médiane et les quintiles en expliquant la procédure choisie.
3)
Construire l’histogramme suivant la répartition donnée ci-dessous :
[20,30 [, |
[30, 40 [, |
[ 40, 50 [, |
[ 50, 60 [, |
[ 60, 70 ] |
Les
coefficients d’asymétrie et d’aplatissement sont as = 1.11 , ap =
4.50. Est-ce conforme aux résultats de la première question et à la forme de
l’histogramme ?
On
donne ci-dessous les revenus en francs des 50 clients d’EUROMARKET.
72999 |
86468 |
95116 |
103971 |
128456 |
74036 |
87227 |
95625 |
104264 |
130187 |
76865 |
87674 |
96017 |
107808 |
134822 |
80352 |
87866 |
96145 |
110246 |
138648 |
81459 |
90280 |
96818 |
110827 |
143346 |
82005 |
91429 |
96885 |
112475 |
155989 |
84294 |
91656 |
98075 |
116520 |
161352 |
84329 |
93263 |
98096 |
117101 |
190465 |
84480 |
93745 |
98302 |
117663 |
195888 |
84812 |
94435 |
103220 |
121489 |
196484 |
1) Calculer
la moyenne et l’écart-type. En déduire le coefficient de
variation.
2)
Calculer la médiane
mé et les déciles
d1, d2, …, d9, d10. En comparant la
médiane et la moyenne, apprécier la symétrie de la répartition des
observations.
3)
Représenter la fonction de
répartition en d1, d2, …, d9, d10.
En déduire graphiquement une valeur approximative des quartiles.
Cette valeur est-elle proche des quartiles de la série (on expliquera la
procédure de calcul) ?
4) Le coefficient
d’asymétrie est égal à 1.59 et le coefficient
d’aplatissement à 5.06. La répartition des observations
peut-elle être proche de la courbe en cloche ?
Est-ce conforme à la médiane ? aux quartiles ? aux déciles ?
5)
Calculer les rapports (i) de la somme des dix plus petits revenus à la somme
des dix plus grands et (ii) du plus petit au plus grand. Quel est le plus
significatif ? Que peut-on dire a
priori du coefficient de concentration ?
Nous reprenons dans cet exercice
les données publiées dans la revue Automoto (cf. exercice III du chapitre 1) et
figurant en annexe.
Rappelons
que l’on dispose sur ces voitures de 15 notes comprises entre 0 et 20 pour les
critères suivants : moteur, performances, comportement,
freinage, conduite en ville, sur autoroute, sur route, confort, habitabilité,
équipement, finition, budget, prix, revente en occasion, consommation. On donne
les coefficients d’asymétrie et d’aplatissement
:
|
asymétrie |
aplatissement |
|
asymétrie |
aplatissement |
moteur |
-0.286 |
3.143 |
conf. |
0.076 |
2.647 |
perf. |
|
inconnu |
habit. |
-0.141 |
2.893 |
camp. |
-0.102 |
2.051 |
équip. |
0.373 |
3.198 |
frein. |
-0.391 |
1.986 |
finit. |
0.395 |
2.771 |
ville |
-0.451 |
2.235 |
bud. |
-0.833 |
4.724 |
autor. |
-0.020 |
2.710 |
prix |
-0.292 |
3.507 |
route |
inconnu |
3.023 |
occas. |
-1.219 |
4.072 |
Nous
admettrons qu’un coefficient d’asymétrie supérieur à 0.534 en valeur absolue
est très différent de 0 de même qu’un coefficient d’aplatissement inférieur à
2.15 ou supérieur à 3.99 (ces valeurs sont données par une table statistique).
1) On
considère le critère « conduite sur route ». Construire l’histogramme des notes
suivant 5 classes de même amplitude. Que peut-on
dire du coefficient d’asymétrie ?
2)
Construire l’histogramme du critère performance suivant 5 classes de même amplitude.
Que peut-on dire de son coefficient d’asymétrie ? De son coefficient
d’aplatissement ?
3) Quels
sont les critères suivant lesquels les notes ne sont pas réparties suivant la loi normale
?
4) Que
peut-on dire des notes de conduite en ville ?
Les données étudiées
ici sont les mêmes que dans l’exercice précédent, mais, pour simplifier, on a
défini deux notes supplémentaires auxquelles on limite l’analyse. La première
caractérise l’ensemble des qualités techniques et de confort de la voiture :
c’est la « qualité générale » définie par la moyenne des onze premières note. . La
seconde mesure le « coût global » : c’est la moyenne des quatre dernières.
1) Que peut-on dire a
priori des coefficients d’asymétrie
des notes de qualité et de coût au vu des histogrammes de la qualité et du coût ?
2) Calculer la variance des notes de qualité générale du
groupe des petites voitures. Calculer la moyenne des notes de coût global du
groupe des petites familiales. Déduire des résultats donnés en annexe la moyenne totale (sur les 67 modèles)
des notes de qualité.
3) Quels sont les segments dont les modèles sont les plus
homogènes en qualité ? Les plus hétérogènes en coût ? Expliquer
pourquoi.
4) Déterminer les modèles de voiture très particuliers au
plan de la qualité ou du coût en expliquant la procédure choisie.
Notes moyennes des segments en qualité et en coût
|
|
Qualité |
générale |
Coût |
global |
Segments |
Effectif |
Moyenne |
Variance |
Moyenne |
Variance |
Petites |
5 |
14.49 |
|
14.45 |
1.285 |
Petites familiales |
8 |
14.55 |
0.219 |
|
0.512 |
Petites familiales diesel |
5 |
14.44 |
0.332 |
15.15 |
0.165 |
Petites familiales turbo diesel |
5 |
15.31 |
0.680 |
13.95 |
0.285 |
Familiales |
5 |
15.71 |
0.130 |
12.60 |
0.640 |
Familiales turbo diesel |
8 |
15.35 |
1.114 |
13.63 |
0.875 |
Routières |
5 |
15.69 |
0.151 |
10.95 |
0.185 |
Routières diesel |
8 |
16.01 |
0.143 |
12.75 |
0.938 |
Breaks |
5 |
13.65 |
0.405 |
14.15 |
1.565 |
Monospaces |
8 |
14.50 |
1.184 |
13.09 |
2.780 |
Prestige |
5 |
16.93 |
1.162 |
6.10 |
0.365 |
Notes de qualité générale et de coût global par segment
|
Petites |
|
|
Petites familiales |
|
|
Petites familiales diesel |
|
Rang |
Qual. |
Coût |
Rang |
Qual. |
Coût |
Rang |
Qual. |
Coût |
1 |
14.45 |
16.00 |
6 |
15.36 |
14.00 |
14 |
15.09 |
15.50 |
2 |
14.55 |
15.25 |
7 |
15.00 |
13.75 |
15 |
15.18 |
14.75 |
3 |
14.09 |
14.50 |
8 |
14.82 |
13.75 |
16 |
13.91 |
15.75 |
4 |
14.27 |
13.75 |
9 |
14.36 |
14.25 |
17 |
14.09 |
15.00 |
5 |
15.09 |
12.75 |
10 |
14.55 |
13.50 |
18 |
13.91 |
14.75 |
|
|
|
11 |
14.09 |
13.75 |
|
|
|
|
|
|
12 |
13.82 |
13.75 |
|
|
|
|
|
|
13 |
14.36 |
11.75 |
|
|
|
|
Petites familiales
TD |
|
|
Familiales |
|
|
Familiales
TD |
|
Rang |
Qual. |
Coût |
Rang |
Qual. |
Coût |
Rang |
Qual. |
Coût |
19 |
16.09 |
14.25 |
24 |
15.27 |
13.75 |
29 |
16.36 |
13.75 |
20 |
16.09 |
13.75 |
25 |
16.09 |
12.25 |
30 |
16.73 |
13.00 |
21 |
15.73 |
13.00 |
26 |
16.00 |
12.25 |
31 |
16.18 |
13.00 |
22 |
14.45 |
14.50 |
27 |
15.27 |
13.25 |
32 |
15.73 |
13.00 |
23 |
14.18 |
14.25 |
28 |
15.91 |
11.50 |
33 |
14.18 |
15.00 |
|
|
|
|
|
|
34 |
14.91 |
13.50 |
|
|
|
|
|
|
35 |
13.45 |
15.25 |
|
|
|
|
|
|
36 |
15.27 |
12.50 |
|
Routières |
|
|
Routières diesel |
|
|
Breaks |
|
Rang |
Qual. |
Coût |
Rang |
Qual. |
Coût |
Rang |
Qual. |
Coût |
37 |
15.64 |
11.75 |
42 |
16.36 |
13.50 |
50 |
14.82 |
14.25 |
38 |
16.36 |
10.75 |
43 |
16.27 |
13.50 |
51 |
13.00 |
16.50 |
39 |
15.82 |
10.75 |
44 |
15.82 |
13.75 |
52 |
13.55 |
13.75 |
40 |
15.27 |
11.00 |
45 |
15.82 |
13.25 |
53 |
13.73 |
13.25 |
41 |
15.36 |
10.50 |
46 |
15.64 |
13.25 |
54 |
13.18 |
13.00 |
|
|
|
47 |
16.36 |
11.50 |
|
|
|
|
|
|
48 |
16.45 |
11.00 |
|
|
|
|
|
|
49 |
15.36 |
12.25 |
|
|
|
|
Monospaces |
|
|
Prestige |
|
|
|
|
Rang |
Qual. |
Coût |
Rang |
Qual. |
Coût |
|
|
|
55 |
14.00 |
15.75 |
63 |
18.27 |
6.50 |
|
|
|
56 |
15.64 |
13.25 |
64 |
17.73 |
5.75 |
|
|
|
57 |
15.09 |
13.75 |
65 |
17.18 |
6.00 |
|
|
|
58 |
14.64 |
12.75 |
66 |
16.18 |
7.00 |
|
|
|
59 |
13.55 |
14.00 |
67 |
15.27 |
5.25 |
|
|
|
60 |
16.36 |
9.50 |
|
|
|
|
|
|
61 |
13.91 |
12.25 |
|
|
|
|
|
|
62 |
12.82 |
13.50 |
|
|
|
|
|
|
On considère une suite de n observations (xi) i=1, ..., n.
1) On considère la moyenne m2’ des carrés des écarts entre la médiane mé et les observations :
m2’ = [(x1 – mé)2 + (x2 - mé)2 + … + (xn-mé)2] / n
Comparer m2’ et la variance s2 des observations.
2) On note m la moyenne de la série. Montrer la relation ci-dessous :
1 |
n |
|
|
1 |
n |
|
___ |
S |
(xi – x)2 |
= |
___ |
S |
(xi – m)2 + (x – m)2 |
n |
i = 1 |
|
|
n |
i = 1 |
|
On suppose dans les questions suivantes que les observations sont réparties en trois groupes I1, I2 et I3 d’effectifs n1, n2 et n3. On supposera pour simplifier que les observations numérotées de 1 à n1 appartiennent au groupe I1, de n1+1 à n1+n2 au groupe I2, de n1+n2+1 à n1+n2+n3 = n au groupe I3.
3) on note m1, m2 et m3 les moyennes des observations dans chaque groupe et m la moyenne totale. Montrer la relation :
m = [ n1 m1 + n2 m2 + n3 m3 ]/n
4) Soit sm2 la variance des moyennes pondérées par les effectifs. Donner la formule définissant cette variance et la formule en facilitant le calcul.
5) Soient s12, s22, s32 les variances des observations dans chaque groupe. Calculer la somme ci-dessous en fonction des observations xi et des moyennes m, m1, m2 et m3 :
sm2 + [ n1 s12 + n2 s22 + n3 s32 ] /n
Comparer cette somme à la variance de la totalité des observations.
Trois groupes de clients d’une grande marque d’automobile ont décerné des notes concernant la qualité du service après-vente des concessionnaires : les propriétaires d’une petite voiture, d’une voiture de taille moyenne et d’une voiture de grande taille.
On conservera si possible toutes les décimales dans les calculs.
1) calculer la moyenne et la variance dans chaque groupe et sur la totalité des valeurs à l’aide des résultats suivants :
|
groupe 1 |
groupe 2 |
groupe 3 |
totalité |
effectif |
50 |
50 |
25 |
125 |
somme des valeurs |
595.89 |
702.53 |
364.87 |
1663.29 |
somme des carrés |
7311.174 |
10004.86 |
5344.00 |
22660.04 |
2) calculer la variance des trois notes moyennes. En déduire la somme dont la formule est donnée dans la question 3 de la partie I. Que peut-on en conclure ?
3) On donne ci-dessous les déciles des 125 notes. Donner la médiane et des valeurs approchées des quartiles. Sachant que la note la plus faible est 7.07 et la plus élevée 17.77, construire une représentation graphique approximative de la fonction de répartition des notes et vérifier graphiquement les valeurs proposées précédemment.
d1= 10.355 |
d2= 11.38 |
d3= 12.34 |
d4= 13.035 |
d5= 13.475 |
d6= 14.05 |
d7= 14.48 |
d8= 15.17 |
d9= 15.61 |
4) A quelle valeur 20% des observations sont-elles inférieures ? 40% ? 60% ? 80% ? Comment s’appellent ces valeurs ? Construire l’histogramme des notes en 5 classes de même effectif (on prendra pour plus petite borne 5 et pour plus grande 20). Que peut-on dire des coefficients d’asymétrie et d’aplatissement ?
On analyse les achats en euros de 144 clients d’un magasin que l’on a répartis dans les intervalles ci-dessous :
Classes |
Effectifs |
Classes |
Effectifs |
[0, 10] |
16 |
]30, 40] |
16 |
]10, 20] |
16 |
]40, 60] |
16 |
]20, 25] |
16 |
]60, 80] |
16 |
]25, 30] |
16 |
]80, 100] |
16 |
|
|
]100, 150] |
16 |
1) Construire l’histogramme. Le coefficient d’asymétrie est égal à 0.798. Que peut-on en dire ? Donner une valeur approximative de la médiane.
2) Calculer la moyenne, la variance et le coefficient de variation à partir des résultats suivants :
Somme des valeurs |
Somme des carrés |
7040 |
541 800 |
Quel est l’ordre de grandeur des achats ?
3) Un client a acheté pour 92 euros de marchandises. Calculer la valeur centrée réduite de son achat. Est-ce un client important ? Même question pour un client dont les achats s’élèvent à 5 euros. Quand peut-on dire qu’un achat est très faible ? Très élevé ? Conclure en commentant la règle.
4) Construire la fonction de répartition aux points connus et en déduire par interpolation linéaire les valeurs limites des très petites et des très grandes valeurs définies par la seconde règle de classification.
On considère la série 1 de données constituées de la taille de 63 étudiants (de sexe masculin) et la série 2 donnant les tailles de 90 adultes de quarante ans et plus et de sexe masculin. Les observations sont données ci-dessous.
1) Ordonner les deux séries suivant les valeurs croissantes. Quel est le pourcentage d’étudiants de moins de 1.75m ? D’adultes de 40 ans ?
2) Construire sur un même graphique les fonctions de répartitions F1 et F2 des séries 1 et 2. Déterminer graphiquement et par le calcul pour chaque série la médiane et les quartiles.
3) Que peut-on dire des deux fonctions de répartition ?
4) Comparer les moyennes. Y-a-t-il une relation avec la propriété précédente ?
1:184 |
2:175 |
3:188.5 |
4:173 |
5:169 |
6:175 |
7:164 |
8:190 |
9:174 |
10:184 |
11:168 |
12:179 |
13:174 |
14:163 |
15:172 |
16:176 |
17:190 |
18:172 |
19:178 |
20:173 |
21:175 |
22:168 |
23:180 |
24:175 |
25:184 |
26:181 |
27:169 |
28:174 |
29:175 |
30:175 |
31:180 |
32:172 |
33:179 |
34:183 |
35:170 |
36:178 |
37:168 |
38:188 |
39:177 |
40:165 |
41:172 |
42:173 |
43:176 |
44:177 |
45:180 |
46:170 |
47:184 |
48:175 |
49:181 |
50:175 |
51:162 |
52:176 |
53:187 |
54:180 |
55:173 |
56:172 |
57:171 |
58:170 |
59:172 |
60:180 |
61:172 |
62:178 |
63:173 |
|
|
|
|
|
|
|
Taille des 63 étudiants (en cm)
1:165 |
2:163 |
3:168 |
4:173 |
5:170 |
6:175 |
7:170 |
8:170 |
9:170 |
10:176 |
11:172 |
12:167 |
13:165 |
14:173 |
15:173 |
16:173 |
17:165 |
18:165 |
19:175 |
20:162 |
21:170 |
22:165 |
23:172 |
24:166 |
25:170 |
26:171 |
27:177 |
28:172 |
29:165 |
30:168 |
31:180 |
32:161 |
33:180 |
34:166 |
35:170 |
36:175 |
37:180 |
38:175 |
39:178 |
40:162 |
41:162 |
42:172 |
43:170 |
44:170 |
45:180 |
46:161 |
47:170 |
48:165 |
49:172 |
50:170 |
51:160 |
52:175 |
53:175 |
54:172 |
55:168 |
56:178 |
57:165 |
58:170 |
59:180 |
60:166 |
61:168 |
62:180 |
63:169 |
64:160 |
65:166 |
66:165 |
67:175 |
68:163 |
69:165 |
70:172 |
71:163 |
72:175 |
73:162 |
74:175 |
75:171 |
76:173 |
77:169 |
78:170 |
79:174 |
80:178 |
81:165 |
82:172 |
83:171 |
84:163 |
85:170 |
86:169 |
87:178 |
88:163 |
89:163 |
90:160 |
Taille des 90 adultes (en cm)