Exercices sur le chapitre 2

1. moyennes et variances.

On considère la série de données (x_i) i = 1, …, 10 suivante :

x₁ = 1, x₂ = 3, x₃ = 2, x₄ = 7, x₅ = 6, x₆ = 5, x₇ = 10, x₈ = 9, x₉ = 8, x₁₀ = 4

1) Calculer la moyenne et la variance de la série (x_i) i = 1, …, 10.

2) On pose, pour tout i = 1, …, 10 : y_i = x_i + 2. Calculer la moyenne et la variance de la série (y_i) i = 1, …, 10.

3) On pose, pour tout i = 1, …, 10 : z_i = 3 x x_i. Calculer la moyenne et la variance de la série (z_i) i = 1, …, 10.

4) Montrer que si m_x est la moyenne et s_x² la variance d’une série (x_i), i = 1, …, n, la moyenne m_y et la variance s_y² d’une série (y_i) i = 1, …, n définie par : y_i = x_i + k pour i = 1, …, n où le terme k représente un nombre constant, sont de la forme :

m_y = m_x + k

s_y² = s_x²

5) Montrer que la moyenne m_z et la variance s_z² d’une série (z_i) i = 1, …, n définie par z_i = k x x_i pour i = 1, …, n où le terme k représente un nombre constant, sont de la forme :

m_z = k x m_x

s_z² = k² x s_x²

6) On considère maintenant la série de données (y_i) i = 1, …, 10 suivante :

y₁ = 9, y₂ = 3, y₃ = 1, y₄ = 10, y₅ = 5, y₆ = 3, y₇ = 3, y₈ = 9, y₉ = 7, y₁₀ = 6

Calculer la moyenne et la variance de la série définie par (x_i + y_i) i = 1, …, 10.

7) Montrer que si m_x est la moyenne d’une série (x_i), i = 1, …, n, et m_y la moyenne d’une série (y_i), i = 1, …, n, la moyenne m_x+yde la série (x_i + y_i) est de la forme

m_x+y = m_x + m_y

8) On considère la série (z_i’) i = 1, …, n définie par

z_i’ = x_i – m_x + y_i – m_y

Calculer la moyenne m_z’ de la série (z_i) i = 1, …n. Montrer que la variance s_z’² de la série (z_i’) i = 1, …, n est égale à :

	2	n
s_z’² = s_x² + s_y² +	–––	S	(x_i – m_x)(y_i – m_y)
	n	i = 1

En déduire la moyenne et la variance de la série (z_i) i = 1, …n. définie par :

z_i = x_i + y_i

2. des paramètres statistiques aux Diagrammes .

1) 100 personnes donnent une note comprise entre 1 et 5 à quatre spécialités de film suivant leurs préférences :

film d’aventure, de science fiction, policier, psychologique.

On obtient les répartitions suivantes :

Note	1	2	3	4	5
Aventure	10	20	40	20	10
Science-fiction	10	30	20	30	10
Policier	10	20	5	35	30
Psychologique	40	20	10	20	10

Calculer les moyennes et les variances des notes dans chaque cas.

2) Construire les diagrammes correspondants et indiquer le signe des coefficients d’asymétrie dans chaque cas.

3. des diagrammes aux paramètres statistiques.

Dans l’exercice 3 du chapitre 1 on a construit des diagram mes représentant la répartition des notes données par la clientèle à des attentes sur les caractéristiques d’un emballage. Nous étudions ici les mêmes do n n é es, que nous considérons comme quantitatives et établissons une relation entre un diagramme en bâtons et la moyenne et l’écart-type de la série.

1) Examiner les diagrammes des notes données à l’attente « recyclable » et à l’attente « réutilisation ». Que peut-on en déduire sur la moyenne et l’écart-type ?

2) Vérifier par le calcul.

4. moyennes et variances dans le cas de données classées.

On considère les achats des clients de l’hypermarché donnés dans l’exe r cice 1 du chapitre 1. Il s’agit de données classées :on ne connaît pas les montants individuels, mais seulement les classes auxquelles ils appartiennent. Pour calculer une valeur approximative de la moyenne et de la variance, on caractérise en général chaque classe par son centre et l’on effectue les calculs sur les données (n_l, c_l), où n_l est l’effectif de la classe l de centre c_l.

1) Compléter le tableau de calcul ci-dessous concernant les achats en droguerie-quincaillerie:

Cl.	n_i	inf.	sup.	Centre c_i	n_i c_i	n_i c_i²
1	25	0	50	25	625	15625
2	50	50	100	75	3750	281250
3	50	100	150	125	6250
4	10	150	200	175
5	15	200	300	250

Calculer la moyenne , la variance et l’écart-type des achats en droguerie quincaillerie. Déterminer la médiane ou préciser dans quelle classe elle se trouve.

2) Effectuer le même calcul pour les autres achats.

5. densité de l’âge de la clientèle d’euromarket.

On considère l’âge des 50 clients d’EUROMARKET :

24	29	33	36	38	39	40	42	45	53
26	30	34	37	38	39	41	42	48	57
28	31	34	37	39	40	41	43	48	62
29	31	34	37	39	40	41	43	48	67
29	33	35	38	39	40	42	45	51	68

1) Regrouper les clients par âge. Sous quelle forme se présentent alors les données ? Calculer la moyenne, la variance et l’écart-type. Répartir les observations suivant leur âge par rapport à la moyenne (on utilisera la règle donnée dans le cours).

2) Calculer la médiane et les quintiles en expliquant la procédure choisie.

3) Construire l’histogramme suivant la répartition donnée ci-dessous:

[20,30 [,

[30, 40 [,

[ 40, 50 [,

[ 50, 60 [,

[ 60, 70 ]

Les coefficients d’asymétrie et d’aplatissement sont a_s = 1.11 , a_p = 4.50. Est-ce conforme aux résultats de la première question et à la forme de l’histogramme ?

6. Fonction de répartition et courbe de concentration.

On donne ci-dessous les revenus en francs des 50 clients d’EUROMARKET.

72999	86468	95116	103971	128456
74036	87227	95625	104264	130187
76865	87674	96017	107808	134822
80352	87866	96145	110246	138648
81459	90280	96818	110827	143346
82005	91429	96885	112475	155989
84294	91656	98075	116520	161352
84329	93263	98096	117101	190465
84480	93745	98302	117663	195888
84812	94435	103220	121489	196484

1) Calculer la moyenne et l’écart-type. En déduire le coefficient de variation.

2) Calculer la médiane m_é et les déciles d₁, d₂, …, d₉, d₁₀. En comparant la médiane et la moyenne, apprécier la symétrie de la répartition des observations.

3) Représenter la fonction de répartition en d₁, d₂, …, d₉, d₁₀. En déduire graphiquement une valeur approximative des quartiles. Cette valeur est-elle proche des quartiles de la série (on expliquera la procédure de calcul) ?

4) Le coefficient d’asymétrie est égal à 1.59 et le coefficient d’aplatissement à 5.06. La répartition des observations peut-elle être proche de la courbe en cloche ? Est-ce conforme à la médiane ? aux quartiles ? aux déciles ?

5) Calculer les rapports (i) de la somme des dix plus petits revenus à la somme des dix plus grands et (ii) du plus petit au plus grand. Quel est le plus significatif ? Que peut-on dire a priori du coefficient de concentration ?

7. coefficients d’aplatissement et d’asymétrie.

Nous reprenons dans cet exercice les données publiées dans la revue Automoto (cf. exercice III du chapitre 1) et figurant en annexe .

Rappelons que l’on dispose sur ces voitures de 15 notes comprises entre 0 et 20 pour les critères suivants:moteur, performances, comportement, freinage, conduite en ville, sur autoroute, sur route, confort, habitabilité, équipement, finition, budget, prix, revente en occasion, consommation. On donne les coefficients d’asymétrie et d’aplatissement :

	asymétrie	aplatissement		asymétrie	aplatissement
moteur	-0.286	3.143	conf.	0.076	2.647
perf.		inconnu	habit.	-0.141	2.893
camp.	-0.102	2.051	équip.	0.373	3.198
frein.	-0.391	1.986	finit.	0.395	2.771
ville	-0.451	2.235	bud.	-0.833	4.724
autor.	-0.020	2.710	prix	-0.292	3.507
route	inconnu	3.023	occas.	-1.219	4.072

Nous admettrons qu’un coefficient d’asymétrie supérieur à 0.534 en valeur absolue est très différent de 0 de même qu’un coefficient d’aplatissement inférieur à 2.15 ou supérieur à 3.99 (ces valeurs sont données par une table statistique).

1) On considère le critère « conduite sur route ». Construire l’histogramme des notes suivant 5 classes de même amplitude. Que peut-on dire du coefficient d’asymétrie ?

2) Construire l’histogramme du critère performance suivant 5 classes de même amplitude. Que peut-on dire de son coefficient d’asymétrie ? De son coefficient d’aplatissement ?

3) Quels sont les critères suivant lesquels les notes ne sont pas réparties suivant la loi normale ?

4) Que peut-on dire des notes de conduite en ville ?

8. qualité et coût d’une automobile.

Les données étudiées ici sont les mêmes que dans l’exercice précédent, mais, pour simplifier, on a défini deux notes supplémentaires auxquelles on limite l’analyse. La première caractérise l’ensemble des qualités techniques et de confort de la voiture : c’est la « qualité générale » définie par la moyenne des onze premières note. . La seconde mesure le « co ût gl obal » : c’est la moyenne des quatre dernières.

1) Que peut-on dire a priori des coefficients d’asymétrie des notes de qualité et de coût au vu des histogrammes de la qualité et du coût ?

2) Calculer la variance des notes de qualité générale du groupe des petites voitures. Calculer la moyenne des notes de coût global du groupe des petites familiales. Déduire des résultats donnés en annexe la moyenne totale (sur les 67 modèles) des notes de qualité.

3) Quels sont les segments dont les modèles sont les plus homogènes en qualité ? Les plus hétérogènes en coût ? Expliquer pourquoi.

4) Déterminer les modèles de voiture très particuliers au plan de la qualité ou du coût en expliquant la procédure choisie.

Notes moyennes des segments en qualité et en coût

		Qualité	générale	Coût	global
Segments	Effectif	Moyenne	Variance	Moyenne	Variance
Petites	5	14.49		14.45	1.285
Petites familiales	8	14.55	0.219		0.512
Petites familiales diesel	5	14.44	0.332	15.15	0.165
Petites familiales turbo diesel	5	15.31	0.680	13.95	0.285
Familiales	5	15.71	0.130	12.60	0.640
Familiales turbo diesel	8	15.35	1.114	13.63	0.875
Routières	5	15.69	0.151	10.95	0.185
Routières diesel	8	16.01	0.143	12.75	0.938
Breaks	5	13.65	0.405	14.15	1.565
Monospaces	8	14.50	1.184	13.09	2.780
Prestige	5	16.93	1.162	6.10	0.365

Notes de qualité générale et de coût global par segment

	Petites			Petites familiales			Petites familiales diesel
Rang	Qual.	Coût	Rang	Qual.	Coût	Rang	Qual.	Coût
1	14.45	16.00	6	15.36	14.00	14	15.09	15.50
2	14.55	15.25	7	15.00	13.75	15	15.18	14.75
3	14.09	14.50	8	14.82	13.75	16	13.91	15.75
4	14.27	13.75	9	14.36	14.25	17	14.09	15.00
5	15.09	12.75	10	14.55	13.50	18	13.91	14.75
			11	14.09	13.75
			12	13.82	13.75
			13	14.36	11.75
	Petites familiales TD			Familiales			Familiales TD
Rang	Qual.	Coût	Rang	Qual.	Coût	Rang	Qual.	Coût
19	16.09	14.25	24	15.27	13.75	29	16.36	13.75
20	16.09	13.75	25	16.09	12.25	30	16.73	13.00
21	15.73	13.00	26	16.00	12.25	31	16.18	13.00
22	14.45	14.50	27	15.27	13.25	32	15.73	13.00
23	14.18	14.25	28	15.91	11.50	33	14.18	15.00
						34	14.91	13.50
						35	13.45	15.25
						36	15.27	12.50
	Routières			Routières diesel			Breaks
Rang	Qual.	Coût	Rang	Qual.	Coût	Rang	Qual.	Coût
37	15.64	11.75	42	16.36	13.50	50	14.82	14.25
38	16.36	10.75	43	16.27	13.50	51	13.00	16.50
39	15.82	10.75	44	15.82	13.75	52	13.55	13.75
40	15.27	11.00	45	15.82	13.25	53	13.73	13.25
41	15.36	10.50	46	15.64	13.25	54	13.18	13.00
			47	16.36	11.50
			48	16.45	11.00
			49	15.36	12.25
	Monospaces			Prestige
Rang	Qual.	Coût	Rang	Qual.	Coût
55	14.00	15.75	63	18.27	6.50
56	15.64	13.25	64	17.73	5.75
57	15.09	13.75	65	17.18	6.00
58	14.64	12.75	66	16.18	7.00
59	13.55	14.00	67	15.27	5.25
60	16.36	9.50
61	13.91	12.25
62	12.82	13.50

9. Propriétés des paramètres statistiques.

On considère une suite de n observations (x_i) i=1, ..., n.

1) On considère la moyenne m₂’ des carrés des écarts entre la médiane mé et les observations :

m₂’ = [(x₁ – mé)² + (x₂ - mé)² + … + (x_n-mé)²] / n

Comparer m₂’ et la variance s² des observations.

2) On note m la moyenne de la série. Montrer la relation ci-dessous :

1	n			1	n
^___	S	(x_i – x)²	=	^___	S	(x_i – m)² + (x – m)²
n	i = 1			n	i = 1

On suppose dans les questions suivantes que les observations sont réparties en trois groupes I₁, I₂ et I₃ d’effectifs n₁, n₂ et n₃. On supposera pour simplifier que les observations numérotées de 1 à n₁ appartiennent au groupe I₁, de n₁+1 à n₁+n₂ au groupe I₂, de n₁+n₂+1 à n₁+n₂+n₃ = n au groupe I₃.

3) on note m₁, m₂ et m₃ les moyennes des observations dans chaque groupe et m la moyenne totale. Montrer la relation :

m = [ n₁ m₁ + n₂ m₂ + n₃ m₃ ]/n

4) Soit s_m² la variance des moyennes pondérées par les effectifs. Donner la formule définissant cette variance et la formule en facilitant le calcul.

5) Soient s₁², s₂², s₃² les variances des observations dans chaque groupe. Calculer la somme ci-dessous en fonction des observations x_i et des moyennes m, m₁, m₂ et m₃ :

s_m² + [ n₁ s₁² + n₂ s₂² + n₃ s₃² ] /n

Comparer cette somme à la variance de la totalité des observations.

10. Application des résultats de l’exercice 9.

Trois groupes de clients d’une grande marque d’automobile ont décerné des notes concernant la qualité du service après-vente des concessionnaires : les propriétaires d’une petite voiture, d’une voiture de taille moyenne et d’une voiture de grande taille.

On conservera si possible toutes les décimales dans les calculs.

1) calculer la moyenne et la variance dans chaque groupe et sur la totalité des valeurs à l’aide des résultats suivants :

	groupe 1	groupe 2	groupe 3	totalité
effectif	50	50	25	125
somme des valeurs	595.89	702.53	364.87	1663.29
somme des carrés	7311.174	10004.86	5344.00	22660.04

2) calculer la variance des trois notes moyennes. En déduire la somme dont la formule est donnée dans la question 3 de la partie I. Que peut-on en conclure ?

3) On donne ci-dessous les déciles des 125 notes. Donner la médiane et des valeurs approchées des quartiles. Sachant que la note la plus faible est 7.07 et la plus élevée 17.77, construire une représentation graphique approximative de la fonction de répartition des notes et vérifier graphiquement les valeurs proposées précédemment.

d₁= 10.355	d₂= 11.38	d₃= 12.34
d₄= 13.035	d₅= 13.475	d₆= 14.05
d₇= 14.48	d₈= 15.17	d₉= 15.61

4) A quelle valeur 20% des observations sont-elles inférieures ? 40% ? 60% ? 80% ? Comment s’appellent ces valeurs ? Construire l’histogramme des notes en 5 classes de même effectif (on prendra pour plus petite borne 5 et pour plus grande 20). Que peut-on dire des coefficients d’asymétrie et d’aplatissement ?

11. Histogramme et paramètres de données continues.

On analyse les achats en euros de 144 clients d’un magasin que l’on a répartis dans les intervalles ci-dessous :

Classes	Effectifs	Classes	Effectifs
[0, 10]	16	]30, 40]	16
]10, 20]	16	]40, 60]	16
]20, 25]	16	]60, 80]	16
]25, 30]	16	]80, 100]	16
		]100, 150]	16

1) Construire l’histogramme. Le coefficient d’asymétrie est égal à 0.798. Que peut-on en dire ? Donner une valeur approximative de la médiane.

2) Calculer la moyenne, la variance et le coefficient de variation à partir des résultats suivants :

Somme des valeurs	Somme des carrés
7040	541 800

Quel est l’ordre de grandeur des achats ?

3) Un client a acheté pour 92 euros de marchandises. Calculer la valeur centrée réduite de son achat. Est-ce un client important ? Même question pour un client dont les achats s’élèvent à 5 euros. Quand peut-on dire qu’un achat est très faible ? Très élevé ? Conclure en commentant la règle.

4) Construire la fonction de répartition aux points connus et en déduire par interpolation linéaire les valeurs limites des très petites et des très grandes valeurs définies par la seconde règle de classification.

12. comparaison de fonctions de répartition.

On considère la série 1 de données constituées de la taille de 63 étudiants (de sexe masculin) et la série 2 donnant les tailles de 90 adultes de quarante ans et plus et de sexe masculin. Les observations sont données ci-dessous.

1) Ordonner les deux séries suivant les valeurs croissantes. Quel est le pourcentage d’étudiants de moins de 1.75m ? D’adultes de 40 ans ?

2) Construire sur un même graphique les fonctions de répartitions F₁ et F₂des séries 1 et 2. Déterminer graphiquement et par le calcul pour chaque série la médiane et les quartiles.

3) Que peut-on dire des deux fonctions de répartition ?

4) Comparer les moyennes. Y-a-t-il une relation avec la propriété précédente ?

1:184	2:175	3:188.5	4:173	5:169	6:175	7:164	8:190	9:174	10:184
11:168	12:179	13:174	14:163	15:172	16:176	17:190	18:172	19:178	20:173
21:175	22:168	23:180	24:175	25:184	26:181	27:169	28:174	29:175	30:175
31:180	32:172	33:179	34:183	35:170	36:178	37:168	38:188	39:177	40:165
41:172	42:173	43:176	44:177	45:180	46:170	47:184	48:175	49:181	50:175
51:162	52:176	53:187	54:180	55:173	56:172	57:171	58:170	59:172	60:180
61:172	62:178	63:173

Taille des 63 étudiants (en cm)

1:165	2:163	3:168	4:173	5:170	6:175	7:170	8:170	9:170	10:176
11:172	12:167	13:165	14:173	15:173	16:173	17:165	18:165	19:175	20:162
21:170	22:165	23:172	24:166	25:170	26:171	27:177	28:172	29:165	30:168
31:180	32:161	33:180	34:166	35:170	36:175	37:180	38:175	39:178	40:162
41:162	42:172	43:170	44:170	45:180	46:161	47:170	48:165	49:172	50:170
51:160	52:175	53:175	54:172	55:168	56:178	57:165	58:170	59:180	60:166
61:168	62:180	63:169	64:160	65:166	66:165	67:175	68:163	69:165	70:172
71:163	72:175	73:162	74:175	75:171	76:173	77:169	78:170	79:174	80:178
81:165	82:172	83:171	84:163	85:170	86:169	87:178	88:163	89:163	90:160

Taille des 90 adultes (en cm)

24	29	33	36	38	39	40	42	45	53
26	30	34	37	38	39	41	42	48	57
28	31	34	37	39	40	41	43	48	62
29	31	34	37	39	40	41	43	48	67
29	33	35	38	39	40	42	45	51	68

24	29	33	36	38	39	40	42	45	53
26	30	34	37	38	39	41	42	48	57
28	31	34	37	39	40	41	43	48	62
29	31	34	37	39	40	41	43	48	67
29	33	35	38	39	40	42	45	51	68

24	29	33	36	38	39	40	42	45	53
26	30	34	37	38	39	41	42	48	57
28	31	34	37	39	40	41	43	48	62
29	31	34	37	39	40	41	43	48	67
29	33	35	38	39	40	42	45	51	68