Exercices sur le chapitre 5

1. lois du maximum et du minimum.

On considère un échantillon Xi, i = 1, …, n d’une variable aléatoire X dont la densité est notée f(x) et la fonction de répartition F(x).

On note A et B les v.a. définies par :

A = inf{Xi, i = 1, … , n}

B = sup {Xi, i = 1, … , n}

Les valeurs observées a de A et b de B sont donc la plus petite et la plus grande des valeurs observées xi, i = 1, …, n.

1) Calculer les f.d.r. FA de A et FB de B en fonction de la la f.d.r. de X. En déduire les densités.

2) On suppose maintenant que la v.a. X suit la loi uniforme continue sur l’intervalle [a, b]. Calculer la densité de A et B.

3) En déduire l’espérance des v.a. A et B. Les estimateurs A et B sont-ils sans biais ?

4) Montrer que A et B sont les estimateurs du maximum de vraisemblance de a et b.

2. Estimateur de la variance.

On considère un échantillon Xi, i = 1, …, n d’une v.a. X d’espérance m et de variance s2 :

m = E(X)

s2 = E(X – m)2

On note M l’estimateur de la moyenne m :

 

 

n

 

M

 =

S

Xi

 

 

i = 1

 

On sait que un estimateur de la variance est la v.a. S2 définie par :

 

 

n

 

S2

 =

S

(Xi – M)2

 

 

i = 1

 

1) Montrer la relation suivante :

1

n

 

 

 

 

 

____

S

(Xim)2

 =

S2

(M – m)2

n

i = 1

 

 

 

 

 

2) On rappelle que l’espérance d’une somme est la somme des espérances, et que la variance de la v.a. M est égale à s2 / n. En déduire que :

E(S2) = (n – 1) s2 / n

L’estimateur S2 de s2 est-il sans biais ? Asymptotiquement sans biais ?

3. estimation par intervalles de confiance (lois normales).

On dispose d’un échantillon d’étudiants et de leurs pères donnant pour chacun la taille, le poids et la pointure. On choisit dans toute la suite du texte un niveau de confiance 1 – a  = 0.95.

Le nombre d’observations est égal à 63, et les paramètres statistiques sont les suivants :

Taille

moyenne

variance

des étudiants

175.6587

39.72877

des pères

170.6349

39.8191

1) Calculer les intervalles de confiance de la taille moyenne des étudiants et de celle de leurs pères. Peut-on en déduire que les étudiants sont plus grands que leurs pères ? En quel sens ?

2) On étudie la série des différences. Les résultats sont donnés ci-dessous :

 

moyenne

variance

Différences

5.0238

37.16213

Calculer l’intervalle de confiance de la moyenne des différences. Conclure.

3) La proportion d’étudiants plus grands que leurs pères est égale à 0.841. Calculer l’intervalle de confiance symétrique de cette proportion.

4) Calculer l’intervalle de confiance de la forme [ pa, + ¥ [ de la proportion d’étudiants plus grands que leurs pères.

4. estimation par intervalles de confiance (proportions)

Une société mutuelle d’assurance effectue tous les ans une enquête pour évaluer le pourcentage d’accidents domestiques parmi ses adhérents au cours de l’année antérieure.

1) Le résultat de l’enquête en 2005 (pourcentage d’accidents domestiques en 2004) est égal à 5%. L’enquête a été effectuée auprès de 2000 personnes. En déduire l’intervalle de confiance pour un niveau de confiance égal à 0.95.

2) Quelle est, pour le même niveau de confiance, le pourcentage minimum ? Le pourcentage maximum ?

3) On demande que l’enquête que l’on effectuera en 2006 pour estimer ce pourcentage en 2005 donne une fourchette limitée à 2%. Quelle est la taille de l’échantillon qu’il faudra choisir ?

5. Intervalles de confiance (achats par correspondance).

L’entreprise de VPC Les Trois Redoutes a effectué un sondage auprès de sa clientèle en tirant un échantillon de 500 personnes dans le fichier clients.

On a réparti les observations dans des intervalles et calculé la moyenne et la variance des achats de ces 500 personnes en 1993 et en 1994.

Les résultats sont les suivants :

Achats de

1993

Achats de

1994

Différences

1994 – 1993

Classes

Effectifs

Classes

Effectifs

Classes

Effectifs

[1000 , 1600 [

41

[ 700 , 1600 [

29

[-1100 , -600 [

8

[1600 , 1900 [

51

[1600 , 1900 [

64

[-600 , -400 [

21

[1900 , 2200 [

98

[1900 , 2200 [

88

[-400 , -100 [

125

[2200 , 2500 [

118

[2200 , 2500 [

109

[-100 , 100 [

127

[2500 , 2800 [

99

[2500 , 2800 [

95

[100 , 400 [

147

[2800 , 3100 [

63

[2800 , 3100 [

62

[400 , 600 [

53

[3100 , 3800 [

30

[3100 , 4000 [

53

[600 , 1100 [

19

 

 

 

moyenne

variance

 

achats 1993

2340

256400

 

achats 1994

2400

290000

différence des achats

60

89400

 

 

1) Construire les histogrammes des achats et de leurs différences (cf. exercice 5 du chapitre 1). Commenter ces histogrammes en liaison avec les coefficients ci-dessous :

 

asymétrie

aplatissement

achats 93

-7.195728E-02

2.911574

achats 94

.1139587

2.891195

achats 94 – achats 93

.1248358

3.129754

2) Calculer l’intervalle de confiance de la moyenne et de la variance des achats en 1993 et en 1994 (on prendra 0.95 comme niveau de confiance). Peut-on dire que les achats en 1994 ont été en moyenne supérieurs à ceux de 1993 ?

3) On considère la différence entre ces achats calculée sur chacun des 500 clients. Peut-on préciser la réponse à la question précédente ?

6. estimation d’une probabilité.

Une entreprise automobile se préoccupe du nombre de clients renouvelant leur voiture en achetant un modèle d’un concurrent.

Une enquête auprès de 1 000 clients fait apparaître un pourcentage national égal à 35%.

1) Donner l’intervalle de confiance de ce pourcentage pour un niveau de confiance égal à 0.99.

2) Quelle est la valeur maximale de ce pourcentage, pour le même niveau de confiance ?

3) Ce pourcentage, chez certains concessionnaires de la marque, atteint 40%.  Cela signifie-t-il que leurs performances commerciales sont insuffisantes ?