estimation des bornes d’une loi uniforme

On considère une variable aléatoire X suivant la loi uniforme sur un intervalle ]a, b[. L’objectif de l’application est de mettre en évidence les propriétés de l’estimateur, et de définir concrètement l’intervalle de confiance.

Le programme Estimation des bornes d'une loi uniforme permet de simuler des échantillons de X : on peut par exemple simuler 100 échantillons de taille 20 de la variable X, et observer sur chacun d’entre eux la plus petite et la plus grande des valeurs simulées. Le logiciel donne les résultats ci-dessous (extrait):

Chaque échantillon donne un intervalle de confiance de a et de b, une estimation empirique de a (la plus grande valeur de l’intervalle de confiance de a) et de b (la plus petite valeur de l’intervalle de confiance de b).

Le problème consiste à étudier les propriétés de ces estimateurs. On commence par en admettre (ou montrer) les propriétés :

densité de l’estimateur A :

 

1

( b – x ) n-1

fA(x) = n  

______

____________

 

b-a

( b – a )n-1

densité de l’estimateur B :

 

1

( x – a ) n-1

fB(x) = n  

______

____________

 

b-a

( b – a )n-1

 

E(A) = a + (b – a) / (n + 1)

E(B) = b – (b – a) / (n + 1)

On vérifiera que les moyennes observées sur les 100 échantillons vérifient quasiment ces égalités (mA = 0.0511, mB = 0.9557) et que les histogrammes sont proches des densités théoriques que l’on calculera facilement puisque les classes fixées sont de même amplitude et que l’on connaît les valeurs extrêmes de A et de B. 

 

Histogramme des estimations de la borne inférieure a de la loi uniforme

(100 échantillons de taille 20)

Histogramme des estimations de la borne supérieure b de la loi uniforme

(100 échantillons de taille 20)

Nous abordons maintenant l’estimation par intervalle de confiance : quelles sont les valeurs vraisemblables de a pour un niveau de confiance de 1 – a ? De b ?

Limitons-nous tout d’abord à l’estimation par intervalle de confiance de a. Un échantillon de la loi uniforme donne une estimation de a, définie par la plus petite valeur observée umin.

Cet intervalle de confiance est de la forme ]u, umin[, puisque toute valeur numérique de a supérieure strictement à umin est impossible. Une valeur u est considérée comme possible si la valeur observée umin est suffisamment proche de u, c’est-à-dire si la probabilité de l’événement ]u, umin[ est égale à 1 – a.  Une valeur u très différente de umin, c’est-à-dire très inférieure, donnerait une probabilité de l’événement ]u, umin[  supérieure à 1 – a. On en déduit :

IC = { a ; P(A< umin) }= 0.95

On trouve 

IC =

]aa, umin [

avec :

 

 

b - umin

aa = b -

_________

 

0.051/n

L’intervalle de confiance de b est déterminé de la même façon : on se ramène au cas précédent en remarquant que si U suit la loi uniforme sur ]a, b[, -U suit la loi uniforme sur ]-b, -a[, et la plus petite valeur observée de –U est –umax, umax étant la plus grande valeur observée de U. 

On obtient :

IC =

] umax, ba  [

avec :

 

 

a – umax

ba = a -

_________

 

0.051/n

 

On notera que les intervalles de confiance précédents dépendent de la valeur théorique de l’autre paramètre. Ils ne sont donc pas calculables. On peut remplacer cet autre paramètre par son estimation empirique pour donner un intervalle de confiance approximatif. C’est ce qui est programmé dans le logiciel, qui donne le pourcentage d’intervalles de confiance ne contenant pas la vraie valeur. Ce pourcentage doit être comparé au nombre a défini dans le niveau de confiance 1 – a (ici, a = 5%).