4. Lois de probabilité continues.

Nous ne définissons ci-dessous que les lois continues les plus couramment utilisées en statistique. Les démonstrations des formules d’espérance et de variance sont données dans les compléments.

4.1 Loi uniforme continue.

Définition : la densité de la loi uniforme continue sur un intervalle ] a, b [ est définie par la fonction f(x) :

Pour x Î ] a, b[

f(x) = 1/(b–a)

Pour x £ a ou x ³ b

f(x) = 0

Les bornes a et b peuvent être incluses ou exclues de l’intervalle : elles sont de probabilité nulle et cela ne change rien.

Un exemple d’une telle variable est donné par la touche « rnd » ou « random » qui figure sur un grand nombre de calculatrices : à chaque pression de cette touche, on obtient un nombre compris entre 0 et 1, et la densité de cette variable aléatoire est la loi uniforme sur l’intervalle ] 0, 1 [.

 

Propriétés :

·        La moyenne m et la variance s2 théoriques d’une loi uniforme continue sur ] a, b [ sont égales à :

 

a + b

 

(b – a )2

m =E(X) =

–––––

s2 = V(X) =

––––––

 

2

 

12

·        La probabilité d’un intervalle [ x1, x2 ], avec a £ x1 £ x2 £ b suivant la loi uniforme continue sur ] a, b [ est égale à :

P( X Î] x1, x2 ]) = (x2 – x1)/(b – a)

 


Exemple : on considère la loi uniforme continue sur ]0, 2[.

La densité est définie par la fonction f(x) :

pour x Î ] 0, 2[

f(x) = 1/2

pour x £ 0 ou x ³ 2

f(x) = 0

 

Sur la figure 7, la probabilité de l’événement X Î ] x1, x2 ] est l’aire du rectangle représenté en gris. Elle est égale évidemment à P (X Î [ x1, x2 ]).

4.2 Loi exponentielle.

La loi exponentielle est la loi de l’intervalle aléatoire séparant deux événements successifs : en cela, elle est utilisée conjointement avec la loi de Poisson pour l’analyse des files d’attente. Son expression mathématique utilise la fonction exponentielle dont une présentation est donnée dans les compléments.

 

Définition : on appelle loi exponentielle de paramètre a>0 et x0 Î R la loi de probabilité dont la densité est donnée par la fonction suivante :

 

 

–a (x – x0)

pour tout x ³ x0

f(x) = a e

 

pour tout x < x0

f(x) = 0

 

 

Il n’existe pas de table statistique donnant les valeurs de la fonction de répartition F(x) dans le cas de la loi exponentielle. Une simple calculatrice suffit puisque l’on a :

 

 

–a (x – x0)

F(x) = 1 –

e

 

 

Propriété : la moyenne m et la variance s2 théoriques sont égales à :

m = E(X) = x0 + 1/a

s2 = V(X) = 1/a2

 

Nous donnons en figure 8 la représentation graphique de cette densité pour a = 2 et
x0 = 0. La probabilité de l’intervalle [ 1, 1.5] indiqué sur la figure est l’aire de la région comprise entre les deux segments. Elle est égale à F(x2) – F(x1), où F est la fonction de répartition. On a donc :


 

–( x1 – x0)

 

–( x2 – x0)

P(XÎ ] x1, x2] ) =

e

 

– e

 

 

4.3 Loi normale.

La loi normale est une densité théorique donnant la répartition d’une infinité d’observations sous la forme d’une courbe dite courbe en cloche (figure 9) à laquelle nous avons déjà fait référence dans les chapitres antérieurs. Elle est appelée aussi loi de Laplace-Gauss. Elle fait intervenir deux paramètres m et s (p = 3.1415…évidemment).

 

Définition : on appelle loi normale de paramètres m Î R et s > 0 la loi de probabilité dont la densité est définie par la fonction suivante :

 

1

 

– ½ [ (x – m)/s ]2

f(x) =

_____________

e

 

 

s [ 2 p ]1/2

 

 

Propriétés :

·        Les paramètres m et s2 sont la moyenne et la variance de la loi normale.

·        Si X suit la loi normale de moyenne m et de variance s2, la loi de (X – m)/s est la loi normale de moyenne 0 et de variance 1. La v.a. (X – m)/s est centrée et réduite.

 

Les zones grisées sur la figure 9 correspondent aux valeurs ±1.96 ; elles ont chacune pour aire 0.025, ou 2.5%. On retrouve la première règle de classification des valeurs observées proposée dans le chapitre 2 :

 

P[ m – 1.9600 s < X < m + 1.9600 s ]

= 0.95

P[ m – 1.6449 s < X < m + 1.6449 s ]

= 0.90

P[ m + 1.0364s < X < m + 1.0364 s ]

= 0.70

P[X < m – 1.9600s ]

= 0.025

P[X > m + 1.9600 s ]

= 0.025

P[X > m + 1.6449 s ]

= 0.050

P[X < m – 1.6449 s ]

= 0.050

P[X > m + 1.0364 s ]

= 0.150

P[X < m – 1.0364 s ]

= 0.150

 

L’importance de la loi normale est considérable en statistique : on la rencontre très fréquemment dans les applications et elle possède des propriétés fondamentales dont la plus importante est connue sous le nom de « theorem central limit », ou, en français, théorème de la limite centrale (on dit aussi centrée), que nous énonçons dans le chapitre suivant.

4.4 Loi du c2 et loi de Fisher.

La loi du c2 (du Chi2) de Pearson est la loi d’une v.a. notée souvent X2 (il ne s’agit pas du carré d’une v.a. X) et définie par la somme de carrés de v.a. indépendantes suivant la loi normale centrée réduite X1, X2, …, Xn:

X2 = X12 + X22 + … + Xn2

 

Le nombre n de ces v.a. normales et appelé degré de liberté. L’espérance de X2 est égale à n et sa variance à 2 n. On notera que la densité n’est pas symétrique (figure 10).

Les zones grisées correspondent aux valeurs 31.55 et 70.22 ; elles ont pour aire 0.025 (ou 2.5%). La probabilité qu’une variable qui suit la loi du c2 de degré de liberté n = 49 soit comprise entre 31.55 et 70.22 est donc égale à 0.95.

La loi de Fisher (ou Fisher Snedecor) est la loi de probabilité du rapport F de deux variables X12 et X22 suivant chacune la loi du c2 de degré de liberté n1 et n2, et divisées par ces degrés de liberté :

 

X12 / n1

F =

–––––––––

 

X22 / n2

 

On notera que si F suit la loi de Fisher de degrés de liberté n1 et n2, 1/F suit la loi de Fisher de degrés de liberté n2 et n1.

Ces lois sont utilisées pour effectuer des estimations par intervalle de confiance et des tests d’indépendance (cf. paragraphe 5 .3 et chapitres suivants)

4.5 Loi de Student.

La loi de Student est la loi d’une v.a. notée T définie par le rapport d’une v.a. X suivant la loi normale centrée réduite et de la racine carrée d’une v.a. X2suivant la loi du c2 et divisée par son degré de liberté :

 

X

T =

––––––

 

[X2/n]1/2

 

Elle dépend de ce degré de liberté noté n. Elle est symétrique, de moyenne nulle, de variance n/(n – 2). Sa densi (figure 11) est une fonction compliquée dont l’expression ne présente pas d’intérêt ici. Lorsque le degré de liberté n augmente (n>120), la loi de Student est confondue avec la loi normale centrée réduite.