Cadre général
Une
variable aléatoire réelle sur un
espace probabilisé (Ω, A, P) est une application
X :
Ω → R
telle que pour tout intervalle
I ⊂ R,
sa préimage
X−1(I) soit un évènement dont on note
P(X ∈ I) la probabilité.
Elle est dit
à densité s'il existe une fonction
ρ, appelée
fonction de densité de
X, qui soit
définie, positive et
intégrable sur
R,
telle que pour tout
(a, b) ∈ R2 vérifiant
a ≤ b on ait
P(a ≤ X ≤ b)
= P(X ∈ [a ; b])
= ∫ab ρ(t) dt.
En particulier, si X est une variable à densité, pour tout a ∈ R on obtient P(X = a)
= ∫aa ρ(t) dt
= 0. Cela signifie notamment qu'une variable à densité ne peut pas être une variable discrète, et réciproquement.
Par passage à la limite des bornes, on trouve aussi
∫−∞+∞ ρ(t) dt
= P(X ∈ R) = 1.
Par propriété de l'intégrale généralisée, si ρ est une fonction réelle définie, positive, continue sur R sauf en un nombre fini de points et intégrable sur R d'intégrale 1, alors cette fonction peut apparaitre comme la fonction de densité d'une variable aléatoire.
On se limitera ici aux variables aléatoires admettant une fonction de densité continue, sauf éventuellement en un nombre fini de points.
Soit X une variable aléatoire réelle. Sa fonction de répartition est la fonction réelle définie pour tout x ∈ R par
FX(x) = P(X ≤ x).
La fonction de répartition est croissante avec
limx→−∞ FX(x) = 0
et limx→+∞ FX(x) = 1.
La fonction de répartition d'une variable à densité est continue.
Soit X une variable aléatoire à densité et soit x ∈ R. Si la fonction de densité ρ est continue en x alors la fonction de répartition est dérivable en x et dans ce cas FX′(x) = ρ(x).
En particulier, la fonction de répartition caractérise la densité si celle-ci est continue.
Soit X une variable aléatoire réelle dont la fonction de répartition est continue et dérivable sur R.
Si la dérivée de la fonction de répartition est continue sauf éventuellement en un nombre fini de points, alors cette dérivée constitue une fonction de densité pour la variable X.
Si X est une variable aléatoire réelle à densité alors |X| aussi et pour toute fonction continue et strictement croissante g, dérivable et dont la dérivée ne s'annule pas sauf éventuellement en un nombre fini de points, la composée g(X) est aussi une variable aléatoire réelle à densité.
Lois de référence
On dit qu'une variable aléatoire réelle X
suit la loi uniforme sur un intervalle [a, b]
si elle admet comme fonction de densité la fonction définie par ρ(t) = 1/(b − a)
pour tout t ∈ [a ; b] et nulle en dehors de ce segment.
On note alors X ↝
𝓤([a, b]).
Il ne faut pas confondre cette loi avec la loi uniforme discrète. Une telle variable aléatoire a une fonction de répartition qui est affine sur l'intervalle [a, b], nulle sur ]−∞ ; a] et constante de valeur 1 sur [b ; +∞[.
Soit λ ∈ R∗+.
On dit qu'une variable aléatoire réelle X
suit la loi exponentielle de paramètre λ
sur R+
si elle admet comme fonction de densité la fonction définie par
ρ(t) = λ e−λt
pour tout t ∈ R+
et nulle sur R∗−.
On note alors X ↝
𝓔(λ).
La fonction de répartition d'une telle variable aléatoire est la fonction
x ↦ 1 − e−λx.
Soit μ ∈ R et σ ∈ R∗+.
On dit qu'une variable aléatoire réelle X
suit la loi normale de paramètres μ et σ
sur R
si elle admet comme fonction de densité la fonction définie par
ρ(t) = 1/(σ√(2π)) exp(−(t − μ)2/(2σ2))
pour tout t ∈ R.
On note alors X ↝
𝓝(μ, σ2).
La loi normale centrée réduite correspond à 𝒩(0, 1)
Attention, cette notation n'est pas complètement normalisée. Le deuxième paramètre est parfois simplement σ.
La fonction de répartition d'une telle variable aléatoire ne peut s'exprimer à l'aide des fonctions de référence vues au lycée. On peut cependant la calculer à partir de la fonction d'erreur (notée erf).
Il existe beaucoup d'autres lois de probabilités classiques pour des variables aléatoires à densité. On peut citer notamment la loi de Cauchy, dont la version la plus simple est donnée par la fonction de densité t ↦ 1/(π (1 + t2)).
La loi exponentielle est sans mémoire, c'est-à-dire que si X ↝
𝓔(λ),
alors pour tout (a, b) ∈ (R+)2,
PX>a(X > a + b)
= P(X > b).
Réciproque de la fonction de répartition
Soit U une variable uniforme
sur l’intervalle ]0 ; 1[
et ρ une fonction de densité continue
(sauf en un nombre fini de points)
sur un intervalle réel ]a, b[
(éventuellement non borné).
Si la primitive F : x ↦ ∫axρ est strictement croissante sur ]a, b[,
elle établit une bijection entre ]a, b[
et ]0 ; 1[ et sa réciproque permet de définir la variable aléatoire F−1(U) de densité ρ.
La variable
X = F−1(U)
a ses valeurs dans ]a, b[
et pour tout (c, d)
∈ ]a, b[2
tel que c < d on a
P(c < X < d)
= P(F(c) < U < F(d)
= F(d) − F(c)
= ∫cd
ρ(t) dt.
Soit X une variable aléatoire à densité ρ sur un intervalle I et dont la fonction de répartition soit strictement croissante sur I.
Pour tout α ∈ ]0 ; 1[, le quantile d’ordre α est l’unique antécédent de α par FX.
En particulier, la médiane de X
est l’unique réel m ∈ ]a, b[
tel que P(X ≤ m) = P(X ≥ m) = 1/2.
- Si X ↝ 𝒰(]a, b[),
sa médiane vaut (a+b)/(2).
- La médiane d’une variable exponentielle de paramètre λ vaut (ln(2))/(λ).
- La médiane d’une variable normale est son premier paramètre.
- Une variable normale centrée réduite admet un quantile d’ordre 0,975 qui vaut environ 1,96.
Espérance
Si
X est une variable aléatoire réelle avec une fonction de densité
ρ nulle en dehors d'un intervalle
]a, b[, on dit qu'elle
X admet une espérance si la fonction
t ↦ |t| ρ(t) est
intégrable. Dans ce cas l’
espérance de
X est la valeur de l’intégrale
E(X)
= ∫ab t ρ(t) dt.
- Une variable uniforme sur un segment [a, b] admet une espérance (a + b)/2.
- Une variable exponentielle X de paramètre λ admet une espérance E(X) = 1/λ.
- Le premier paramètre de la loi normale est son espérance.
Si l’intervalle ]a, b[ n’est pas inclus dans R+, l’intégration sur R− revient à prendre l’opposé de l’intégrale de la valeur absolue.
Soit X une variable aléatoire réelle à densité. Si elle admet une espérance, alors on obtient d'une part
P(X ≤ t) = ot→−∞(1/t)
et P(X ≥ t) = ot→+∞(1/t),
d'autre part les intégrales ∫−∞0 P(X ≤ t) dt
et ∫0+∞ P(X ≥ t) dt convergent avec E(X)
= ∫0+∞ P(X ≥ t) dt
− ∫−∞0 P(X ≤ t) dt.
On peut donc étendre la définition de l'espérance pour des variables aléatoires réelles qui ne sont pas forcément à densité.
L’espérance est linéaire : si X et Y sont deux variables aléatoires admettant une espérance alors pour tout λ ∈ R on a
E(X + λY)
= E(X) + λ E(Y).
L’espérance est croissante : si X et Y sont deux variables aléatoires admettant une espérance telles que P(X ≤ Y) = 1
alors E(X) ≤ E(Y).
- Théorème de transfert
- Si X est une variable aléatoire réelle de densité f et admettant une espérance,
alors |X| admet aussi une espérance et E(|X|)
= ∫−∞+∞ |t| ρ(t) dt.
Pour toute fonction continue et strictement croissante g, dérivable et dont la dérivée ne s'annule pas sauf éventuellement en un nombre fini de points, la composée g(X) admet une espérance si et seulement si la fonction t ↦ |g(t)| ρ(t) est intégrable
et dans ce cas E(g(X))
= ∫−∞+∞ g(t) ρ(t) dt
.
Soit X une variable aléatoire réelle à densité. Si X est bornée alors elle admet une espérance.
Puisque X est bornée, elle admet une fonction de densité f nulle en dehors d’un segment [a,b]. En notant M
= max(|a|,
|b|), on trouve
∫ab |t| f(t) dt
≤ ∫ab M f(t) dt = M × 1 donc l’intégrale converge et X admet une espérance.
Il ne faut pas confondre une variable (à densité) bornée et une variable dont la densité est bornée.
Par exemple, une variable exponentielle n’est pas bornée mais sa densité l’est.
Inversément, si X est une variable de densité x ↦ − ln(x) sur l’intervalle ]0, 1], la fonction de densité n’est pas majorée (elle tend vers +∞ en 0) mais la variable est bornée (puisque son support est ]0, 1[).
Une variable uniforme est bornée avec une fonction de densité bornée.
Enfin, la densité t ↦ 1/(π√x(1 + x)) n’est pas bornée sur ]0, +∞[ et toute variable qui suit cette densité n’est pas bornée non plus.
Moments d’ordre supérieur
Soit
X une variable aléatoire réelle. Soit
r ∈ N∗.
On dit que X admet un moment d'ordre r si la puissance Xr admet une espérance et dans ce cas ce moment est égal à E(Xr).
Si X admet une espérance, on dit que X admet un moment centré d'ordre r si la puissance (X − E(X))r admet une espérance et dans ce cas ce moment est égal à E((X − E(X))r).
La variance est le moment centré d'ordre 2,
et l’écart type est sa racine carrée σ(X) = √(V(X)).
Une variable aléatoire réelle à densité admet un moment centré d'ordre r si et seulement si elle admet un moment d'ordre r.
Si une variable aléatoire réelle à densité admet un moment d'ordre r alors elle admet un moment d'ordre q pour tout entier naturel q ≤ r.
La variance est quadratique et invariante par l’addition d’une constante : pour toute variable aléatoire X admettant un moment d’ordre 2,
pour tout (a, b) ∈ R2,
V(aX + b) = a2V(X).
- Formule de Koenig-Huygens
- Si X est une variable aléatoire à densité admettant un moment d'ordre 2, alors
V(X) = E(X2) − E(X)2.
Soit X une variable aléatoire réelle de densité ρ
et admettant un moment d’ordre 2. La variable X∗ = (X − E(X))/(σ(X)) est centrée réduite,
c’est-à-dire qu’elle a une espérance nulle et une variance qui vaut 1.
Sa densité s’écrit ρ∗(x)
= σ(X) ρ(σ(X)x + E(X))