Inégalités en probabilités

Énoncés

Inégalité de Markov
Soit X une variable aléatoire réelle à valeurs positives admettant une espérance.
Pour tout réel a > 0 on a P(Xa) ≤ (E(X))/(a).
Démonstration
On note Y la variable aléatoire qui vaut a lorsque Xa et qui vaut 0 sinon.

L’inégalité YX implique l’inégalité E(Y) ≤ E(X), or E(Y) = a P(Xa), d’où l’inégalité annoncée.

Inégalité de Bienaymé-Tchebychev
Soit X une variable aléatoire réelle admettant une variance.
Pour tout réel ε > 0 on a P(|XE(X)|ε) ≤ (V(X))/(ε2).
Démonstration
On applique l’inégalité de Markov à la variable aléatoire Z = (XE(X))2, qui est positive et admet une espérance par hypothèse.

Pour tout réel ε > 0, on a P(|XE(X)|ε) = P(Zε2) ≤ (E(Z))/(ε2) avec E(Z) = V(X).

Applications

Loi faible des grands nombres
Soit (Xn) une suite de variables aléatoires réelles indépendantes et de même loi, admettant une variance.
En notant μ leur espérance commune, et en notant ¯(X)n la moyenne empirique des n premières variables, pour tout réel ε > 0 on a limn→+∞ P(|¯(X)nμ|ε) = 0.
Démonstration
On note σ2 la variance de la loi des variables Xn. Pour tout nN, on a E(¯(X)n) = μ et V(¯(X)n) = (σ2)/(n) donc l’inégalité de Bienaymé-Tchebychev donne pour tout ε > 0, 0 ≤ P(|¯(X)nμ|ε) ≤ (σ2)/(nε2) , d’où la limite annoncée par théorème d’encadrement.
Définition
Soit X une variable aléatoire et α > 0. Un intervalle de fluctuation pour X au niveau 1 − α est un intervalle réel I tel que P(XI) ≥ 1 − α.
Exemple
Par application de l’inégalité de Bienaymé-Tchebychev, si X admet une espérance μ et une variance V, en posant ε = (V/α), on trouve P(|Xμ|ε) ≤ α donc P(−ε < Xμ < ε) ≥ 1 − α. Un intervalle de fluctuation pour X au niveau 1 − α est donc donné par ]με, μ + ε[.
Définition
Soit θ un réel, et α > 0.
Un intervalle de confiance au niveau 1 − α pour θ s’écrit [A, B]A et B sont deux variables aléatoires réelles telles que P(AθB) ≥ 1 − α.
Propriété
Soit (Xn) une suite de variables aléatoires réelles indépendantes et de même loi, d’espérance μ et de variance V.
L’intervalle [¯(X)n((V)/(na)), ¯(X)n + ((V)/(na))], est un intervalle de confiance pour μ au niveau 1 − a.
Démonstration
On reprend l’inégalité de Bienaymé-Tchebychev, en remplaçant ε par ((V)/(na)), d’où P(|¯(X)nμ|(V/na))a, donc par passage à l’évènement contraire, P((V/na) < ¯(X)nμ < (V/na)) ≥ 1 − a

En particulier, si les variables Xn sont de Bernoulli de paramètre p, alors on a V(1)/(4) donc l’intervalle donné dans la propriété est de largeur (1)/((na)). Cela assure que pour un échantillon de 1000 personnes, la proportion de réponses positives à une question fermée permet d’évaluer la proportion positives dans la population totale avec une incertitude de 5 points de pourcentage, au niveau de confiance de 90 %.

Si la taille de l’échantillon est fixée, on ne peut faire baisser l’incertitude autour de la mesure qu’en augmentant le risque d’erreur. Inversément, pour réduire le risque d’erreur, il faut accepter une plus grande incertitude, ou augmenter fortement la taille de l’échantillon.