Dans tout le problème on fixe n ∈ N*.
Cas discret
Soit b ∈ N*. On considère une famille de variables aléatoires indépendantes et identiquement distribuées (IID) (U1, …, Un) de loi uniforme sur l’ensemble ⟦1, b⟧, puis on définit la variable aléatoire M = max(U1, …, Un). Pour tout m ∈ ⟦1, b⟧ on a P(M = m) = P(M ≤ m) − P(M ≤ m − 1) = (mn − (m − 1)n)bn.
Si on remplace le paramètre b par une variable aléatoire B discrète dans N* avec les mêmes hypothèses que ci-dessus, c’est-à-dire PB = b(U1 = u1, …, Un = un) = 1bn, alors on montre la loi conditionnelle de B par rapport à (U1, …, Un) ne dépend que de M = max(U1, …, Un).
En effet,
P∀i,Ui = ui(B = b)
= P(B = b
et ∀i, Ui = ui)∑k ≥ m
P(B = k et ∀i, Ui = ui)
= P(B = b) / bn∑k ≥ m (P(B = k) / kn)
et PM = m(B = b)
= P(B = b
et M = m)∑k ≥ m
P(B = k et M = m)
= P(B = b)
× (mn − (m − 1)n)
/ bn∑k ≥ m (P(B = k)
× (mn − (m − 1)n)
/ kn)
= P(B = b) / bn∑k ≥ m
(P(B = k) / kn)
On cherche donc une suite (βm) telle que pour tout b ∈ N*, la variable aléatoire βM produise un estimateur sans biais de b.
Pour tout b ∈ N*, on a l’équivalence b = E(βM) ⇔ ∑m = 1b βm × (mn − (m − 1)n) = bn+1.
Donc par différences des termes successifs on obtient la relation équivalente ∀m ∈ N*, βm × (mn − (m − 1)n) = mn+1 − (m − 1)n+1.
Finalement, on obtient un estimateur sans biais du paramètre a de la loi uniforme à partir du maximum M de l’échantillon par (Mn+1 − (M − 1)n+1)(Mn − (M − 1)n).
Cas continu
Soit b ∈ R∗+. On considère une famille de variables aléatoires indépendantes et identiquement distribuées (IID) (U1, …, Un) de loi uniforme sur l’ensemble [0, b], puis on définit la variable aléatoire M = max(U1, …, Un). Pour tout m ∈ [0, b] on a P(M ≤ m) = mnbn donc la variable M suit une loi de densité x ↦ nxn−1bn.
Notons β une fonction de R∗+ dans lui-même et on résout par équivalences ∀b ∈ R∗+, b = ∫0b β(x) nxn−1bndx ⇔ ∀b ∈ R∗+, bn+1 = ∫0b β(x) × nxn−1dx ⇔ ∀x ∈ R∗+, (n + 1)xn = β(x) × nxn−1
Finalement, la fonction β est définie par ∀x ∈ R∗+, β(x) = (n+1)n x.
Avec deux paramètres
Cette fois, la probabilité que toutes les variables Ui, indépendantes et identiquement distribuées de loi uniforme sur l’intervalle [a, b], se trouvent entre deux valeurs l et m s’écrit P(∀i, l ≤ Ui ≤ m) = (m − l)n(b − a)n.
Donc la fonction de densité associée au couple (L, M) = (min(U1, …, Un), max(U1, …, Un)) est définie par (x, y) ↦ −∂2∂x ∂y (y − x)n(b − a)n = n(n − 1)(y − x)n−2(b − a)n.
On résout donc par équivalences
Donc l’estimateur de la borne supérieure de l’intervalle est défini par (nM − L)(n − 1) = M + (M − L)(n − 1). De même, l’estimateur de la borne inférieure s’écrira L + (L − M)(n − 1).