Loi de Markov-Pólya | |
Paramètres | |
---|---|
Support | |
Fonction de masse | |
Espérance | |
Variance | |
Fonction génératrice des probabilités | |
modifier |
En mathématiques et plus particulièrement en théorie des probabilités, la loi de Markov-Pólya[1] (ou loi de Pólya-Eggenberger[2] ou loi de Pólya[3]) est une loi de probabilité discrète. Elle doit son nom au mathématicien George Pólya (ainsi qu'aux mathématiciens F Eggenberger et Andreï Markov) qui a publié un article[4], conjointement avec Eggenberger, en 1923 sur cette loi ainsi que sur le problème d'urne sous-jacent. Cependant Markov serait le premier à avoir étudié cette loi en 1917[5].
Définition
Considérons une urne contenant a boules blanches et b boules noires (pour un total de m = a + b boules). Nous répétons l'expérience suivante n fois : on pioche uniformément au hasard une boule dans l'urne, puis, on replace la boule piochée ainsi que h autres boules de la même couleur dans l'urne. La loi de Markov-Pólya de paramètres a, b, h et n est alors la loi de la variable aléatoire X qui compte le nombre total de boules blanches piochées au bout de ces n tirages.
La fonction de masse de la variable X peut se calculer et on a[6],[7]
où on a utilisé la notation[3] suivante .
Les paramètres a, b et n sont des entiers naturels tandis que h est un entier relatif, il peut donc être négatif[8]. Lorsque h est négatif on rajoute la condition pour éviter tout problème de définition.
Propriétés
Soit X une variable aléatoire ayant la loi de Markov-Pólya de paramètres a, b, h et n.
- Si h = 0, alors X suit une loi binomiale de paramètres n et p = a/m.
- Si h = −1, alors X suit une loi hypergéométrique de paramètres n, p = a/m et N = m.
- Si h = 1, alors X suit une loi bêta-binomiale de paramètres 𝛼 = a, 𝛽 = b et n.
- Lorsque h ≠ 0 on peut réécrire la fonction de masse de X des manières suivantes :
où désigne la factorielle croissante et désigne un coefficient binomial généralisé[9].
- L'espérance de X est donnée par .
Il est intéressant de noter que l'espérance ne dépend pas du paramètre h.
- La variance de X est donnée par .
- Plus généralement, si h ≠ 0 alors le r-ième moment factoriel de X est donnée par[7]
où désigne la factorielle décroissante.
- La fonction génératrice des probabilités de X vérifie[7]
où désigne la fonction hypergéométrique.
Limites
- Soit Xn une variable aléatoire ayant la loi de Markov-Pólya de paramètres a, b, h > 0 (fixés) et n. On a la convergence en loi suivante[10] :
où B désigne la loi bêta. En fait la convergence a lieu pour la distance de Wasserstein à tous les ordres avec pour vitesse de convergence 1/n. Cela implique en particulier la convergence de tous les moments vers ceux de la loi bêta.
- Soit Xn une variable aléatoire ayant la loi de Markov-Pólya de paramètres a, b, h > 0 (dépendant de n) et n. Supposons que et que quand n tend vers l'infini. Alors Xn converge en loi[11] vers une loi binomiale négative[12] de paramètres r et p = 1/(1+𝜃).
- D'autres limites sont possibles (par exemple vers une loi gaussienne lorsque h = 0) en changeant la manière dont évoluent les paramètres en fonction de n[13].
Généralisation
On peut généraliser la loi de Markov-Pólya en considérant non plus 2 mais q > 2 couleurs de boules différentes dans l'urne avec a1 boules blanches, a2 boules noires, a3 boules rouges, etc. Dans ce cas si X représente le vecteur du nombre de boules tirées par couleur après n tirages alors on a[6]:
- .
Il est toujours possible de calculer la fonction génératrice multivariée de X en utilisant les fonctions hypergéométriques.
Pour a1, ... , aq, h > 0 (fixés) et n qui tend vers l'infini, on a convergence en loi[10] du vecteur vers une loi de Dirichlet de paramètres a1/h, ... , aq/h.
Notes et références
- ↑ (en) K G Janardan, « On Characterizing the Markov-Polya Distribution », The Indian Journal of Statistics, vol. 46, , p. 444-453 (lire en ligne)
- ↑ (en) Anwar Hassan, Sheikh Bilal et Imtiyaz Ahmad Shah, « On Some Properties and Estimation of Size-Biased Polya-Eggenberger Distribution », Journal of Modern Applied Statistical Methods, vol. 11, , article no 10 (lire en ligne)
- (en) Héctor M Ramos, David Almorza et Juan A. Garcia–Ramos, « On characterizing the Polya distribution », ESAIM: Prob. and Stat., vol. 6, , p. 105-112 (lire en ligne)
- ↑ (de) F Eggenberger et G Polya, « Über die Statistik verketteter Vorgänge », Z. Angew. Math. Mech., vol. 3, , p. 279-289 (lire en ligne)
- ↑ (ru) A A Markov, « Sur quelques formules limites du calcul des probabilités », Bulletin de l’Académie Impériale des Sciences, vol. 11, , p. 177-186
- Charles Jordan, « Sur un cas généralisé de la probabilité des épreuves répétées », C. R. Acad. Sci. Paris, vol. 184, , p. 315-317 (lire en ligne)
- Charles Jordan, « Sur un cas généralisé de la probabilité des épreuves répétées »
- ↑ Si h < 0 on retire la boule piochée et on retire aussi |h| − 1 boules de la même couleur que la boule piochée.
- ↑ Plus précisément, pour x entier positif et z réel, on définit le coefficient binomial de la manière suivante : . La généralisation peut encore être poussée en utilisant la fonction gamma mais ce n'est pas nécessaire dans notre cas.
- (en) Svante Jordan, « Rate of convergence for traditional Polya urns », Journal of Applied Probability, vol. 57(4), , p. 1029-1044 (lire en ligne)
- ↑ (en) Dietmar Willi Pfeifer, « Pólya–Lundberg Process », Encyclopedia of Statistical Sciences, (lire en ligne)
- ↑ On entend ici une loi binomiale négative généralisée à une paramétrisation réelle. Plus précisément, Z suit une loi binomiale négative de paramètres r (réel positif) et p (réel entre 0 et 1) si et seulement si Cette loi binomiale négative généralisée est aussi parfois appelée loi de Polya (ou loi de Polya-Eggenberger) ce qui peut créer des confusions avec la loi de Markov-Polya.
- ↑ F Eggenberger et G Polya, « Calcul des probabilités – sur l’interprétation de certaines courbes de fréquence », C. R. Acad. Sci. Paris, vol. 187, , p. 870-872 (lire en ligne)