Distribuzione geometrica

Niente fonti!
Questa voce o sezione sull'argomento matematica non cita le fonti necessarie o quelle presenti sono insufficienti.
Distribuzione geometrica G ( p ) {\displaystyle {\mathcal {G}}(p)}
Funzione di distribuzione discreta
distribuzione di probabilità
Funzione di ripartizione
funzione di ripartizione
Parametri p [ 0 , 1 ] {\displaystyle p\in [0,1]} q = 1 p   {\displaystyle q=1-p\ }
Supporto N = { 1 , 2 , . . . } {\displaystyle \mathbb {N} ^{*}=\{1,2,...\}}
Funzione di densità p q k 1   {\displaystyle pq^{k-1}\ }
Funzione di ripartizione 1 q k   {\displaystyle 1-q^{k}\ }
Valore atteso 1 p {\displaystyle {\frac {1}{p}}}
Mediana [ log q 1 2 ] {\displaystyle [\log _{q}{\tfrac {1}{2}}]} se log q 1 2 N {\displaystyle \log _{q}{\tfrac {1}{2}}\not \in \mathbb {N} }
Moda 0   {\displaystyle 0\ }
Varianza q p 2 {\displaystyle {\frac {q}{p^{2}}}}
Indice di asimmetria 1 + q q   {\displaystyle {\frac {1+q}{\sqrt {q}}}\ }
Curtosi 6 + p 2 q {\displaystyle 6+{\frac {p^{2}}{q}}}
Entropia log p q p log q {\displaystyle -\log p-{\frac {q}{p}}\log q}
Funzione generatrice dei momenti p e t 1 q e t {\displaystyle {\frac {pe^{t}}{1-qe^{t}}}}
Funzione caratteristica p e i t 1 q e i t {\displaystyle {\frac {pe^{it}}{1-qe^{it}}}}
Manuale

In teoria della probabilità la distribuzione geometrica è una distribuzione di probabilità discreta sui numeri naturali senza l'elemento "0", che segue una progressione geometrica:

P ( X = k ) = p ( 1 p ) k 1 . {\displaystyle P(X=k)=p(1-p)^{k-1}.}

È la probabilità che il primo successo (o evento in generale) richieda l'esecuzione di k prove indipendenti, ognuna con probabilità di successo p. Se la probabilità di successo in ogni prova è p, allora la probabilità che alla k-esima prova si ottenga il primo successo è

P ( X = k ) = p ( 1 p ) k 1 , {\displaystyle P(X=k)=p(1-p)^{k-1},}

con k = 1, 2, 3, …

La formula qui sopra è usata, dunque, per calcolare la probabilità di fare un certo numero k di tentativi fino ad ottenere il primo successo (al k-esimo tentativo). Qui sotto invece, la seguente distribuzione esprime la probabilità di avere k fallimenti prima di ottenere il primo successo:

P ( Y = k ) = p ( 1 p ) k , {\displaystyle P(Y=k)=p(1-p)^{k},}

per k = 0, 1, 2, 3, …

In entrambi i casi, la successione di probabilità è una serie geometrica.

Definizione

La distribuzione geometrica G ( p ) {\displaystyle {\mathcal {G}}(p)} è la distribuzione di probabilità sui numeri naturali della forma

P ( k ) = p q k 1 {\displaystyle P(k)=pq^{k-1}} , con q = 1 p , {\displaystyle q=1-p,}

dove q indica la probabilità di insuccesso. Il parametro q = 1 p {\displaystyle q=1-p} si ricava da

1 = P ( N + ) = k 0 p q k = p 1 1 q . {\displaystyle 1=P(\mathbb {N} ^{+})=\sum _{k\geqslant 0}pq^{k}=p{\frac {1}{1-q}}.}

E ricordando la definizione di q si ottiene 1. Questo risultato è di fondamentale importanza: significa che per quanto sia piccola la probabilità che un evento accada, in un processo di Bernoulli questo prima o poi accadrà (questo si ricollega al teorema della scimmia instancabile).

Se la variabile casuale X ha la distribuzione geometrica sopra descritta riguardante il numero di estrazioni necessarie per ottenere il primo successo, cioè X è distribuita secondo P ( k ) = p q k 1 {\displaystyle P(k)=pq^{k-1}} , allora la distribuzione della variabile casuale Y = X 1 {\displaystyle Y=X-1} sarà P ( k ) = p q k {\displaystyle P(k)=pq^{k}} . Nell'esempio citato sopra, X è il numero di estrazioni da fare perché esca un numero fissato (alla X-esima estrazione), mentre Y è il numero di fallimenti prima di avere il primo successo.

Processo di Bernoulli

La distribuzione geometrica di parametro q descrive anche il numero Y di fallimenti che precedono il primo successo in un processo di Bernoulli { X i } i {\displaystyle \{X_{i}\}_{i}} di parametro p = 1 q {\displaystyle p=1-q} :

P ( T = k ) = P ( X 1 = 0 ) P ( X k = 0 ) P ( X k + 1 = 1 ) = q k p . {\displaystyle P(T=k)=P(X_{1}=0)\cdots P(X_{k}=0)P(X_{k+1}=1)=q^{k}p.}

Caratteristiche

Una variabile aleatoria T con distribuzione geometrica di parametro q e avente come supporto i numeri naturali escluso il numero 0 ha

P ( T = k ) = p q k 1 {\displaystyle P(T=k)=pq^{k-1}}
  • funzione di ripartizione
P ( T k ) = 1 P ( T k + 1 ) = 1 q k {\displaystyle P(T\leqslant k)=1-P(T\geqslant k+1)=1-q^{k}}
  • valore atteso
E [ T ] = k k p q k 1 = 1 p {\displaystyle E[T]=\sum _{k}kpq^{k-1}={\frac {1}{p}}}
Var ( T )   =   E [ T 2 ] E [ T ] 2   =   q p 2 {\displaystyle {\text{Var}}(T)\ =\ E[T^{2}]-E[T]^{2}\ =\ {\frac {q}{p^{2}}}}
  • funzione generatrice dei momenti g ( T , t )   =   E [ e t T ]   =   p e t k q k e k t = p e t 1 q e t {\displaystyle g(T,t)\ =\ E[e^{tT}]\ =\ pe^{t}\sum _{k}q^{k}e^{kt}={\frac {pe^{t}}{1-qe^{t}}}}
  • funzione caratteristica ϕ T ( t )   =   E [ e i t T ]   =   p e i t 1 q e i t {\displaystyle \phi _{T}(t)\ =\ E[e^{itT}]\ =\ {\frac {pe^{it}}{1-qe^{it}}}}

I quantili si ricavano dalla funzione di ripartizione:

  • se n = log q ( 1 α ) {\displaystyle n=\log _{q}(1-\alpha )} è un numero intero ( q = 1 α n {\displaystyle q={\sqrt[{n}]{1-\alpha }}} ) allora F ( n 1 ) = α {\displaystyle F(n-1)=\alpha } e q α [ n 1 , n ] {\displaystyle q_{\alpha }\in [n-1,n]} ;
  • se invece log q ( 1 α ) {\displaystyle \log _{q}(1-\alpha )} non è intero, allora q α = [ log q ( 1 α ) ] {\displaystyle q_{\alpha }=[\log _{q}(1-\alpha )]} (parte intera).

In particolare la mediana è

q 1 / 2 [ n 1 , n ] {\displaystyle q_{1/2}\in [n-1,n]} se q = 1 2 n {\displaystyle q={\sqrt[{n}]{\tfrac {1}{2}}}} con n {\displaystyle n} intero,
q 1 / 2 = [ log q 1 2 ] {\displaystyle q_{1/2}=[\log _{q}{\tfrac {1}{2}}]} altrimenti.

Assenza di memoria

La distribuzione geometrica è priva di memoria, ossia

P ( T = m + n | T > m ) = P ( T = n ) , {\displaystyle P(T=m+n|T>m)=P(T=n),}

ed è l'unica distribuzione di probabilità discreta con questa proprietà.

L'indipendenza delle prove in un processo di Bernoulli implica l'assenza di memoria della distribuzione geometrica. D'altro canto, ogni variabile aleatoria T a supporto sui numeri naturali e priva di memoria rispetta

P ( T = n ) = P ( T = n + 1 | T > 1 ) = P ( T = n + 1 ) P ( T > 1 ) , {\displaystyle P(T=n)=P(T=n+1|T>1)={\frac {P(T=n+1)}{P(T>1)}},}

pertanto ha una distribuzione di probabilità geometrica di parametro P ( T = 1 ) {\displaystyle P(T=1)} .

Generalizzazioni

Una generalizzazione della distribuzione geometrica è la distribuzione di Pascal (o distribuzione binomiale negativa), che descrive il numero di fallimenti precedenti il successo r-esimo in un processo di Bernoulli.

Un'ulteriore generalizzazione della distribuzione di Pascal è la distribuzione di Panjer che, come la distribuzione geometrica, definisce le probabilità per ricorsione.

Esempi

La probabilità che un dado (equilibrato, a 6 facce) debba venire lanciato esattamente 10 volte prima di fornire un "4" è data dalla distribuzione geometrica. Il lancio del dado può essere considerato un processo di Bernoulli, in cui ogni prova Xi ha probabilità p = 1 / 6 {\displaystyle p=1/6} di fornire "4" (successo) e q = 5 / 6 {\displaystyle q=5/6} di fornire un altro numero (fallimento). La probabilità cercata è quindi

P ( T = 10 ) = 1 6 ( 5 6 ) 9 = 0 , 032 {\displaystyle P(T=10)={\frac {1}{6}}\left({\frac {5}{6}}\right)^{9}=0,032\ldots }

La probabilità che dopo 10 lanci sia uscito almeno un "4" è invece

P ( T 10 ) = 1 ( 5 6 ) 10 = 0 , 838 {\displaystyle P(T\leqslant 10)=1-\left({\frac {5}{6}}\right)^{10}=0,838\ldots }

La probabilità che al decimo lancio si ottenga un "4" dopo che per 9 lanci questo numero non è mai stato ottenuto è facilmente calcolabile grazie alla mancanza di memoria

P ( T = 10 | T > 9 ) = P ( T = 1 ) = 1 6 = 0 , 166 {\displaystyle P(T=10|T>9)=P(T=1)={\frac {1}{6}}=0,166\ldots }

Voci correlate

Altri progetti

Altri progetti

  • Wikimedia Commons
  • Collabora a Wikimedia Commons Wikimedia Commons contiene immagini o altri file su Distribuzione geometrica

Collegamenti esterni

  • (EN) Eric W. Weisstein, Distribuzione geometrica, su MathWorld, Wolfram Research. Modifica su Wikidata
  Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica