Hypergeometrische verdeling

In de kansrekening is de hypergeometrische kansverdeling een discrete kansverdeling die de kansen geeft op de aantallen successen bij een vast aantal trekkingen zonder terugleggen uit een eindige populatie. Het is het analogon van de binomiale verdeling als er sprake is van een steekproef zonder terugleggen. De kansen op succes en mislukking veranderen dus per trekking en zijn afhankelijk van vorige uitkomsten.

Definitie

In een serie van n {\displaystyle n} aselecte trekkingen zonder terugleggen uit een eindige populatie ter grootte N {\displaystyle N} , waarin M {\displaystyle M} successen en N M {\displaystyle N-M} mislukkingen zijn, wordt de kans op m {\displaystyle m} successen voor m = 0 , 1 , , n {\displaystyle m=0,1,\ldots ,n} gegeven door:

p ( m ) = ( M m ) ( N M n m ) ( N n ) {\displaystyle p(m)={\frac {{M \choose m}{N-M \choose n-m}}{N \choose n}}} .

Als de stochastische variabele X {\displaystyle X} het aantal successen bij de n {\displaystyle n} trekkingen voorstelt, geldt:

P ( X = m | N , M , n ) = p ( m ) {\displaystyle P(X=m|N,M,n)=p(m)}

en zegt men dat X {\displaystyle X} hypergeometrisch verdeeld is met parameters N , M {\displaystyle N,M} en n {\displaystyle n} .

Verwachtingswaarde en variantie

De verwachtingswaarde van een hypergeometrisch verdeelde stochastische variable X {\displaystyle X} is:

E ( X ) = n M N {\displaystyle {\rm {E}}(X)=n{\frac {M}{N}}}

De variantie is:

v a r ( X ) = n M N ( 1 M N ) N n N 1 {\displaystyle {\rm {var}}(X)=n{\frac {M}{N}}\left(1-{\frac {M}{N}}\right){\frac {N-n}{N-1}}}

De variantie verschilt een factor

N n N 1 {\displaystyle {\frac {N-n}{N-1}}}

van de variantie in het geval van trekken met terugleggen of bij trekken uit een oneindige populatie met succeskans p = M / N {\displaystyle p=M/N} . De wortel uit deze factor

N n N 1 {\displaystyle {\sqrt {\frac {N-n}{N-1}}}}

heet eindige populatie-correctiefactor of correctiefactor voor eindige populatie.

Voorbeeld

Stel in een bak bevinden zich 5 blauwe en 4 rode ballen. Er worden willekeurig 3 ballen uit de bak gepakt. Hoe groot is de kans dat er (precies) twee blauwe ballen bij die 3 zijn?

In dit geval is N = 9 , M = 5 {\displaystyle N=9,\,M=5} en n = 3 {\displaystyle n=3} . De kans op m = 2 {\displaystyle m=2} blauwe ballen is dus:

P ( X = 2 | 9 , 5 , 3 ) = ( 5 2 ) ( 4 1 ) ( 9 3 ) = 10 4 84 = 0,476 {\displaystyle P(X=2|9,5,3)={\frac {{5 \choose 2}{4 \choose 1}}{9 \choose 3}}={\frac {10\cdot 4}{84}}=0{,}476}

Op eenzelfde manier kunnen de kansen op 0 blauwe ballen (4.8%); 1 blauwe bal (35.7%) en 3 blauwe ballen (11.9%) bepaald worden.

Externe link

  • Online Calculator Hypergeometrische verdeling
· · Sjabloon bewerken
Kansverdelingen
Discrete verdelingen:Bernoulli · binomiaal · geometrisch · hypergeometrisch · negatief-binomiaal · Poisson · uniform · zèta
Continue verdelingen:bèta · Cauchy · chi-kwadraat · Erlang · exponentieel · F-verdeling · gamma · Gumbel · hyperexponentieel · logistisch · lognormaal · normaal · Pareto · Rayleigh · student (t-) · uniform · Weibull
Meerdimensionale verdelingen:multinomiaal · multivariaat normaal