Supponiamo che in una popolazione di persone
ce ne siano
una certa caratteristica. Se viene scelta una persona ``a caso''
la probabilità che essa abbia quella caratteristica è uguale a
. Se
osservatori estraggono a caso ciascuno
una persona, in modo che l'estrazione di un osservatore non sia
influenzato da quella degli altri (e quindi la stessa persona può
essere scelta più volte), la variabile casuale
= ``numero di persone
che presentano quella caratteristica''
ha probabilità secondo una binomiale di
parametri
e
.
***non si capisce ***
Se invece vengono scelte contemporaneamente persone
la variabile casuale
ha diversa una distribuzione di probabilità.
Ad esempio, nel
caso limite in cui vengano prese tutte le
persone, la variabile
può assumere soltanto il valore
, e quindi non essa è più
una variabile aleatoria, bensì un numero certo.
I due casi sono schematizzati con i classici problemi di estrazioni da urne di palline bianche e nere, con reintroduzione (o reimbussolamento) e senza reintroduzione. Nel primo caso vengono repristinate le condizioni iniziale dopo ogni estrazioni e quindi si ha la condizioni di indipendenza della probabilità che sta a base della distribuzione binomiale. Nel secondo caso la probabilità di estrarre, ad esempio, una pallina bianca dipende dal numero di palline bianche e nere estratte precedentemente.
Riformuliamo quindi il problema con lo schema dell'urna:
![]() |
![]() |
Il numero dei casi possibili è dato dai numero di scelte di palline
fra le
. Quindi, assumendo l'equiprobabilità, si ottiene
Questa distribuzione è chiamata distribuzione ipergeometrica.
Diamo direttamente
valore atteso e varianza:
Se è molto più grande di
, l'estrazione non cambia di molto
le proporzioni di palline all'interno della scatola. Quindi ci si aspetta
che quando
la distribuzione ipergeometrica
tenda alla binomiale di parametri
e
.
Questo è in effetti il caso,
anche se non lo dimostriamo. È invece immediato vedere come
valore atteso e varianza tendano rispettivamente a
e a
(questa è la ragione del simbolo
nella (7.25)).
La tabella 7.3 mostra alcune distribuzioni
ipergeometriche
di
e
confrontate con la binomiale
di
e
.