Supponiamo che in una popolazione di persone ce ne siano una certa caratteristica. Se viene scelta una persona ``a caso'' la probabilità che essa abbia quella caratteristica è uguale a . Se osservatori estraggono a caso ciascuno una persona, in modo che l'estrazione di un osservatore non sia influenzato da quella degli altri (e quindi la stessa persona può essere scelta più volte), la variabile casuale = ``numero di persone che presentano quella caratteristica'' ha probabilità secondo una binomiale di parametri e .
***non si capisce *** Se invece vengono scelte contemporaneamente persone la variabile casuale ha diversa una distribuzione di probabilità. Ad esempio, nel caso limite in cui vengano prese tutte le persone, la variabile può assumere soltanto il valore , e quindi non essa è più una variabile aleatoria, bensì un numero certo.
I due casi sono schematizzati con i classici problemi di estrazioni da urne di palline bianche e nere, con reintroduzione (o reimbussolamento) e senza reintroduzione. Nel primo caso vengono repristinate le condizioni iniziale dopo ogni estrazioni e quindi si ha la condizioni di indipendenza della probabilità che sta a base della distribuzione binomiale. Nel secondo caso la probabilità di estrarre, ad esempio, una pallina bianca dipende dal numero di palline bianche e nere estratte precedentemente.
Riformuliamo quindi il problema con lo schema dell'urna:
Il numero dei casi possibili è dato dai numero di scelte di palline
fra le . Quindi, assumendo l'equiprobabilità, si ottiene
Questa distribuzione è chiamata distribuzione ipergeometrica.
Diamo direttamente
valore atteso e varianza:
Se è molto più grande di , l'estrazione non cambia di molto le proporzioni di palline all'interno della scatola. Quindi ci si aspetta che quando la distribuzione ipergeometrica tenda alla binomiale di parametri e . Questo è in effetti il caso, anche se non lo dimostriamo. È invece immediato vedere come valore atteso e varianza tendano rispettivamente a e a (questa è la ragione del simbolo nella (7.25)). La tabella 7.3 mostra alcune distribuzioni ipergeometriche di e confrontate con la binomiale di e .