next up previous contents
Next: Nota sulle cifre significative Up: Descrizione quantitativa dei dati Previous: pzd100 Misure di correlazione   Indice


$ {\bf\circlearrowright\,}$ $ \sigma _N$ o $ \sigma _{N-1}$? Commenti sul fattore correttivo $ N/(N-1)$

Qualcuno saprà già, o si sarà accorto utilizzando la calcolatrice, che si incontra un'altra definizione di varianza (e quindi di deviazione standard), ottenuta dividendo la somma dei quadrati degli scarti per $ N-1$ anziché per $ N$. Ovvero le formule della varianza sono state riscalate per un fattore $ N/(N-1)$ (e quelle della deviazione standard per $ \sqrt{N/(N-1)}$). Lo stesso fattore correttivo viene applicato ovunque ci sono formule con medie di potenze di scarti (momento 3$ ^\circ$ e 4$ ^\circ$ nel calcolo della skewness e della curtosi) o loro combinazioni (covarianza).

Sulle calcolatrici le deviazioni standard ottenute con $ N-1$ sono chiamate $ \sigma _{N-1}$.

La ragione di questa correzione è legata ad una interferenza fra statistica descrittiva e statistica inferenziale (una scuola di pensiero di questa, ad essere più precisi). È chiaro che se vogliamo mantenere una varianza che conservi l'analogia con il momento di inerzia si può solo prendere $ \sigma _N$. Se invece da un piccolo campione si vuole inferire la deviazione standard di una grande popolazione, allora si tratta di un problema ben diverso, che andrà affrontato con la dovuta cautela.

Quindi la deviazione $ \sigma_{N}$, indicata più semplicemente con $ \sigma $, è adeguata all'uso che si fa per ora di questa quantità.


next up previous contents
Next: Nota sulle cifre significative Up: Descrizione quantitativa dei dati Previous: pzd100 Misure di correlazione   Indice
Giulio D'Agostini 2001-04-02