Come accennato precedentemente, i valori dei riassunti statistici
per dati raggruppati possono differire numericamente da quelli calcolati
dai dati individuali, in quanto vengono usati i centri degli
intervalli () e non i valori originali ().
In genere l'effetto è trascurabile se le classi sono
ben popolate e le distribuzioni ``abbastanza regolari''. Ovviamente
gli effetti più importanti possono venire dai punti isolati sulle code della
distribuzione. Questi andrebbero trattati quindi con cautela e possibilmente
individualmente. Comunque, quando è richiesta un'alta
precisione nei
risultati è conveniente effettuare i conti a partire dai
dati originali. Come esempio riportiamo in tabella 5.3
media e deviazione standard dei tempi di attesa per 1 conteggio (tabella
1.2) utilizzando i dati sciolti o quelli dei due
raggruppamenti della tabella
5.1.
In questo caso
l'asimmetria della distribuzione produce un risultato apprezzabile.
Questo è dovuto al fatto che all'interno di ciascuna classe la media
dei dati è sempre inferiore al centro dell'intervallo in quanto
i numeri piccoli sono più frequenti di quelli grandi.
Tabella:
Dipendenza della media e varianza dal raggruppamento dei dati.