next up previous contents
Next: Problemi Up: Descrizione quantitativa dei dati Previous: o ? Commenti sul   Indice


Nota sulle cifre significative da utilizzare nei problemi di statistica descrittiva

Parlando del quaderno di laboratorio è stato introdotto il problema delle cifre significative e sono state suggerite delle raccomandazioni, da usare con una certa flessibilità. Il problema si ripropone per il calcolo delle grandezze statistiche.

È importante capire come in un ambito di pura statistica descrittiva il problema non ha molto senso in quanto i riassunti statistici servirebbero soltanto a descrivere quantitativamente la distribuzione statistica osservata. Ma, come è già stato fatto notare precedentemente e nel paragrafo 5.4, è difficile svincolare la statistica puramente descrittiva da quella inferenziale. In particolare, ogni volta che si presenta un risultato di una misura di una grandezza fisica si sta compiendo un'operazione di statistica inferenziale e allora ha senso parlare di incertezza del risultato e di cifre significative.

Purtroppo è impossibile astenersi da fare qualsiasi conto prima di aver chiaro come presentare il risultato, cosa che si saprà fare correttamente e a ragione soltanto quando saranno chiari diversi concetti di probabilità e di statistica inferenziale. Converrà quindi procedere per gradi tenendo conto che di quanto segue.

Per quanto concerne invece i conti è importante utilizzare tutte le cifre della calcolatrice (10, generalmente) e arrotondare solo alla fine. Altrimenti possono sorgere problemi numerici che falsano drammaticamente i risultati. Anche se questo può sembrare in contraddizione con quanto si va ripetendo sulle cifre significative, si rifletta sul fatto che la varianza (e anche covarianza, skewness e curtosi) sono calcolate in pratica da (somme e) differenze di numeri che a volte possono essere molto simili fra di loro. Quindi le ultime cifre (quelle più a destra) giocano un ruolo decisivo ai fini del risultato.

Come esempio convincente prendiamo la distribuzione statistica costituita dai seguenti valori (fra parentesi la loro frequenza): 100.21 (3); 100.22 (8); 100.23 (10); 100.24 (7); 100.25 (2). I valori della media aritmetica e delle media dei quadrati sono (con tutte le cifre della calcolatrice):

$\displaystyle \overline{x}$ $\displaystyle =$ $\displaystyle 100.2296552$  
$\displaystyle \overline{x^2}$ $\displaystyle =$ $\displaystyle 10045.98378 \,.$  

da cui ne segue che la varianza è calcolata come
$\displaystyle \sigma2$ $\displaystyle =$ $\displaystyle 10045.98388 - 10045.98378$  
  $\displaystyle =$ $\displaystyle 0.00010\,,$ (5.54)

ovvero il risultato è deciso dalla 9$ ^a$ e 10$ ^a$ cifra!

Il modo per ovviare a questo problema consiste nell'utilizzare le proprietà di trasformazione di media e varianza e considerare nei conti solo la parte eccedente 100. In alcuni casi, quando la dispersione è dell'ordine di una parte su 10000 o meno questo è l'unico modo di operare (a meno di non disporre di computer a ``doppia precisione'') in quanto anche le 10 cifre delle calcolatrici diventano insufficienti.


next up previous contents
Next: Problemi Up: Descrizione quantitativa dei dati Previous: o ? Commenti sul   Indice
Giulio D'Agostini 2001-04-02