next up previous contents
Next: Misure di dispersione Up: Descrizione quantitativa dei dati Previous: Distribuzioni statistiche: notazioni   Indice


Misure di posizione

È abbastanza comune la consuetudine che, volendo riassumere in un solo numero dei dati statistici, se ne dia il valore medio: media dei voti di uno studente, età media di un gruppo di persone, reddito medio, e così via. In effetti, la media aritmetica è la più semplice e conosciuta misura di posizione di una distribuzione statistica. Ricordiamo che essa è definita da

$\displaystyle \overline{x} = \frac{1}{N}\sum_i x_i\,.$ (5.6)

Nel caso di dati suddivisi in classi la sommatoria $ \sum_{i=1}^N x_i$ si può riscrivere come somma dei valori numerici associati alle classi, ciascuno moltiplicato per il numero di volte che esso compare, ottenendo quindi
$\displaystyle \overline{x} =
\frac{1}{N}\sum_k n_k x_k$ $\displaystyle =$ $\displaystyle \frac{\sum_k n_k x_k}{\sum_k n_k}$ (5.7)
  $\displaystyle =$ $\displaystyle \sum_k f_k x_k \ \ \ \
\left(\mbox{ovvero}\ \sum_k w_k x_k\right) \,,$ (5.8)

ovvero è una media pesata con la frequenza, o con la frequenza relativa, di ciascuna delle classi.

Se i dati sperimentali sono stati raggruppati senza unire classi elementari adiacenti è facile dimostrare che i due valori della media ottenuti dalle (5.6) e (5.7-5.8) sono esattamente uguali (è una semplice applicazione della proprietà commutativa e associativa della somma). Nel caso contrario essi sono soltanto approssimativamente uguali. L'approssimazione è tanto migliore quanto più grande è il numero di classi e quanto più regolarmente sono distribuiti i valori dei dati originali all'interno delle classi.

Per come è definita la media, può capitare che il suo valore numerico non coincida con nessuno dei valori dei dati sperimentali. Quindi ``medio'' non va inteso come quello che si verifica di più, ma semplicemente ...come medio5.3.

Ci sono casi in cui si è effettivamente interessati ai valori che capitano più frequentemente. Si introduce allora il concetto di moda come il valore che si verifica più spesso, ovvero quello che ha peso statistico maggiore o, per dirlo in altri termini, ``quello che va più di moda''. Per come è definita si capisce che la moda può essere non unica. Si parla allora di distribuzione multimodale. Nei dati di conteggio per 3 e 30 secondi la moda vale rispettivamente 0 e 4.

Un altro modo per indicare la posizione di una distribuzione è di considerare il valore centrale - mediano - nel senso del valore rispetto al quale ci siano tanti valori più grandi quanti valori più piccoli. Tale valore è chiamato mediana. Per trovarlo si ordinano prima i dati e poi:

a)
se il numero di dati $ N$ è dispari si prende come mediana il valore centrale

mediana$\displaystyle = x_{\frac{N+1}{2}}\,;$ (5.9)

b)
se il numero di dati $ N$ è pari si prende come mediana la media aritmetica fra i due valori centrali:

mediana$\displaystyle = \frac{ x_{\frac{N}{2}} + x_{\frac{N}{2}+1} } {2}$ (5.10)

Nelle misure di conteggio per 3 e 30 secondi la mediana vale rispettivamente 0 e 5.

Le tre misure di posizioni introdotte non sono utilizzate una in alternativa dell'altra, anzi molto spesso la conoscenza simultanea delle tre fornisce delle utili informazioni sulla distribuzione. Per esempio si immagini tre comunità il cui reddito medio sia di 1000$ l'anno, ma i cui valori di moda e mediana siano:

  1. moda = mediana = 1000$;
  2. moda = 100$, mediana = 100$;
  3. moda = 100$, mediana = 800$.
Anche se da questi tre soli valori è impossibile risalire alle esatte distribuzioni di reddito, essi offrono tre quadri della popolazione completamente diversi. La prima mostra una più equa ripartizione del reddito, mentre la seconda mostra il maggiore squilibrio fra ricchi e poveri.

Anche se sono state introdotte per completezza, la moda e la mediana, utili per molte applicazione di statistica descrittiva, in questo testo faremo uso soltanto della media.


next up previous contents
Next: Misure di dispersione Up: Descrizione quantitativa dei dati Previous: Distribuzioni statistiche: notazioni   Indice
Giulio D'Agostini 2001-04-02