next up previous contents
Next: Tabelle, istogrammi e diagrammi Up: Descrizione grafica dei dati Previous: Descrizione grafica dei dati   Indice

Riduzione dei dati

Figura: Diagramma ad albero della popolazione tedesca. Si notino: la maggiore natalità di maschi dovuto alle misteriose leggi della natura; l'eccesso di donne anziane dovute alla loro più elevata vita media (l'effetto maggiore è dovuto ai caduti della $ 2^a$ guerra mondiale); la caduta delle nascite in corrispondenza alle guerre mondiali (A e C) e alla crisi economica del '32 (B); il boom economico con aumento delle nascite dell'inizio degli anni '60 e il controllo delle nascite dagli anni '70 in poi.
\begin{figure}\centering\epsfig{file=fig/dago44.eps,width=\linewidth,clip=}\end{figure}


Tabella: Esperienza del contatore: frequenze di conteggio delle misure da 3 a 100 secondi.
conteggi $ T = 3\,s$ $ T = 6\,s$ $ T = 12\,s$ $ T = 30\,s$ $ T = 100\,s$
0 56 33 11    
1 32 40 20 4  
2 9 20 32 5  
3 2 6 20 13  
4 1 1 10 20  
5     7 17  
6       14  
7       14  
8       5 1
9       6 1
10       1 2
11         2
12       1 4
13         6
14         9
15         2
16         8
17         11
18         13
19         11
20         8
21         3
22         8
23         2
24         2
25         2
26          
27         3
28          
29         2
30          



Tabella: Esperienza del contatore: frequenze di conteggio delle misure di 5 minuti.
$ T = 300\,s$
Nr di conteggi 31 32 33 34 35 36 37 38 39 40
Nr di eventi     1       1   2 3
Nr di conteggi 41 42 43 44 45 46 47 48 49 50
Nr di eventi   1 1 3 2 2 1 5 6 2
Nr di conteggi 51 52 53 54 55 56 57 58 59 60
Nr di eventi 8 8 7 5 4 3 5 6 2 2
Nr di conteggi 61 62 63 64 65 66 67 68 69 70
Nr di eventi 8 1 4 2 2   1      
Nr di conteggi 71 72 73 74 75 76 77 78 79 80
Nr di eventi 1             1    


Riprendiamo l'esperimento simulato del contatore del paragrafo 1.1. La tabella  1.1 contiene quasi tutte le informazioni che riguardano l'esperimento. Il ``quasi tutte'' si riferisce al fatto che mancano tanti dati importanti: luogo, data e ora delle misure; nome dello sperimentatore; condizioni ambientali (temperatura, etc.); specifiche e condizioni di lavoro dello strumento (tensione di alimentazione, valore di soglia, etc.); e così via. Eppure, se si vuol capire quello che ``sta succedendo'', le informazioni offerte dalla tabella sono, in un certo senso, ``troppe''. È chiaro che al fine del risultato della misura siamo interessati a rispondere alle domande formulate sopra e quindi a condensare le informazioni in pochi numeri. È quindi necessaria una riduzione dei dati (espressione che è più o meno equivalente ad analisi dei dati) generalmente effettuata attraverso passi successivi.

Per capire meglio il problema, consideriamo il caso dello studio della popolazione di un certo paese. Interessiamoci ad esempio alle età degli abitanti di una nazione. Si capisce subito che quello che si desidera non è la lista di nome, cognome, data di nascita e altre informazioni per ciascun cittadino. Ci vorrebbe una vita a scorrere tutti i numeri e alla fine non si sarà imparato niente. È preferibile raggruppare le informazioni in classi omogenee, per esempio maschi e femmine di ogni età. Quindi si possono comporre due tabelle, una per ciascun sesso, in cui viene riportato il numero di persone per ogni classe di età. Un ulteriore passo per descrivere le informazioni di interesse nella forma più sintetica consiste nel darne una rappresentazione grafica. Nel caso specifico la rappresentazione più conveniente consiste nel familiare diagramma ad albero della popolazione. Quello relativo alla Germania del 1992 è mostrato in figura 4.1. Come i cerchi di un tronco d'albero, tale figura mostra a colpo d'occhio la storia del paese.

Ovviamente riducendo i dati si perdono informazioni ma se ne acquistano altre di natura globale:

I dati possono essere ulteriormente ridotti attraverso successivi stadi di analisi, fino ad arrivare ad una sola informazione, ad esempio il numero di abitanti o l'età media. Ovviamente a questo punto il numero di informazioni perse è enorme. Ad esempio, si noti come la consueta riduzione di informazioni a due - numero totale di abitanti per sesso - induca molti a credere che nascano più femmine che maschi, mentre è noto da secoli il contrario.


next up previous contents
Next: Tabelle, istogrammi e diagrammi Up: Descrizione grafica dei dati Previous: Descrizione grafica dei dati   Indice
Giulio D'Agostini 2001-04-02