next up previous contents
Next: Prior uniforme in Up: pzd100Inferenza simultanea su e Previous: pzd100Inferenza simultanea su e   Indice

Prior uniforme in $ \sigma $

Come per $ \mu $, il primo modello matematicamente semplice di vaghezza che salta in mente è una distribuzione uniforme per valori positivi di $ \sigma $. Ovviamente, questo modello va preso con cautela, come anche nel caso di $ \mu $, in quanto certamente non crediamo allo stesso modo a tutti i valori di $ \sigma $, specialmente quelli molto prossimi a zero o che tendono a infinito (rispetto alla scala che abbiamo in mente di valori plausibili). Dal modello otteniamo (assumendo implicito il condizionante di contorno $ I$):
$\displaystyle f(\mu,\sigma\,\vert\,\mathbf{x})$ $\displaystyle \propto$ $\displaystyle f(\mathbf{x}\,\vert,\mu,\sigma)$ (11.62)
  $\displaystyle \propto$ $\displaystyle \prod_i \frac{1}{\sigma}
\exp{\left[-\frac{(x_i-\mu)^2}{2\sigma^2}\right]}$ (11.63)
  $\displaystyle \propto$ $\displaystyle \sigma^{-n}\exp{\left[-\frac{1}{2\sigma^2}
\sum_i(x_i-\mu)^2\right]}$ (11.64)
  $\displaystyle \propto$ $\displaystyle \sigma^{-n}\exp{\left[-\frac{1}{2\sigma^2}
\left( n\,(\overline{x}-\mu)^2+
n\,s^2
\right)\right]}\,,$ (11.65)

ove nell'ultimo passaggio abbiamo utilizzato l'uguaglianza

$\displaystyle \sum_{i=1}^n(x_i-\mu)^2 = n(\overline{x}-\mu)^2+
\sum_{i=1}^n(x_i-\overline{x})^2=
n(\overline{x}-\mu)^2+n\,s^2\,,$

con $ s$ pari alla deviazione standard calcolata sui dati sperimentali:

$\displaystyle s = \sqrt{\frac{1}{n} \sum_{i=1}^n(x_i-\overline{x})^2}$ (11.66)

Marginalizzando su $ \sigma $ abbiamo: 11.7
$\displaystyle f(\mu\,\vert\,\mathbf{x})$ $\displaystyle =$ $\displaystyle \int_0^\infty\! f(\mu,\sigma)\,$d$\displaystyle \sigma$  
  $\displaystyle \propto$ $\displaystyle \left( n\,(\overline{x}-\mu)^2+n\,s^2\right)^{-(n-1)/2}$  
  $\displaystyle \propto$ $\displaystyle \left(1+\frac{(\mu-\overline{x})^2}{s^2}\right)^{-(n-1)/2}$ (11.67)
  $\displaystyle \propto$ $\displaystyle \left(1+\frac{(\mu-\overline{x})^2}{(n-2)\,s^2/(n-2)}
\right)^{-((n-2)+1)/2}$  

Avendo moltiplicato e diviso $ s^2$ per $ (n-2)$, si riconosce una forma del tipo
  $\displaystyle \propto$ $\displaystyle \left(1+\frac{t^2}{\nu}\right)^{-(\nu+1)/2}$ (11.68)

con
$\displaystyle \nu$ $\displaystyle =$ $\displaystyle n-2$ (11.69)
$\displaystyle t$ $\displaystyle =$ $\displaystyle \frac{\mu-\overline{x}}{s/\sqrt{n-2}}\,,$ (11.70)
ovvero$\displaystyle $      
$\displaystyle \mu$ $\displaystyle =$ $\displaystyle \overline{x}+\frac{s}{\sqrt{n-2}}\,t\,,$ (11.71)

ove $ t$ è la variabile $ t$ di Student con $ \nu=n-2$. Applicando le note proprietà della distribuzione di Student (vedi paragrafo 8.15.4 ), otteniamo:
$\displaystyle \frac{\mu-\overline{x}}{s/\sqrt{n-2}}$ $\displaystyle \sim$ Student$\displaystyle (\nu=n-2)$ (11.72)
E$\displaystyle (\mu)$ $\displaystyle \stackrel{(n>3)}{=}$ $\displaystyle \overline{x}$ (11.73)
$\displaystyle \sigma(\mu)$ $\displaystyle \stackrel{(n>4)}{=}$ $\displaystyle \frac{s}{\sqrt{n-4}} \,.$ (11.74)

Come si vede, l'incertezza su $ \sigma $ produce una ulteriore incertezza su $ \mu $, tale da rendere più plausibili valori molto lontani dalla media (caratteristica delle $ t$ di Student rispetto alla normale standardizzata). Questo effetto è, come è ragionevole che sia, più importante per $ n$ piccolo e si attenua immediatamente quando $ n$ supera il valore di qualche decina. Per $ n$ al di sotto di $ n=5$ le code della distribuzione sono talmente pronunciate che la varianza è infinita e per $ n<4$ è addirittura il calcolo della media a non convergere. Questo va bene dal punto di vista matematico, ma non vuol dire che ``non si può dire niente su $ \mu $''. Queste divergenze non sono altro che il risultato della ipersemplicità del modello. Nessuna persona ragionevole crederà mai che avendo letto su un voltmetro 6.25 V, 6.32 V e 6.29 V crederà mai che il valore vero della tensione sia compatibile con valori ``infiniti'', sia positivi che negativi (è quello che ci dice la $ t$ di Student, e anche la più tranquilla gaussiana, seppur con gli infiniti ``un po' meno probabili'', per dirla alla buona).

Quando $ n$ diventa molto grande otteniamo gli stessi risultati delle argomentazioni intuitive discusse precedentemente (basate giustappunto su tale limite):

E$\displaystyle (\mu)$ $\displaystyle \xrightarrow{n\rightarrow \infty}$ $\displaystyle \overline{x}$ (11.75)
$\displaystyle \sigma(\mu)$ $\displaystyle \xrightarrow{n\rightarrow \infty}$ $\displaystyle \frac{s}{\sqrt{n}}$ (11.76)
$\displaystyle \mu$ $\displaystyle \xrightarrow{n\rightarrow \infty}$ $\displaystyle \sim
{\cal N}(\overline{x},s/\sqrt{n}).$ (11.77)

Seguitiamo ora con questa parte formale, ritornando successivamente a raccomandazioni su come comportarsi in pratica.


next up previous contents
Next: Prior uniforme in Up: pzd100Inferenza simultanea su e Previous: pzd100Inferenza simultanea su e   Indice
Giulio D'Agostini 2001-04-02