next up previous contents
Next: pzd100Come tener conto anche Up: Fit Previous: Fit   Indice

Inferenza sui parametri di una legge

Supponiamo di aver misurato delle coppie di grandezze fisiche, di averne osservato l'andamento su un grafico, di avere ipotizzato il tipo di funzione matematica che lega ascisse e ordinate e di voler determinare i parametri della funzione. Consideriamo il semplice caso di un andamento lineare:
$\displaystyle \mu_Y$ $\displaystyle =$ $\displaystyle m\cdot \mu_X+c\,,$ (12.1)

ove con $ \mu_X$ e $ \mu_Y$ sono i valori veri delle grandezze. $ m$ e $ c$ sono parametri di valore ignoto, ovvero numeri aleatori reali (avremmo dovuto usare le lettere maiuscole, ma, come già fatto precedentemente in altri casi preferiamo usare lo stesso simbolo con il quale tali grandezze vengono usualmente indicate). Indichiamo con $ X_i$ e $ Y_i$ la coppia di valori osservabili, dati i parametri $ m$, $ c$ e il valore vero $ \mu_{X_i}$ (il valore vero $ \mu_{X_i}$ è univocamente determinato dalla (12.1)), la cui verosimiglianza corrispondente è data, assumendo un modello normale per gli errori, da
$\displaystyle f(x_i,y_i\,\vert\,\mu_{X_i},m,c)$ $\displaystyle =$ $\displaystyle f(x_i\,\vert\,\mu_{X_i},m,c)\cdot f(y_i\,\vert\,\mu_{X_i},m,c)$  
  $\displaystyle =$ $\displaystyle \frac{1}{\sqrt{2\,\pi}\sigma_{X_i}}\exp{\left[-\frac{(x_i-\mu_{X_i})^2}
{2\,\sigma_{X_i}^2}\right]}$  
    $\displaystyle \times
\frac{1}{\sqrt{2\,\pi}\sigma_{Y_i}}\exp{\left[-\frac{(y_i-m\,\mu_{X_i}-c)^2}
{2\,\sigma_{Y_i}^2}\right]}\,.$ (12.2)

La verosimiglianza acquista una forma più semplice quando $ \sigma_{X_i}\rightarrow 0$. Infatti ciò significa che $ \mu_{X_i}$ è, dal punto di vista pratico, univocamente determinata dal valore osservato: $ \mu_{X_i}=x_i$. La verosimiglianza si riduce12.1a
$\displaystyle f(x_i,y_i\,\vert\,m,c)$ $\displaystyle =$ $\displaystyle \frac{1}{\sqrt{2\,\pi}\sigma_{Y_i}}\exp{\left[-\frac{(y_i-m\,x_i-c)^2}
{2\,\sigma_{Y_i}^2}\right]}\,.$ (12.3)

Se abbiamo tante coppie di valori misurati e le condizioni sperimentali sono tali che le possibili fluttuazioni delle ordinate intorno ai loro valori veri sono indipendenti, abbiamo
$\displaystyle f(\underline{x},\underline{y}\,\vert\,m,c)$ $\displaystyle =$ $\displaystyle \Pi_i f(x_i,y_i\,\vert\,m,c)\,,$ (12.4)

ove con $ \underline{x}$ e $ \underline{y}$ sono stati indicati i vettori (n-tuple) contenenti i punti osservati.

Applicando il teorema di Bayes otteniamo finalmente

$\displaystyle f(m,c\,\vert\,\underline{x},\underline{y})$ $\displaystyle \propto$ $\displaystyle \Pi_i f(x_i,y_i\,\vert\,m,c)\cdot f_\circ(m,c)\,.$ (12.5)

Assumendo una distribuzione iniziale $ f_\circ(m,c)$ uniforme e una distribuzione finale circa normale (bivariata), il problema si riconduce a calcolare il massimo della distribuzione finale, che coincide con il massimo della verosimiglianza. Tale punto di massimo fornisce E$ (m)$ ed E$ (c)$. In pratica si preferisce massimizzare il logaritmo della verosimiglianza equivalente a minimizzare la quantità

$\displaystyle \sum_i\frac{(y_i-m\,x_i-c)^2}{\sigma_{Y_i}^2}\,,$

come si può verificare facilmente. Il resto si riduce ad un esercizio di analisi.

Avendo ottenuto E$ (m) = m(\underline{x},\underline{y})$ e E$ (c) = c(\underline{x},\underline{y})$, ove $ m()$ e $ c()$ sono le funzioni che legano le migliori stime dei parametri ai dati sperimentali, si tratta di valutare $ \sigma(m)$, $ \sigma(c)$ e $ \rho(m,c)$. Essi possono essere calcolati dalla loro definizione applicata ad $ f(m,c)$ ottenuta dalla (12.5) dopo opportuna normalizzazione. L'assunzione di approssimazione a normale bivariata di $ f(m,c)$ semplifica i calcoli, in quanto i parametri possono essere ricavati direttamente dalla forma della distribuzione senza eseguire gli integrali necessari per valutare $ \sigma(m)$ $ \sigma(c)$ e $ \rho(m,c)$ (vedi, ad esempio, proprietà della distribuzione normale multivariata nella parte III delle dispense di probabilità).

Il modo più semplice per calcolare questi conti è quello di usare un ragionamento di inversione di probabilità del tipo ``cane-cacciatore'', che funziona nei limiti che abbiamo più volte indicato (vedi paragrafo 9.6):


next up previous contents
Next: pzd100Come tener conto anche Up: Fit Previous: Fit   Indice
Giulio D'Agostini 2001-04-02