Distribution of several random variables

Next: Central limit theorem Up: Random variables Previous: Continuous variables: probability and Contents

Distribution of several random variables

We only consider the case of two continuous variables ( $ X$

and

). The extension to more variables is straightforward. The infinitesimal element of probability is $\rm {d}F(x,y) = f(x,y)\,\rm {d}x\,\rm {d}y$ , and the probability density function

$\displaystyle f(x,y) = \frac{\partial^2F(x,y)}{\partial x\partial y}\,.$

(4.43)

The probability of finding the variable inside a certain area

$\displaystyle \iint\limits_A f(x,y)\,\rm {d}x\,\rm {d}y\,.$

(4.44)

Marginal distributions:

$\displaystyle f_X(x)$	$\displaystyle =$	$\displaystyle \int_{-\infty}^{+\infty}f(x,y)\,\rm {d}y,$	(4.45)
$\displaystyle f_Y(y)$	$\displaystyle =$	$\displaystyle \int_{-\infty}^{+\infty}f(x,y)\,\rm {d}x \,.$	(4.46)

The subscripts $ X$

and

indicate that

and

are only functions of $ X$

and

, respectively (to avoid fooling around with different symbols to indicate the generic function), but in most cases we will drop the subscripts if the context helps in resolving ambiguities.

Conditional distributions:

$\displaystyle f_X(x\,\vert\,y)$	$\displaystyle =$	$\displaystyle \frac{f(x,y)}{f_Y(y)} = \frac{f(x,y)}{\int f(x,y)\,\rm {d}x},$	(4.47)
$\displaystyle f_Y(y\,\vert\,x)$	$\displaystyle =$	$\displaystyle \frac{f(x,y)}{f_X(x)},$	(4.48)
$\displaystyle f(x,y)$	$\displaystyle =$	$\displaystyle f_X(x\,\vert\,y)\,f_Y(y)$	(4.49)
	$\displaystyle =$	$\displaystyle f_Y(y\,\vert\,x)\,f_X(x)\,.$	(4.50)

Independent random variables

$\displaystyle f(x,y) = f_X(x) f_Y(y)$

(4.51)

(it implies $f_X(x\,\vert\,y)=f_X(x)$ and $f_Y(y\,\vert\,x)=f_Y(y)$ .)

Bayes' theorem for continuous random variables

$\displaystyle \boxed{ f(h\,\vert\,e) = \frac{f(e\,\vert\,h)\,f_h(h)} {\int f(e\,\vert\,h)\,f_h(h)\,\rm{d}h}\, . }$

(4.52)

(Note added: see proof in section

Expectation value:

$\displaystyle \mu_X=$ E $\displaystyle [X]$	$\displaystyle =$	$\displaystyle \int\!\!\int_{-\infty}^{+\infty} x\, f(x,y)\,\rm {d}x\,\rm {d}y$	(4.53)
	$\displaystyle =$	$\displaystyle \int_{-\infty}^{+\infty}\!x\, f_X(x)\, \rm {d}x\,,$	(4.54)

and analogously for

. In general

E $\displaystyle [g(X,Y)] = \int\!\!\int_{-\infty}^{+\infty} \!g(x,y)\, f(x,y)\, \rm {d}x\,\rm {d}y\,.$

(4.55)

Variance:

$\displaystyle \sigma_X^2=$ E $\displaystyle [X^2]-$ E $\displaystyle ^2[X]\,,$

(4.56)

and analogously for

Covariance:

Cov $\displaystyle (X,Y)$	$\displaystyle =$	E $\displaystyle \left[\,\left(X-\mbox{E}[X]\right)\cdot \left(Y-\mbox{E}[Y]\right)\,\right]$	(4.57)
	$\displaystyle =$	E $\displaystyle [X Y]-$ E $\displaystyle [X]\cdot$ E $\displaystyle [Y]\,.$	(4.58)

and

are independent, then E

E $[X]\cdot$ E

and hence Cov

(the opposite is true only if $ X$

, $Y\sim {\cal N}(\cdot)$ ).

Correlation coefficient:

$\displaystyle \rho(X,Y)$	$\displaystyle =$	$\displaystyle \frac{\mbox{Cov}(X,Y)}{\sqrt{\mbox{Var}(X)\, \mbox{Var}(Y)}}$	(4.59)
	$\displaystyle =$	$\displaystyle \frac{\mbox{Cov}(X,Y)}{\sigma_X\, \sigma_Y}\, .$	(4.60)

$\displaystyle ( -1 \le \rho \le 1)$

Linear combinations of random variables:

If $Y=\sum_i c_iX_i$ , with

real, then:

$\displaystyle \mu_Y=$ E $\displaystyle [Y]$	$\displaystyle =$	$\displaystyle \sum_ic_i\,$ E $\displaystyle [X_i] = \sum_ic_i\,\mu_i,$	(4.61)
$\displaystyle \sigma_Y^2=$ Var $\displaystyle (Y)$	$\displaystyle =$	$\displaystyle \sum_i c_i^2\,$ Var $\displaystyle (X_i) + 2\sum_{i< j}c_i\,c_j\,$ Cov $\displaystyle (X_i,X_j)$	(4.62)
	$\displaystyle =$	$\displaystyle \sum_i c_i^2\,$ Var $\displaystyle (X_i) + \sum_{i\ne j}c_i\,c_j\,$ Cov $\displaystyle (X_i,X_j)$	(4.63)
	$\displaystyle =$	$\displaystyle \sum_i c_i^2\,\sigma_i^2 +\sum_{i\ne j}\rho_{ij}\,c_i\,c_j\,\sigma_i\,\sigma_j$	(4.64)
	$\displaystyle =$	$\displaystyle \sum_{ij}\rho_{ij}\,c_i\,c_j\,\sigma_i\,\sigma_j$	(4.65)
	$\displaystyle =$	$\displaystyle \sum_{ij}c_i\,c_j\,\sigma_{ij}\,.$	(4.66)

$\sigma^2_Y$ has been written in different ways, with increasing levels of compactness, that can be found in the literature. In particular, (

) and (

) use the notations $\sigma_{ij}\equiv$ Cov $(X_i,X_j) = \rho_{ij}\,\sigma_i\,\sigma_j$ and $\sigma_{ii}=\sigma^2_i$ , and the fact that, by definition, $\rho_{ii}=1$ .

Bivariate normal distribution:

Joint probability density function of $ X$

and

with correlation coefficient $\rho$ (see Fig.

**Figure:** Example of bivariate normal distribution.
$\begin{figure}\centering\epsfig{file=bivar.eps,width=12.5cm,clip=}\end{figure}$

$\displaystyle f(x,y)$	$\displaystyle =$	$\displaystyle \frac{1}{2\,\pi\,\sigma_x\,\sigma_y\,\sqrt{1-\rho^2}}\cdot$	(4.67)
		$\displaystyle \exp{\left\{ -\frac{1}{2\,(1-\rho^2)} \left[ \frac{(x-\mu_x)^2}{\... ...u_y)}{\sigma_x\,\sigma_y} + \frac{(y-\mu_y)^2}{\sigma_y^2} \right] \right\}}\,.$

Marginal distributions:

$\displaystyle X$	$\displaystyle \sim$	$\displaystyle {\cal N}(\mu_x,\sigma_x),$	(4.68)
$\displaystyle Y$	$\displaystyle \sim$	$\displaystyle {\cal N}(\mu_y,\sigma_y) \,.$	(4.69)

Conditional distribution:

$\displaystyle f(y\,\vert\,x_\circ) = \frac{1}{\sqrt{2\,\pi}\,\sigma_y\,\sqrt{1-... ...(x_\circ-\mu_x\right)\right] \right)^2} {2\,\sigma_y^2\,(1-\rho^2)} \right]}\,,$

(4.70)

i.e.

$\displaystyle Y_{\vert x_\circ}\sim {\cal N}\left( \mu_y+\rho\,\frac{\sigma_y}{\sigma_x} \,\left(x_\circ-\mu_x\right),\, \sigma_y\sqrt{1-\rho^2}\right).$

(4.71)

The condition $X=x_\circ$ squeezes the standard deviation and shifts the mean of

Next: Central limit theorem Up: Random variables Previous: Continuous variables: probability and Contents

Giulio D'Agostini 2003-05-15