...

10.3 Distribuzione normale multidimensionale

by user

on
Category: Documents
35

views

Report

Comments

Transcript

10.3 Distribuzione normale multidimensionale
10.3 Distribuzione normale multidimensionale - versione provvisoria 158
10.3. Distribuzione normale multidimensionale - versione provvisoria
Un vettore aleatorio continuo (X, Y ) ha una distribuzione normale bidimensionale (o doppia) se ha la seguente densità di probabilità
f (x, y) =
1√
2πσ1 σ2 1−ρ2
·e
−
1
2(1−ρ2 )
x−µ1
σ1
2
−2ρ
x−µ1
σ1
y−µ2
σ2
2 y−µ
+ σ 2
2
,
per ogni (x, y) ∈ R2 , dove µ1 , µ2 , σ1 , σ2 , ρ, sono valori reali con σ1 >
0, σ2 > 0, |ρ| < 1.
http://www.unipa.it/sanfilippo/pub/sigad/altro/Normale%
20Bivariata/Bivariate2.html
Tale distribuzione gode delle seguenti proprietà:
• f1 (x) = Nµ1 ,σ1 (x) , f2 (y) = Nµ2 ,σ2 (y) , pertanto le previsioni e
gli scarti quadratici medi di X e Y sono rispettivamente µ1 , µ2 e
σ1 , σ2 ;
• f1 (x|y) = Nµ∗1 ,σ1∗ (x) , con
p
σ1
µ∗1 = µ1 + ρ (y − µ2 ) , σ1∗ = σ1 1 − ρ2 ;
σ2
• f2 (y|x) = Nµ∗2 ,σ2∗ (y) , con
p
σ2
(x − µ1 ) , σ2∗ = σ2 1 − ρ2 ;
σ1
R +∞ R +∞
• P(XY ) = −∞ −∞ xyf (x, y)dxdy = · · · = µ1 µ2 + ρσ1 σ2 ,
pertanto ρ rappresenta il coefficiente di correlazione di X e Y ;
• se ρ = 0 risulta f (x, y) = f1 (x)f2 (y), pertanto se X e Y sono
incorrelati, segue che sono indipendenti;
• infine, se i parametri µ1 , µ2 , σ1 , σ2 sono fissati, al variare di ρ si ottengono infinite distribuzioni normali bidimensionali con le stesse marginali Nµ1 ,σ1 (x), Nµ2 ,σ2 (y); il che significa che date le distribuzioni marginali non è possibile determinare la distribuzione
congiunta.
µ∗2 = µ2 + ρ
10.3.1. Distribuzioni marginali. Si ha X ∼ Nµ1 ,σ1 e Y ∼ Nµ2 ,σ2.
1
Dimostriamo che X ∼ Nµ1 ,σ1 . Con la trasformazione lineare u = x−µ
σ1
2
e v = y−µ
, si ha dy = σ2 dv e limy→±∞ v = ±∞. Pertanto si ha,
σ2
Z
σ2
p
f1 (x) =
f (x, y)dy =
2πσ1
σ2 1 − ρ2
R
Z
e
−
1
[u2 −2ρuv+v 2 ]
2(1−ρ2 )
dv.
R
Osservando che
u2 − 2ρuv + v 2 = u2 − ρ2 u2 + (v − ρu)2 = u2 (1 − ρ2 ) + (v − ρu)2
G.Sanfilippo
10.3 Distribuzione normale multidimensionale - versione provvisoria 159
f1 (x) si può scrivere come segue
Z
1
1
−
[u2 (1−ρ2 )+(v−ρu)2 ]
p
f1 (x) =
e 2(1−ρ2 )
dv.
2πσ1 1 − ρ2 R
2
1 2 Z
− 12 √v−ρu2
1
e− 2 [u ]
1−ρ
dv .
=√
e
√ p
2πσ1 R 2π 1 − ρ2
|
{z
}
=1
=√
1
e
2πσ1
− 12
x−µ1
σ1
2
.
Pertanto X ∼ Nµ1 ,σ1 . Procedendo in maniera analoga, ma scambiando x
con y, si ricava che
Z
y−µ2 2
1
− 12
σ
2
f2 (y) =
f (x, y)dy = √
e
2πσ2
R
ovvero Y ∼ Nµ2 ,σ2 . Quindi si ha che
µ1 = P(X), µ2 = P(Y ), σ12 = var(X), σ22 = var(Y ).
10.3.2. Distribuzioni marginali condizionate. Calcoliamo la densità
di probabilità di Y dato X = x.
f (x, y)
=
f2 (y|x) =
f1 (x)
√
=
1
√
2πσ2
=√
−
1√
2πσ1 σ2 1−ρ2
−
1−ρ2
·e
1
2(1−ρ2 )
·e
x−µ1
σ1
2 2
h
i2 x−µ
y−µ2
x−µ
− σ 1 ρ2 +
− σ 1 ρ
σ
1
1
2
x−µ1 2
− 12
σ1
e
h
i2 y−µ2
x−µ1
−
ρ
2
σ
σ
1
−
1
p
e 2(1−ρ
2πσ2 1 − ρ2
− 12

1
p
e
2πσ2 1 − ρ2
2
)
2
1
σ2
2 −ρ σ1 (x−µ1 )
σ2 (1−ρ2 )
#2 

.

Se poniamo µ∗2 = µ2 + ρ σσ12 (x − µ1 ) e σ2∗ = σ2
− 12
1
f2 (y|x) = √
e
2πσ2∗
y−µ∗
2
∗
σ2
1
=
=
p
(1 − ρ2 ) si ha
2
, ∀y ∈ R.
Pertanto, per ogni fissato x ∈ R, si ha f2 (y|x) = Nµ∗2 ,σ2∗ (y) , con
p
σ2
µ∗2 = µ2 + ρ (x − µ1 ) , σ2∗ = σ2 1 − ρ2 .
σ1
G.Sanfilippo
1
=
x−µ1 2
−1
σ1
√ 1 e 2
2πσ1
h
i2 x−µ1 2
y−µ2
x−µ1
2
(1−ρ
)+
−
ρ
σ
σ
σ
"
 y−µ
=√
1
2(1−ρ2 )
10.3 Distribuzione normale multidimensionale - versione provvisoria 160
In maniera analoga si dimostra che, per ogni fissato x ∈ R, si ha f1 (x|y) =
Nµ∗1 ,σ1∗ (x) , con
p
σ1
µ∗1 = µ1 + ρ (y − µ2 ) , σ1∗ = σ1 1 − ρ2 .
σ2
Concludendo si ha
µ∗1 = P(Y |x) = µy (x), µ∗2 = P(X|y) = µx (y)
cioè µ∗1 = µy (x) è proprio la funzione di regressione di X su Y e µ∗2 =
µx (y) è proprio la funzione di regressione di Y su X.
Poichè la curva di regressione di Y su X è una retta essa coincide con la
retta di regressione. Pertanto ρ coincide con il coefficiente di correlazione
lineare di X e Y (per la dimostrazione analitica vedi dall’Aglio pag 144).
In particolare, osserviamo che se ρ = 0 si ha
f2 (y|x) ≡ f2 (y), f1 (y|x) ≡ f1 (y).
Quindi, dato un vettore aleatorio (X, Y ) con distribuzione normale bidimensionale si ha
X, Y stocasticamente indipendenti ⇔ X, Y sono incorrelati
10.3.3. Matrice delle varianze e covarianze. Osserviamo che la matrice delle varianze-covarianze del vettore (X, Y ) è data da
2
ρσ1 σ2
σ11 σ12
σ1
Σ2 =
=
,
σ21 σ22
ρσ1 σ2 σ22
e si ha
detΣ2 = |Σ2 | = · · · = σ12 σ22 (1 − ρ2 ) ,
2
1
−ρσ1 σ2
σ2
−1
Σ2 =
.
detΣ2 −ρσ1 σ2 σ12
Allora, com’è possibile verificare, la densità congiunta si può rappresentare
nella forma matriciale seguente
f (x, y) =
1
1
p
e− 2 A(x−µ1 ,y−µ2 ) ,
2π |Σ2 |
dove
A(x − µ1 , y − µ2 ) = (x − µ1 , y − µ2 ) ·
Σ−1
2
·
x − µ1
y − µ2
.
In generale, dato un vettore aleatorio continuo X = (X1 , . . . , Xn ), sia Σn la
matrice delle varianze-covarianze di X. Si dice che X ha una distribuzione
normale n−dimensionale se la densità congiunta è data da
f (x1 , . . . , xn ) =
G.Sanfilippo
1
1
√
e− 2 A(x1 −µ1 ,...,xn −µn ) ,
(2π) detΣn
n
2
10.3 Distribuzione normale multidimensionale - versione provvisoria 161
dove
A(x1 − µ1 , . . . , xn − µn ) =


x1 − µ1

···  .
= (x1 − µ1 , . . . , xn − µn ) · Σ−1
n ·
xn − µn
In forma matriciale e vettoriale si ha
1
|Σn |− 2 − 1 (x−µ)·Σ−1
t
n ·(x−µ)
2
f (x1 , . . . , xn ) =
,
n e
2
(2π)
dove
x = (x1 , x2 . . . , xn ), µ = (µ1 , µ2 . . . , µn ).
La distribuzione normale n−dimensionale gode di proprietà simili a quella
bidimensionale; in particolare
Xi ∼ Nµi ,σi , i = 1, . . . , n .
Inoltre, se per ogni i 6= j si ha σij = 0, la matrice delle varianze-covarianze
diventa diagonale e la densità congiunta coincide con il prodotto delle densità marginali, ovvero i numeri aleatori X1 , . . . , Xn sono stocasticamente
indipendenti.
Costruzione di una variabile aleatoria normale multidimensionale.*
Dati n numeri aleatori X1 , X2 , . . . , Xn indipendenti e identicamente distribuiti con distribuzione normale standard (Xi ∼ N0,1 ) sia X = (X1 , X2 , . . . , Xn )
il vettore aleatorio congiunto. Ovviamente la densità di X è data da
fX (x1 , . . . , xn ) =
1
− 12 x·xt
.
n e
(2π) 2
In tal caso X ha una distribuzione normale multidimensionale con matrice
delle varianze e covarianze la matrice Identità n × n .
Consideriamo una trasformazione lineare di X. Sia
n×1
n×n
n×1
n×1
z}|{ z}|{ z}|{ z}|{
Y = A · X + µ
con A una matrice n × n con |A| =
6 0 e µ un vettore (colonna?). Si ha che
le componenti di Y sono
Y1 = a11 X1 + a12 X2 + . . . + a1n Xn + µ1 ;
..
.
Yi = ai1 X1 + ai2 X2 + . . . + ain Xn + µi ;
..
.
Yn = an1 X1 + an2 X2 + . . . + ann Xn + µn .
Inoltre, essendo A invertibile, si ha
X = (Y − µ)A−1 .
G.Sanfilippo
10.3 Distribuzione normale multidimensionale - versione provvisoria 162
Poichè
Cov(Yi , Yj ) = Cov(a
i1 X1 + ai2 X2 + . . . + ain Xn , aj1 X1 + aj2 X2 + . . . + ajn Xn ) =
Pn P
n
=
h=1
k=1 aih ajk cov(Xh , Xk ) =
= ai1 aj1 + ai2 aj2 + . . . + ain ajn =
= ai · aj t
si ha che la matrice varianze-covarianze di Y è
ΣY = A · At .
Si dimostra che Y ha una distribuzione normale multivariata con densità
1
|ΣY |− 2 − 1 (y−µ)·Σ−1
t t
Y ·(y−µ) ) .
2
f (y1 , . . . , yn ) =
n e
(2π) 2
Esercizio 10.7. Dati 2 numeri aleatori X1 , X2 indipendenti e identicamente
distribuiti con distribuzione normale standard e definiti
Y1 = X1 + X2 + 1; Y2 = X1 − X2 − 1
determinare la densità Y1 e la densità di Y2 .
Poichè X1 , X2 sono stocasticamente indipendenti si ha
1 0
ΣX =
0 1
Inoltre sappiamo che (Y1 , Y2 ) ha una distribuzione normale bidimensionale.
Determiniamone la densità. Poichè
1 1
A=
1 −1
e |A| = −2 segue che la matrice varianze-covarianze di Y è
2 0
t
ΣY = A · A =
0 2
Quindi, Y1 , Y2 sono stocasticamente indipendenti con distribuzione, rispettivamente, Y1 ∼ N1,√2 e Y2 ∼ N−1,√2 .
G.Sanfilippo
Fly UP