Comments
Transcript
10.3 Distribuzione normale multidimensionale
10.3 Distribuzione normale multidimensionale - versione provvisoria 158 10.3. Distribuzione normale multidimensionale - versione provvisoria Un vettore aleatorio continuo (X, Y ) ha una distribuzione normale bidimensionale (o doppia) se ha la seguente densità di probabilità f (x, y) = 1√ 2πσ1 σ2 1−ρ2 ·e − 1 2(1−ρ2 ) x−µ1 σ1 2 −2ρ x−µ1 σ1 y−µ2 σ2 2 y−µ + σ 2 2 , per ogni (x, y) ∈ R2 , dove µ1 , µ2 , σ1 , σ2 , ρ, sono valori reali con σ1 > 0, σ2 > 0, |ρ| < 1. http://www.unipa.it/sanfilippo/pub/sigad/altro/Normale% 20Bivariata/Bivariate2.html Tale distribuzione gode delle seguenti proprietà: • f1 (x) = Nµ1 ,σ1 (x) , f2 (y) = Nµ2 ,σ2 (y) , pertanto le previsioni e gli scarti quadratici medi di X e Y sono rispettivamente µ1 , µ2 e σ1 , σ2 ; • f1 (x|y) = Nµ∗1 ,σ1∗ (x) , con p σ1 µ∗1 = µ1 + ρ (y − µ2 ) , σ1∗ = σ1 1 − ρ2 ; σ2 • f2 (y|x) = Nµ∗2 ,σ2∗ (y) , con p σ2 (x − µ1 ) , σ2∗ = σ2 1 − ρ2 ; σ1 R +∞ R +∞ • P(XY ) = −∞ −∞ xyf (x, y)dxdy = · · · = µ1 µ2 + ρσ1 σ2 , pertanto ρ rappresenta il coefficiente di correlazione di X e Y ; • se ρ = 0 risulta f (x, y) = f1 (x)f2 (y), pertanto se X e Y sono incorrelati, segue che sono indipendenti; • infine, se i parametri µ1 , µ2 , σ1 , σ2 sono fissati, al variare di ρ si ottengono infinite distribuzioni normali bidimensionali con le stesse marginali Nµ1 ,σ1 (x), Nµ2 ,σ2 (y); il che significa che date le distribuzioni marginali non è possibile determinare la distribuzione congiunta. µ∗2 = µ2 + ρ 10.3.1. Distribuzioni marginali. Si ha X ∼ Nµ1 ,σ1 e Y ∼ Nµ2 ,σ2. 1 Dimostriamo che X ∼ Nµ1 ,σ1 . Con la trasformazione lineare u = x−µ σ1 2 e v = y−µ , si ha dy = σ2 dv e limy→±∞ v = ±∞. Pertanto si ha, σ2 Z σ2 p f1 (x) = f (x, y)dy = 2πσ1 σ2 1 − ρ2 R Z e − 1 [u2 −2ρuv+v 2 ] 2(1−ρ2 ) dv. R Osservando che u2 − 2ρuv + v 2 = u2 − ρ2 u2 + (v − ρu)2 = u2 (1 − ρ2 ) + (v − ρu)2 G.Sanfilippo 10.3 Distribuzione normale multidimensionale - versione provvisoria 159 f1 (x) si può scrivere come segue Z 1 1 − [u2 (1−ρ2 )+(v−ρu)2 ] p f1 (x) = e 2(1−ρ2 ) dv. 2πσ1 1 − ρ2 R 2 1 2 Z − 12 √v−ρu2 1 e− 2 [u ] 1−ρ dv . =√ e √ p 2πσ1 R 2π 1 − ρ2 | {z } =1 =√ 1 e 2πσ1 − 12 x−µ1 σ1 2 . Pertanto X ∼ Nµ1 ,σ1 . Procedendo in maniera analoga, ma scambiando x con y, si ricava che Z y−µ2 2 1 − 12 σ 2 f2 (y) = f (x, y)dy = √ e 2πσ2 R ovvero Y ∼ Nµ2 ,σ2 . Quindi si ha che µ1 = P(X), µ2 = P(Y ), σ12 = var(X), σ22 = var(Y ). 10.3.2. Distribuzioni marginali condizionate. Calcoliamo la densità di probabilità di Y dato X = x. f (x, y) = f2 (y|x) = f1 (x) √ = 1 √ 2πσ2 =√ − 1√ 2πσ1 σ2 1−ρ2 − 1−ρ2 ·e 1 2(1−ρ2 ) ·e x−µ1 σ1 2 2 h i2 x−µ y−µ2 x−µ − σ 1 ρ2 + − σ 1 ρ σ 1 1 2 x−µ1 2 − 12 σ1 e h i2 y−µ2 x−µ1 − ρ 2 σ σ 1 − 1 p e 2(1−ρ 2πσ2 1 − ρ2 − 12 1 p e 2πσ2 1 − ρ2 2 ) 2 1 σ2 2 −ρ σ1 (x−µ1 ) σ2 (1−ρ2 ) #2 . Se poniamo µ∗2 = µ2 + ρ σσ12 (x − µ1 ) e σ2∗ = σ2 − 12 1 f2 (y|x) = √ e 2πσ2∗ y−µ∗ 2 ∗ σ2 1 = = p (1 − ρ2 ) si ha 2 , ∀y ∈ R. Pertanto, per ogni fissato x ∈ R, si ha f2 (y|x) = Nµ∗2 ,σ2∗ (y) , con p σ2 µ∗2 = µ2 + ρ (x − µ1 ) , σ2∗ = σ2 1 − ρ2 . σ1 G.Sanfilippo 1 = x−µ1 2 −1 σ1 √ 1 e 2 2πσ1 h i2 x−µ1 2 y−µ2 x−µ1 2 (1−ρ )+ − ρ σ σ σ " y−µ =√ 1 2(1−ρ2 ) 10.3 Distribuzione normale multidimensionale - versione provvisoria 160 In maniera analoga si dimostra che, per ogni fissato x ∈ R, si ha f1 (x|y) = Nµ∗1 ,σ1∗ (x) , con p σ1 µ∗1 = µ1 + ρ (y − µ2 ) , σ1∗ = σ1 1 − ρ2 . σ2 Concludendo si ha µ∗1 = P(Y |x) = µy (x), µ∗2 = P(X|y) = µx (y) cioè µ∗1 = µy (x) è proprio la funzione di regressione di X su Y e µ∗2 = µx (y) è proprio la funzione di regressione di Y su X. Poichè la curva di regressione di Y su X è una retta essa coincide con la retta di regressione. Pertanto ρ coincide con il coefficiente di correlazione lineare di X e Y (per la dimostrazione analitica vedi dall’Aglio pag 144). In particolare, osserviamo che se ρ = 0 si ha f2 (y|x) ≡ f2 (y), f1 (y|x) ≡ f1 (y). Quindi, dato un vettore aleatorio (X, Y ) con distribuzione normale bidimensionale si ha X, Y stocasticamente indipendenti ⇔ X, Y sono incorrelati 10.3.3. Matrice delle varianze e covarianze. Osserviamo che la matrice delle varianze-covarianze del vettore (X, Y ) è data da 2 ρσ1 σ2 σ11 σ12 σ1 Σ2 = = , σ21 σ22 ρσ1 σ2 σ22 e si ha detΣ2 = |Σ2 | = · · · = σ12 σ22 (1 − ρ2 ) , 2 1 −ρσ1 σ2 σ2 −1 Σ2 = . detΣ2 −ρσ1 σ2 σ12 Allora, com’è possibile verificare, la densità congiunta si può rappresentare nella forma matriciale seguente f (x, y) = 1 1 p e− 2 A(x−µ1 ,y−µ2 ) , 2π |Σ2 | dove A(x − µ1 , y − µ2 ) = (x − µ1 , y − µ2 ) · Σ−1 2 · x − µ1 y − µ2 . In generale, dato un vettore aleatorio continuo X = (X1 , . . . , Xn ), sia Σn la matrice delle varianze-covarianze di X. Si dice che X ha una distribuzione normale n−dimensionale se la densità congiunta è data da f (x1 , . . . , xn ) = G.Sanfilippo 1 1 √ e− 2 A(x1 −µ1 ,...,xn −µn ) , (2π) detΣn n 2 10.3 Distribuzione normale multidimensionale - versione provvisoria 161 dove A(x1 − µ1 , . . . , xn − µn ) = x1 − µ1 ··· . = (x1 − µ1 , . . . , xn − µn ) · Σ−1 n · xn − µn In forma matriciale e vettoriale si ha 1 |Σn |− 2 − 1 (x−µ)·Σ−1 t n ·(x−µ) 2 f (x1 , . . . , xn ) = , n e 2 (2π) dove x = (x1 , x2 . . . , xn ), µ = (µ1 , µ2 . . . , µn ). La distribuzione normale n−dimensionale gode di proprietà simili a quella bidimensionale; in particolare Xi ∼ Nµi ,σi , i = 1, . . . , n . Inoltre, se per ogni i 6= j si ha σij = 0, la matrice delle varianze-covarianze diventa diagonale e la densità congiunta coincide con il prodotto delle densità marginali, ovvero i numeri aleatori X1 , . . . , Xn sono stocasticamente indipendenti. Costruzione di una variabile aleatoria normale multidimensionale.* Dati n numeri aleatori X1 , X2 , . . . , Xn indipendenti e identicamente distribuiti con distribuzione normale standard (Xi ∼ N0,1 ) sia X = (X1 , X2 , . . . , Xn ) il vettore aleatorio congiunto. Ovviamente la densità di X è data da fX (x1 , . . . , xn ) = 1 − 12 x·xt . n e (2π) 2 In tal caso X ha una distribuzione normale multidimensionale con matrice delle varianze e covarianze la matrice Identità n × n . Consideriamo una trasformazione lineare di X. Sia n×1 n×n n×1 n×1 z}|{ z}|{ z}|{ z}|{ Y = A · X + µ con A una matrice n × n con |A| = 6 0 e µ un vettore (colonna?). Si ha che le componenti di Y sono Y1 = a11 X1 + a12 X2 + . . . + a1n Xn + µ1 ; .. . Yi = ai1 X1 + ai2 X2 + . . . + ain Xn + µi ; .. . Yn = an1 X1 + an2 X2 + . . . + ann Xn + µn . Inoltre, essendo A invertibile, si ha X = (Y − µ)A−1 . G.Sanfilippo 10.3 Distribuzione normale multidimensionale - versione provvisoria 162 Poichè Cov(Yi , Yj ) = Cov(a i1 X1 + ai2 X2 + . . . + ain Xn , aj1 X1 + aj2 X2 + . . . + ajn Xn ) = Pn P n = h=1 k=1 aih ajk cov(Xh , Xk ) = = ai1 aj1 + ai2 aj2 + . . . + ain ajn = = ai · aj t si ha che la matrice varianze-covarianze di Y è ΣY = A · At . Si dimostra che Y ha una distribuzione normale multivariata con densità 1 |ΣY |− 2 − 1 (y−µ)·Σ−1 t t Y ·(y−µ) ) . 2 f (y1 , . . . , yn ) = n e (2π) 2 Esercizio 10.7. Dati 2 numeri aleatori X1 , X2 indipendenti e identicamente distribuiti con distribuzione normale standard e definiti Y1 = X1 + X2 + 1; Y2 = X1 − X2 − 1 determinare la densità Y1 e la densità di Y2 . Poichè X1 , X2 sono stocasticamente indipendenti si ha 1 0 ΣX = 0 1 Inoltre sappiamo che (Y1 , Y2 ) ha una distribuzione normale bidimensionale. Determiniamone la densità. Poichè 1 1 A= 1 −1 e |A| = −2 segue che la matrice varianze-covarianze di Y è 2 0 t ΣY = A · A = 0 2 Quindi, Y1 , Y2 sono stocasticamente indipendenti con distribuzione, rispettivamente, Y1 ∼ N1,√2 e Y2 ∼ N−1,√2 . G.Sanfilippo