Comments
Description
Transcript
Esercitazione di riepilogo
Esercitazione - CLAMEP Statistica per l’analisi dei dati Esercizio 1 Si considerino due variabili Y : atteggiamo nei confronti di un decreto del governo (favorevole, indifferente, contrario) e X: livello di istruzione (laurea, licenza superiore, licenza media) X X Y laurea lic.superiore lic.media favorevole 12 15 3 indifferente 2 10 10 contrario 32 19 2 1a) costruire la tabella Y |X; Si costruiscono i profili riga X X Y laurea lic.superiore lic.media favorevole 0.26 0.34 0.20 indifferente 0.04 0.23 0.67 contrario 0.70 0.43 0.13 1b) scrivere la distribuzione marginale della variabile X e quella della variabile Y ; Y laurea lic.superiore lic.media X X TOT favorevole indifferente contrario 30 22 53 TOT 46 44 15 105 1c) costruire la tabella di perfetta indipendenza. X X Y laurea lic.superiore lic.media favorevole 13.14 12.57 4.29 indifferente 9.64 9.22 3.14 contrario 23.22 22.21 7.57 Esercizio 2 2a) Rappresentare la tabella precedente ignorando coloro che hanno la licenza media e che hanno un atteggiamento indifferente verso il decreto del governo. Verificare se in questa tabella 2 × 2 le variabili X ed Y sono indipendenti. X favorevole 12 15 Y laurea lic.superiore 1 contrario 32 19 Utilizziamo l’odds ratio per cui 12 ∗ 19 θ = log = −0.745; 32 ∗ 15 da cui l’intervallo di confidenza al 95% XY r SE = 1 1 1 1 + + + = 0.484 12 32 15 19 (−0.745 − 1.96 ∗ 0.484; −0.745 + 1.96 ∗ 0.484) = (−1.69; 0.20) per cui si accetta l’ipotesi X⊥⊥Y Consideriamo ora la tabella precedente condizionata all variabile Z relativa al genere (maschi, femmine) degli individui. X Y laurea superiore Z: maschi favorevole contrario 4 15 5 10 Z: femmine favorevole contrario . 8 17 10 9 2b) verificare se il genere e l’atteggiamento verso il decreto del governo sono marginalmente indipendenti; Y favorevole contrario maschi 9 25 Z femmine 18 26 da cui r 9 ∗ 26 θ = log = −0.65; 18 ∗ 25 da cui l’intervallo di confidenza al 95% ZY SE = 1 1 1 1 + + + = 0.50 9 25 18 26 (−0.65 − 1.96 ∗ 0.50; −0.65 + 1.96 ∗ 0.50) = (−1.63; 0.33) per cui si accetta l’ipotesi Z⊥⊥Y 2c) verificare se condizionatamente al titolo di studio, il genere e l’atteggiamento verso il decreto del governo sono indipendenti. Z Y maschio femmina X: laurea favorevole contrario 4 15 8 17 X: superiore favorevole contrario . 5 10 10 9 da cui gli odds ratio condizionati sono 4 ∗ 17 = = −0.57, SE = 8 ∗ 15 da cui l’intervallo di confidenza al 95% log θ1ZY r 1 1 1 1 + + + = 0.71 4 15 8 17 (−0.57 − 1.96 ∗ 0.71; −0.57 + 1.96 ∗ 0.71) = (−1.96; 0.82) per cui si accetta l’ipotesi Z⊥⊥Y |X = laurea. Inoltre 5∗9 = = −0.80, SE = 10 ∗ 10 da cui l’intervallo di confidenza al 95% log θ2ZY r 1 1 1 1 + + + = 0.71 5 10 10 9 (−0.80 − 1.96 ∗ 0.71; −0.80 + 1.96 ∗ 0.71) = (−2.19; 0.59) per cui si accetta l’ipotesi Z⊥⊥Y |X = superiore 2 Esercizio 3 Si consideri un vettore X = (X1 , X2 ) di due variabili casuali che ha distribuzione multinormale con media µ = (0.5, 0.2) e matrice di varianza e covarianza 12 10 . 11 Σ= ! . Calcolare: 3a) la matrice di concentrazione Σ−1 ; −1 Σ 0.34 −0.31 . 0.38 = ! . 3b) la media e la varianza della variabile casuale ottenuta come combinazione lineare W = AX + b, dove −1 1 −2 0.5 , b = 0 A= 0 2 −0.4 0 . −0.9 16 −6 3.2 µW = Aµ + b = 0.1 , ΣW = AΣAT = . 2.75 −2 1.8 . . 1.92 Esercizio 4 Si consideri un vettore X = (X1 , X2 , X3 ) di quattro variabili casuali che ha distribuzione multinormale con media µ = (1.32, 2.80, 4.21) e matrice di varianza e covarianza 7.66 −1.28 −0.11 0.62 −0.63 Σ= . . . 1.03 Calcolare: 4a) i parametri della distribuzione marginale (X2 , X3 ); 2.80 4.21 µ23 = ! , Σ23 = 0.62 −0.63 . 1.03 ! 4b) i parametri della distribuzione condizionata (X2 , X3 |X1 ) con X1 = 1. Siano X1 = X1 e X 2 = (X2 , X3 ) due blocchi di variabili e siano µ1 = 1.32 e µ2 = (2.80, 4.21) le loro medie, rispettivamente. Secondo lo stesso principio anche la matrice di varianza-covarianza è composta da 4 blocchi, Σ11 = σ12 , Σ22 , Σ12 e Σ21 . Da cui, µ2|1 = µ2 +Σ21 Σ−1 11 (X1 −µ1 ) = 2.85 4.21 ! , Σ2|1 = Σ22 −Σ21 Σ−1 11 Σ12 = 0.41 −0.65 . 1.03 4c) la matrice di concentrazione della distribuzione condizionata (X2 , X3 |X1 ). Σ−1 2|1 = −5150 −3250 . −2050 3 ! !