Compitino di Statistica del 19 maggio 2005 (Corso di Laurea in
by user
Comments
Transcript
Compitino di Statistica del 19 maggio 2005 (Corso di Laurea in
Compitino di Statistica del 19 maggio 2005 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Es. 1 Es. 2 Es. 3 Es. 4 Somma Attenzione: si consegnano SOLO i fogli di questo fascicolo. Matricola Voto finale Esercizio 1. La translucenza nucale e il bitest sono due esami usati, come l’amniocentesi e la villocentesi, per stabilire se un feto sia affetto dalla sindrome di Down (trisomia 21). Amniocentesi e villocentesi danno una risposta certa ma provocano il rischio di un aborto spontaneo, mentre translucenza nucale e bitest sono esami non invasivi che non hanno alcuna conseguenza sul feto o sulla madre. In particolare, la translucenza nucale individua il 77% dei feti Down e dà un risultato positivo anche nel 5% dei casi in cui il feto non è Down. Gli stessi dati per il bitest sono rispettivamente del 60% e del 5%. Infine, la probabilità che un feto sia Down in una donna di 35 anni è di 1/210. 1. Calcolare la probabilità che una donna di 35 anni che si sottopone alla translucenza nucale abbia un risultato positivo (feto Down). 2. Calcolare la stessa probabilità nel caso del bitest. 3. Calcolare, nei due casi, la probabilità che il feto sia effettivamente Down nel caso in cui si abbia avuto un risultato positivo. 4. Supponiamo che si facciano entrambi gli esami, e che i risultati degli esami siano indipendenti tra di loro sia nel caso in cui il feto sia Down sia nel caso in cui non lo sia. Calcolare la probabilità che il feto sia Down nel caso in cui si abbiano avuto due risultati positivi. Esercizio 2. Ogni anno circa il 4% dei fumatori tenta di smettere, e il 50% di questi hanno successo, nel senso che riescono a non fumare per almeno 1 anno. 1. Qual è la probabilità che un singolo fumatore smetta di fumare per almeno 1 anno? 2. Qual è la probabilità che, di 20 fumatori, almeno 4 smettano di fumare per almeno 1 anno? Supponiamo che 20 fumatori entrino in un programma per aumentare la probabilità di successo nello smettere di fumare. 3. Se 15 di queste 20 persone dopo 1 anno non hanno ripreso a fumare, può questo programma considerarsi valido? Per rispondere a questa domanda, calcolare la probabilità che questo accada se la probabilità di avere successo fosse sempre del 50%. Esercizio 3. È stato condotto uno studio su alcuni malati di retinite pigmentosa, una malattia che provoca una perdita di campo visivo. Le misurazioni sono state fatte in scala logaritmica, e in questo modo i dati possono essere ritenuti gaussiani. Dopo 3 anni, si è osservata una perdita media di campo visivo di 0.14, con una deviazione standard di 0.66 (in scala logaritmica). 1. Calcolare la proporzione di pazienti che ha mostrato un declino nel campo visivo in questi 3 anni. 2. Calcolare la proporzione di pazienti che ha mostrato un declino nel campo visivo di più del 20% in questi 1 = 0.223). 3 anni (nota: in scala logaritmica, il declino è di log 0.8 3. Se i pazienti erano 90 in tutto, calcolare la probabilità che meno di 35 pazienti abbiano mostrato tale declino. Esercizio 4. Si suppone che la pressione sanguigna presa dal braccio destro o dal braccio sinistro sia confrontabile. Per testare questa ipotesi, si prendono 2 campioni da 5 volontari, con i seguenti risultati: n 1 2 3 4 5 braccio sinistro 130 120 135 100 98 braccio destro 126 124 127 95 102 1. Fare un test statistico per capire se le due braccia danno risultati confrontabili. Riportare limitazioni per il valore P . 2. Come cambia la risposta se i due campioni sono composti dalle stesse persone? 3. Eseguire il test del punto 2). Riportare limitazioni per il valore P . Soluzioni Esercizio 1 Innanzitutto definiamo gli eventi A := { il feto è Down }, B1 := { la translucenza nucale è positiva }, B2 := { il bitest è positivo }. Possiamo riscrivere i dati come P(B1 |A) = 0.77, P(B1 |Ac ) = 0.05, P(B2 |A) = 0.6, P(B2 |Ac ) = 0.05, P(A) = 1/210 = 0.004762. 1. Usando la formula della probabilità totale abbiamo P(B1 ) = P(B1 |A)P(A) + P(B1 |Ac )P(Ac ) = 0.00534 2. Come prima, abbiamo P(B2 ) = P(B2 |A)P(A) + P(B2 |Ac )P(Ac ) = 0.00526 3. Usando la formula di Bayes abbiamo: P(A|B1 ) = P(B1 |A)P(A) = 0.06863 P(B1 ) P(A|B2 ) = P(B2 |A)P(A) = 0.05430 P(B2 ) 4. Dobbiamo calcolare P(A|B1 ∩ B2 ). Utilizzando la formula di Bayes e l’informazione sull’indipendenza abbiamo P(A|B1 ∩ B2 ) = = P(B1 ∩ B2 |A)P(A) = P(B1 ∩ B2 |A)P(A) + P(B1 ∩ B2 |Ac )P(Ac ) P(B1 |A)P(B2 |A)P(A) = 0.46927 P(B1 |A)P(B2 |A)P(A) + P(B1 |Ac )P(B2 |Ac )P(Ac ) Esercizio 2 Innanzitutto definiamo gli eventi A := { si tenta di smettere } e B := { non si fuma per 1 anno }; ovviamente, B ⊆ A. Possiamo riscrivere i dati come P(A) = 0.04, P(B|A) = 0.5. 1. Per la formula della probabilità totale, abbiamo P(B) = P(B|A)P(A) + P(B|Ac )P(Ac ) = 0.5 · 0.04 + 0 · 0.96 = 0.02 2. Possiamo definire le variabili aleatorie 1 se l’i-esimo fumatore smette Yi = 0 altrimenti Pn Allora Yi ∼ Be(p), con p = 0.02, e le (Yi )i sono indipendenti. Allora Sn = i=1 Yi è il numero di fumatori che riescono a smettere, che è distribuito con legge B(n, p). Dato che np = 20 · 0.02 = 0.4 < 5, non si può usare l’approssimazione normale (e nemmeno quella di Poisson). Si ha quindi Per n = 2 abbiamo: P{S20 ≥ 4} = 1 − P{S20 ≤ 3} = 1 − 3 X P{S20 = k} = 1 − 0.66761 − 0.27249 − 0.05283 − 0.00647 = 0.00060 k=0 dove per calcolare le probabilità binomiali si può usare la regola ricorsiva: 20 0 P{S20 = 0} = p (1 − p)20 = 0.9820 = 0.66761 0 20 0.02 P{S20 = 1} = P{S20 = 0} · · = 0.27249 1 0.98 19 0.02 P{S20 = 2} = P{S20 = 1} · · = 0.05283 2 0.98 18 0.02 P{S20 = 3} = P{S20 = 2} · · = 0.00647 3 0.98 3. Se supponiamo che tutti e 20 i fumatori abbiano tentato di smettere di fumare, possiamo ancora considerare le variabili aleatorie i.i.d. (Yi )i di legge Be(p), ma stavolta p = 0.5. In questo caso, np = 20 · 0.5 = 10 > 5, e si può utilizzare l’approssimazione normale. Si ha quindi: ) ( 14.5 − 10 S20 − np √ P{S20 ≥ 15} = P p ≥ = P{Sn∗ ≥ −2.01} = 1 − FSn∗ (2.01) ' 5 np(1 − p) ' 1 − FZ (2.01) = 1 − 0.97778 = 0.02222 dove si è utilizzata anche la correzione di continuità. In alternativa, si potrebbe calcolare questa probabilità utilizzando la legge binomiale esatta, e si otterrebbe P{S20 ≥ 15} = 0.02069. Esercizio 3 Chiamiamo X il logaritmo della perdita di campo visivo in 3 anni. Allora X ∼ N (0.14, 0.662 ). 1. Dobbiamo calcolare 0 − 0.14 X − 0.14 > = P{Z > −0.21} = 1 − FZ (−0.21) = FZ (0.21) = 0.58317 P{X > 0} = P 0.66 0.66 2. Dobbiamo calcolare X − 0.14 0.223 − 0.14 P{X > 0.223} = P > = P{Z > 0.13} = 1 − FZ (0.13) = 1 − 0.54776 = 0.45224 0.66 0.66 3. Definiamo la variabile aleatoria 1 Xi = 0 se l’i-esimo individuo ha mostrato tale declino altrimenti Pn Allora Xi ∼ Be(p), con p = 0.45224. Definiamo poi Sn = i=1 Xi = n. di pazienti che hanno mostrato un declino maggiore del 20%. Allora Sn ∼ B(n, p). Fare i calcoli con questa distribuzione sarebbe molto laborioso, ma siccome np = 90 · 0.45224 ' 40.7 > 5, possiamo approssimare la legge di Sn con una legge N (np, np(1 − p)). Abbiamo quindi: ) ( S90 − np 34.5 − 40 P{S90 < 35} = P p <√ = P{Sn∗ < −1.31} = FSn∗ (−1.31) ' 40 × 0.45 np(1 − p) ' FZ (−1.31) = 1 − FZ (1.31) = 1 − 0.90490 = 0.09510 dove si è utilizzata anche la correzione di continuità. Esercizio 4 1. Se i 2 campioni sono composti da persone diverse, dobbiamo fare un test t di ipotesi H0 : µS = µD e alternativa H1 : µS 6= µD . Chiamando X le misurazioni sul braccio destro e Y quelle sul braccio sinistro, abbiamo che X̄ = 116.6, s2X = 287.8, Ȳ = 114.8 e s2Y = 228.7, pertanto 116.6 − 114.8 = 0, 177 t= q 287.8 228.7 + 5 5 I gradi di libertà sono ν = 5 + 5 − 2 = 8; per questi gradi di libertà, il quantile più basso è t0.95 (8) = 1.859, che corrisponde ad un α = 0.1. Dato che |t| < t0.95 (8), concludiamo che P > 0.1. Possiamo quindi concludere che le due braccia danno risultati confrontabili. 2. Se i due campioni sono composti dalle stesse persone, non si possono considerare indipendenti. La procedura adatta in questo caso è considerare, per ogni persona, le differenze di misurazione, ottenendo cosı̀il nuovo campione (che possiamo chiamare Z) 4, −4, 8, 5, −4 e su questo fare un test sulla media di ipotesi H0 : µZ = 0 e alternativa H1 : µZ 6= 0. 3. Abbiamo che 1.8 t= q = 0.73 30.2 5 I gradi di libertà questa volta sono ν = 5 − 1 = 4. per questi gradi di libertà, il quantile più basso è t0.95 (4) = 2.131, che corrisponde ad un α = 0.1. Dato che |t| < t0.95 (4), anche in questo caso concludiamo che P > 0.1, e possiamo quindi ancora concludere che le due braccia danno risultati confrontabili. Compitino di Statistica del 19 maggio 2005 Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova docente: Tiziano Vargiolu Andreazza Camilla Balzano Nicolò Barbierato Mauro Bonetto Greta Caprara Carlotta Carretta Giulia Cogo Marisa Anna Dametto Paolo Dotto Marco Ferrari Oscar Gessuti Micael Gianandrea Marcello Giulitti Stefano Lanciai Federico Longo Stefano Marcato Alice Mannara Francesco Mazzoccato Alberto Mazzocco Giovanni Milan Andrea Miolli Giulia Valentina Piazza Stefano Pierobon Andrea Pirazzini Marco Povellato Giulia Puricelli Diego Ranchio Alessandro Shehapi Altea Sofia Alessandro Sorato Nadia Stevan Martina Stradiotto Damiano Vendramin Matteo Venturini Luca Vescovo Damiano Zampini Matteo Zane M.Angela 1,5 9 12 23,5 14,5 11 25,5 12,5 13,5 8 13 11,5 7,5 9,5 6,5 17 22,5 8 5,5 4 16,5 26 29,5 9 10,5 15 9,5 5 5 23 10 12,5 2,5 25,5 16 11 7,5 Visione compiti corretti: martedı̀ 24 durante la didattica di supporto.