...

Compitino di Statistica del 19 maggio 2005 (Corso di Laurea in

by user

on
Category: Documents
24

views

Report

Comments

Transcript

Compitino di Statistica del 19 maggio 2005 (Corso di Laurea in
Compitino di Statistica del 19 maggio 2005 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova).
Cognome
Nome
Es. 1
Es. 2
Es. 3
Es. 4
Somma
Attenzione: si consegnano SOLO i fogli di questo fascicolo.
Matricola
Voto finale
Esercizio 1. La translucenza nucale e il bitest sono due esami usati, come l’amniocentesi e la villocentesi, per
stabilire se un feto sia affetto dalla sindrome di Down (trisomia 21). Amniocentesi e villocentesi danno una
risposta certa ma provocano il rischio di un aborto spontaneo, mentre translucenza nucale e bitest sono esami
non invasivi che non hanno alcuna conseguenza sul feto o sulla madre. In particolare, la translucenza nucale
individua il 77% dei feti Down e dà un risultato positivo anche nel 5% dei casi in cui il feto non è Down. Gli
stessi dati per il bitest sono rispettivamente del 60% e del 5%. Infine, la probabilità che un feto sia Down in
una donna di 35 anni è di 1/210.
1. Calcolare la probabilità che una donna di 35 anni che si sottopone alla translucenza nucale abbia un
risultato positivo (feto Down).
2. Calcolare la stessa probabilità nel caso del bitest.
3. Calcolare, nei due casi, la probabilità che il feto sia effettivamente Down nel caso in cui si abbia avuto un
risultato positivo.
4. Supponiamo che si facciano entrambi gli esami, e che i risultati degli esami siano indipendenti tra di loro
sia nel caso in cui il feto sia Down sia nel caso in cui non lo sia. Calcolare la probabilità che il feto sia
Down nel caso in cui si abbiano avuto due risultati positivi.
Esercizio 2. Ogni anno circa il 4% dei fumatori tenta di smettere, e il 50% di questi hanno successo, nel senso
che riescono a non fumare per almeno 1 anno.
1. Qual è la probabilità che un singolo fumatore smetta di fumare per almeno 1 anno?
2. Qual è la probabilità che, di 20 fumatori, almeno 4 smettano di fumare per almeno 1 anno?
Supponiamo che 20 fumatori entrino in un programma per aumentare la probabilità di successo nello smettere
di fumare.
3. Se 15 di queste 20 persone dopo 1 anno non hanno ripreso a fumare, può questo programma considerarsi
valido? Per rispondere a questa domanda, calcolare la probabilità che questo accada se la probabilità di
avere successo fosse sempre del 50%.
Esercizio 3. È stato condotto uno studio su alcuni malati di retinite pigmentosa, una malattia che provoca
una perdita di campo visivo. Le misurazioni sono state fatte in scala logaritmica, e in questo modo i dati
possono essere ritenuti gaussiani. Dopo 3 anni, si è osservata una perdita media di campo visivo di 0.14, con
una deviazione standard di 0.66 (in scala logaritmica).
1. Calcolare la proporzione di pazienti che ha mostrato un declino nel campo visivo in questi 3 anni.
2. Calcolare la proporzione di pazienti che ha mostrato un declino nel campo visivo di più del 20% in questi
1
= 0.223).
3 anni (nota: in scala logaritmica, il declino è di log 0.8
3. Se i pazienti erano 90 in tutto, calcolare la probabilità che meno di 35 pazienti abbiano mostrato tale
declino.
Esercizio 4. Si suppone che la pressione sanguigna presa dal braccio destro o dal braccio sinistro sia confrontabile. Per testare questa ipotesi, si prendono 2 campioni da 5 volontari, con i seguenti risultati:
n
1
2
3
4
5
braccio sinistro
130
120
135
100
98
braccio destro
126
124
127
95
102
1. Fare un test statistico per capire se le due braccia danno risultati confrontabili. Riportare limitazioni per
il valore P .
2. Come cambia la risposta se i due campioni sono composti dalle stesse persone?
3. Eseguire il test del punto 2). Riportare limitazioni per il valore P .
Soluzioni
Esercizio 1 Innanzitutto definiamo gli eventi A := { il feto è Down }, B1 := { la translucenza nucale è
positiva }, B2 := { il bitest è positivo }. Possiamo riscrivere i dati come P(B1 |A) = 0.77, P(B1 |Ac ) = 0.05,
P(B2 |A) = 0.6, P(B2 |Ac ) = 0.05, P(A) = 1/210 = 0.004762.
1. Usando la formula della probabilità totale abbiamo
P(B1 ) = P(B1 |A)P(A) + P(B1 |Ac )P(Ac ) = 0.00534
2. Come prima, abbiamo
P(B2 ) = P(B2 |A)P(A) + P(B2 |Ac )P(Ac ) = 0.00526
3. Usando la formula di Bayes abbiamo:
P(A|B1 ) =
P(B1 |A)P(A)
= 0.06863
P(B1 )
P(A|B2 ) =
P(B2 |A)P(A)
= 0.05430
P(B2 )
4. Dobbiamo calcolare P(A|B1 ∩ B2 ). Utilizzando la formula di Bayes e l’informazione sull’indipendenza
abbiamo
P(A|B1 ∩ B2 )
=
=
P(B1 ∩ B2 |A)P(A)
=
P(B1 ∩ B2 |A)P(A) + P(B1 ∩ B2 |Ac )P(Ac )
P(B1 |A)P(B2 |A)P(A)
= 0.46927
P(B1 |A)P(B2 |A)P(A) + P(B1 |Ac )P(B2 |Ac )P(Ac )
Esercizio 2 Innanzitutto definiamo gli eventi A := { si tenta di smettere } e B := { non si fuma per 1 anno };
ovviamente, B ⊆ A. Possiamo riscrivere i dati come P(A) = 0.04, P(B|A) = 0.5.
1. Per la formula della probabilità totale, abbiamo
P(B) = P(B|A)P(A) + P(B|Ac )P(Ac ) = 0.5 · 0.04 + 0 · 0.96 = 0.02
2. Possiamo definire le variabili aleatorie
1 se l’i-esimo fumatore smette
Yi =
0 altrimenti
Pn
Allora Yi ∼ Be(p), con p = 0.02, e le (Yi )i sono indipendenti. Allora Sn = i=1 Yi è il numero di fumatori
che riescono a smettere, che è distribuito con legge B(n, p). Dato che np = 20 · 0.02 = 0.4 < 5, non si può
usare l’approssimazione normale (e nemmeno quella di Poisson). Si ha quindi Per n = 2 abbiamo:
P{S20 ≥ 4} = 1 − P{S20 ≤ 3} = 1 −
3
X
P{S20 = k} = 1 − 0.66761 − 0.27249 − 0.05283 − 0.00647 = 0.00060
k=0
dove per calcolare le probabilità binomiali si può usare la regola ricorsiva:
20 0
P{S20 = 0} =
p (1 − p)20 = 0.9820 = 0.66761
0
20 0.02
P{S20 = 1} = P{S20 = 0} ·
·
= 0.27249
1 0.98
19 0.02
P{S20 = 2} = P{S20 = 1} ·
·
= 0.05283
2 0.98
18 0.02
P{S20 = 3} = P{S20 = 2} ·
·
= 0.00647
3 0.98
3. Se supponiamo che tutti e 20 i fumatori abbiano tentato di smettere di fumare, possiamo ancora considerare
le variabili aleatorie i.i.d. (Yi )i di legge Be(p), ma stavolta p = 0.5. In questo caso, np = 20 · 0.5 = 10 > 5,
e si può utilizzare l’approssimazione normale. Si ha quindi:
)
(
14.5 − 10
S20 − np
√
P{S20 ≥ 15} = P p
≥
= P{Sn∗ ≥ −2.01} = 1 − FSn∗ (2.01) '
5
np(1 − p)
' 1 − FZ (2.01) = 1 − 0.97778 = 0.02222
dove si è utilizzata anche la correzione di continuità. In alternativa, si potrebbe calcolare questa probabilità
utilizzando la legge binomiale esatta, e si otterrebbe P{S20 ≥ 15} = 0.02069.
Esercizio 3 Chiamiamo X il logaritmo della perdita di campo visivo in 3 anni. Allora X ∼ N (0.14, 0.662 ).
1. Dobbiamo calcolare
0 − 0.14
X − 0.14
>
= P{Z > −0.21} = 1 − FZ (−0.21) = FZ (0.21) = 0.58317
P{X > 0} = P
0.66
0.66
2. Dobbiamo calcolare
X − 0.14
0.223 − 0.14
P{X > 0.223} = P
>
= P{Z > 0.13} = 1 − FZ (0.13) = 1 − 0.54776 = 0.45224
0.66
0.66
3. Definiamo la variabile aleatoria
1
Xi =
0
se l’i-esimo individuo ha mostrato tale declino
altrimenti
Pn
Allora Xi ∼ Be(p), con p = 0.45224. Definiamo poi Sn = i=1 Xi = n. di pazienti che hanno mostrato
un declino maggiore del 20%. Allora Sn ∼ B(n, p). Fare i calcoli con questa distribuzione sarebbe molto
laborioso, ma siccome np = 90 · 0.45224 ' 40.7 > 5, possiamo approssimare la legge di Sn con una legge
N (np, np(1 − p)). Abbiamo quindi:
)
(
S90 − np
34.5 − 40
P{S90 < 35} = P p
<√
= P{Sn∗ < −1.31} = FSn∗ (−1.31) '
40 × 0.45
np(1 − p)
' FZ (−1.31) = 1 − FZ (1.31) = 1 − 0.90490 = 0.09510
dove si è utilizzata anche la correzione di continuità.
Esercizio 4
1. Se i 2 campioni sono composti da persone diverse, dobbiamo fare un test t di ipotesi H0 : µS = µD e
alternativa H1 : µS 6= µD . Chiamando X le misurazioni sul braccio destro e Y quelle sul braccio sinistro,
abbiamo che X̄ = 116.6, s2X = 287.8, Ȳ = 114.8 e s2Y = 228.7, pertanto
116.6 − 114.8
= 0, 177
t= q
287.8
228.7
+
5
5
I gradi di libertà sono ν = 5 + 5 − 2 = 8; per questi gradi di libertà, il quantile più basso è t0.95 (8) = 1.859,
che corrisponde ad un α = 0.1. Dato che |t| < t0.95 (8), concludiamo che P > 0.1. Possiamo quindi
concludere che le due braccia danno risultati confrontabili.
2. Se i due campioni sono composti dalle stesse persone, non si possono considerare indipendenti. La procedura adatta in questo caso è considerare, per ogni persona, le differenze di misurazione, ottenendo cosı̀il
nuovo campione (che possiamo chiamare Z)
4,
−4,
8,
5,
−4
e su questo fare un test sulla media di ipotesi H0 : µZ = 0 e alternativa H1 : µZ 6= 0.
3. Abbiamo che
1.8
t= q
= 0.73
30.2
5
I gradi di libertà questa volta sono ν = 5 − 1 = 4. per questi gradi di libertà, il quantile più basso è
t0.95 (4) = 2.131, che corrisponde ad un α = 0.1. Dato che |t| < t0.95 (4), anche in questo caso concludiamo
che P > 0.1, e possiamo quindi ancora concludere che le due braccia danno risultati confrontabili.
Compitino di Statistica del 19 maggio 2005
Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova
docente: Tiziano Vargiolu
Andreazza Camilla
Balzano Nicolò
Barbierato Mauro
Bonetto Greta
Caprara Carlotta
Carretta Giulia
Cogo Marisa Anna
Dametto Paolo
Dotto Marco
Ferrari Oscar
Gessuti Micael
Gianandrea Marcello
Giulitti Stefano
Lanciai Federico
Longo Stefano
Marcato Alice
Mannara Francesco
Mazzoccato Alberto
Mazzocco Giovanni
Milan Andrea
Miolli Giulia Valentina
Piazza Stefano
Pierobon Andrea
Pirazzini Marco
Povellato Giulia
Puricelli Diego
Ranchio Alessandro
Shehapi Altea
Sofia Alessandro
Sorato Nadia
Stevan Martina
Stradiotto Damiano
Vendramin Matteo
Venturini Luca
Vescovo Damiano
Zampini Matteo
Zane M.Angela
1,5
9
12
23,5
14,5
11
25,5
12,5
13,5
8
13
11,5
7,5
9,5
6,5
17
22,5
8
5,5
4
16,5
26
29,5
9
10,5
15
9,5
5
5
23
10
12,5
2,5
25,5
16
11
7,5
Visione compiti corretti: martedı̀ 24 durante la didattica di supporto.
Fly UP