Esercitazione del 08/05/2009

by user

on 06 июля 2016

Category: Documents

>> Downloads: 2

views

Report

Comments

Description

Download Esercitazione del 08/05/2009

Transcript

Esercitazione del 08/05/2009

Politecnico di Milano – Facoltà di Ingegneria Informatica
Anno Accademico 2008/2009
Corso di Statistica (2L) per INF e TEL
Docente: Antonio Pievatolo; esercitazioni: Raffaele Argiento
Esercitazione del 08/05/2009
Esercizio 1(dal Tema d’esame del 25/02/2008)
Una grande catena di fast-food analizza mensilmente un campione casuale dei suoi famosi big panini,
con lo scopo di controllare che mediamente pesino al più 600 grammi (g). In caso contrario, si rendono
necessarie delle operazioni di taratura dei macchinari di produzione. Nel mese di gennaio su un campione
casuale di 25 big panini si è registrato un peso medio campionario pari a 620.0 gr.
Assumendo che il peso dei panini espresso in grammi sia una variabile aleatoria gaussiana, con
deviazione standard nota e pari a 80, rispondete alle seguenti domande.
1. Impostate un opportuno test di ipotesi tale che sia al più pari ad α = 5% la probabilità di commettere l’errore di prima specie di ritenere necessarie operazioni di taratura dei macchinari di
produzione che in realtà sono già ben tarati. Alla luce dei dati di gennaio, l’operazione di taratura
è necessaria?
2. Sulla base dei dati a disposizione, quanto siete confidenti che la media teorica dei big panini di
gennaio sia maggiore di 593.68 gr?
3. Fornite analiticamente e rappresentate graficamente la funzione di potenza π del test al punto 1.
(α = 5%).
Per il mese di marzo si è deciso di misurare un campione più numeroso di big panini al fine di aumentare
la potenza del test, ma mantenendo una significatività pari a α = 5%.
4. Se effettivamente il peso medio dei big panini è pari a 640 gr, quanti panini bisogna misurare affinché
la potenza sia maggiore di 0.94?
Soluzione Se Xi è il peso dell’i-esimo panino, X1 , . . . , Xn è un campione casuale estratto da una
popolazione gaussiana N (µ, 802 ) di media µ incognita.
1. Impostiamo il problema
√ di verifica di ipotesi H0 : µ ≤ 600 contro H1 : µ > 600. Quindi rifiutiamo
se X̄ ≥ 600 + z1−α 80/ 25 = 600 + 16z1−α . Il p-value è dato da
620 − 600
p-value = 1 − Φ
= 1 − Φ(1.25) ≃ 1 − 0.894 = 0.106 = 10.6%
16
Ai consueti livelli di significatività (inferiori al 10%, quindi anche 5%) non possiamo rifiutare
l’ipotesi nulla H0 e concludiamo che non sono necessarie operazioni di taratura.
2. Siamo confidenti al 95% che i big panini superino mediamente i 593.68 gr. Infatti, con i dati a
disposizione, in virtù della dualità fra la verifica di ipotesi e gli intervalli di confidenza, segue dal
punto 1. che {µ : x̄ < µ + 16z1−α } = {µ : µ > x̄ − 16z1−α } = (620.0 − 16z1−α , ∞) è un IC
unilatero a una coda superiore per µ di confidenza 1 − α. Ma, 620.0 − 16z1−α = 593.68 se, e solo
se, 1 − α = 95%.
3. La funzione di potenza del test del punto 1. quando si campionano n panini e α = 5% è data da
600 − µ √
80
=1−Φ
n + 1.645 =
π(µ) = Pµ X̄ ≥ 600 + 1.645 × √
n
80
µ
µ − 600 √
n − 1.645 = Φ
− 39.145 , µ > 600
=Φ
80
16
Il grafico è nella figura che segue
1
4. La √
potenza π calcolata in µ = 640 quando si campionano
√ n panini e α = 5% diventa π(640) =
Φ ( n/2 − 1.645) che è maggiore di 0.94 se, e solo se, n/2 − 1.645 > 1.555, cioè n > 40.96. In
definitiva, π(640) > 0.94 per n ≥ 41 panini.
Esercizio2
Ripetere il punto 1. dell’esercizio
Pn 1 senza l’ipotesi che la variaza del peso dei big panini sia nota, con
l’informazione aggiuntiva che i=1 xi = 9764829
Soluzione La statistica test in questo caso è
U :=
X̄ − µ0
√ ∼ tn−1
S/ n
Per calcolare il valore osservato da U bisogna calcolare una stima della varianza tramite la statistica
varianza campionaria:
n
1 X 2
1
2
2
X − nX̄ 2 )
(Xi − X̄) =
(
S =
n−1
n − 1 i=1 i
Quindi s2 = 6451.2 e u = 1.245 da cui si ricava che p-value= 1 − P(U < u) = 1 − 0.0887 = 0.113
Esercizio3
Sia X una v.a. con densità
fX (x; θ) =
1 θ1 −1
θx
0
0 < x < 1,
altrove. θ > 0
Si consideri il problema
H0 : θ = 2 contro H1 : θ = 0.2 Sia X1 , . . . , Xn un campione i.i.d. da fX
Pn
1. Si determini la densità di V = − j=1 log Xj sotto l’ipotesi H0 e sotto H1 .
(1)
2. Si costruisca il test più potente di livello α per il problema (1).
3. Calcolare la potenza del test costruito al punto 2., quando α = 5% per campione di 3 osservazioni.
Come varia la potenza in funzione di α.
4. Siano n = 3 e x1 × x2 × x3 = 0.13. Che decisione prendete per α = 1%, 5%, 10%?
Soluzione
1. Sia X ∈ (0, 1) con densità fX e poniamo Y = − log(X); Y a supporto sul semiasse positivo dei
reali, inoltre se y ≥ 0 allora
FY (y) =
=
P(Y ≤ y) = P(− log(X) ≤ y) = P(X ≥ e−y )
Z 1
1 1
y
1 1 −1
x θ dx = x θ
= 1 − e− θ .
−y
θ
e
−y
e
Possiamo
Pn concludere che Y ha distribuzione Exp(θ). Se Y1 = − log(X1 ), . . . , Yn = − log(Xn ), allora
V = i=1 Yi e di conseguenza V ∼gamma(n, θ).
In particolare:
d
d
2
(a) sotto l’ipotesi H0 : θ = 2, quindi VH0 ∼gamma(n, 2) =gamma( 2n
2 , 2) = χ2n ;
d
(b) sotto l’ipotesi H1 : θ = 0.2, quindi VH1 ∼gamma(n, 0.2) =
2
d 1 2
1
10 gamma(n, 2) = 10 χ2n
2. Per costruire il test più potente, per il problema (1), usiamo il lemma di Neyman-Pearson. Siano
θ0 = 2 e θ1 = 0.2, calcoliamo la statistica
n
Y
Qn
2
fX (xi ; θ0 )
L(θ1 , x)
θ1
λ(x) =
=
= Qni=1
L(θ2 , x)
θ0
f
(x
;
θ
)
i=1 X i 1
! θ1
0
xi
i=1
− θ1
1
.
La regine critica del test più potente per il problema (1) è


! θ1 − θ1
n

 θ 2 Y
0
1
1
≤δ ,
xi
C= x:


θ0
i=1
e bisogna scegliere δ in modo tale che essa sia di livello α. A tal proposito osserviamo che tutte
le disuguaglianze che seguono sono equivalenti, dato che le quantità (δ, δ1 , δ2 , δ3 ) alla destra delle
disuguaglianze non dipendono dal campione:
θ1
θ0
n
n
Y
i=1
! θ1
0
xi
− θ1
n
Y
1
≤δ
⇒
⇒
⇒ −
In conclusione possiamo riscrivere C come:
(
C=
x:−
n
X
i=1
0
xi
i=1
n
Y
i=1
! θ1
− θ1
1
≤ δ1
xi ≥ δ2
n
X
i=1
(Nota
1
1
−
< 0)
θ0
θ1
log(xi ) ≤ δ3
log(xi ) ≤ δ3
)
Come calcolato al punto 1. dell’esercizio, la distribuzione di −
una χ22n allora C è di livello α se δ3 = χ22n (α).
.
Pn
i=1
log(Xi ), sotto H0 , è quella di
3. La potenza del test è :
πα (θ1 ) = PH1 (X ∈ C) = PH1 (−
n
X
i=1
log(Xi ) ≤ χ22n (α)) = PH1 (−10 log(Xi ) ≤ 10χ22n (α))
Al punto 1. dell’esercizio si è osservato come, sotto H1 −10 log(Xi ) ∼ χ22n . Sia F2n la sua funzione
di ripartizione, allora, πα (θ1 ) = F2n (χ22n (α)). Ora si osservi che sia F2n (·), sia χ22n (·), sono funzioni
crescenti. Quindi πα (θ1 ) è funzione crescente di α
4. Calcoliamo il p-value del test per n = 3 e x1 × x2 × x3 = 0.13. Il valore osservato della statistica
test è vH0 = − log(0.13) = 2.04. Quindi p-valueP(VH0 ≤ vH0 ) = P(VH0 ≤ 2.04), ricordando che
VH0 ∼ χ22n si ottiene 0.05 <p-value< 0.1. Quindi:
(a) Se α = 0.01 allora α <p-value ⇒ non rifiuto H0
(b) Se α = 0.05 allora α <p-value ⇒ non rifiuto H0
(c) Se α = 0.1 allora α >p-value ⇒ rifiuto H0
3