...

note PDF - Università degli Studi di Milano

by user

on
Category: Documents
26

views

Report

Comments

Transcript

note PDF - Università degli Studi di Milano
1. La verifica delle ipotesi
Nelle due sezioni precedenti abbiamo visto che la media campionaria è un buon stimatore del valore atteso della distribuzione da cui provengono i dati ed è stato anche
possibile controllare la variabilità, cioè la precisione, del nostro stimatore attraverso gli
intervalli di confidenza. Questi ultimi, come abbiamo visto, sono centrati attorno al valore
assunto dalla media campionaria.
Il problema di cui ci occuperemo ora è il seguente: supponiamo di avere un’idea
di quale possa essere il valore incognito di una media (magari perché stiamo ripetendo
uno stesso esperimento a distanza di tempo) e studiamo una strategia che, sulla base
dei dati osservati, ci permetta di giungere ad una conferma o una smentita della nostra
supposizione iniziale. Cioè ci stiamo occupando di sottoporre a verifica una ipotesi.
1.1. Test d’ipotesi per la media. Supponiamo di avere un campione i.i.d. di variabili casuali normali di media µ incognita e varianza nota σ 2 . Ci proponiamo di sottoporre
a verifica l’ipotesi (statistica) che il vero valore incognito della media sia µ0 . Indichiamo
con H0 questa ipotesi che nel seguito denomineremo ipotesi nulla. Dal campione noi possiamo ricavare il valore della media campionaria X̄n che, come sappiamo, si distribuisce
come una N (µ, σ 2 /n).
Se per un dato campione avessimo x̄n = µ0 la nostra fiducia che sia proprio µ0 il
valore incognito di µ sarebbe massima ma, in generale, osserveremo dei valori x̄n che
sono, magari di poco, diversi da µ0 . Una procedura di test quindi, si occuperà di valutare
se la distanza tra x̄n e µ0 è poco o molto elevata. Passando alle variabili aleatorie, il test
si occuperà di verificare che la distanza |X̄n − µ0 | non sia troppo elevata (in probabilità).
Alla fine della procedura un test conduce sempre a due sole alternative: o rifiutiamo
l’ipotesi nulla H0 , oppure la accettiamo (o più correttamente non la rifiutiamo). Se
rifiutiamo l’ipotesi nulla quando questa è falsa non commettiamo errori, cosı̀ come quando
non la rifiutiamo se questa è vera. Ci sono però altre due situazioni che conducono ad
errori: se l’ipotesi nulla è vera e noi la rifiutiamo attraverso il test stiamo commettendo
un errore. Tale errore prende il nome di errore di Io tipo o di Ia specie. La possibilità
di commettere errori, come al solito, è legata al fatto che le nostre decisioni sono prese
sulla base di un campione, ciò vuol dire che, se estraiamo un campione “sfavorevole”, la
distanza x̄n − µ0 può risultare troppo grande per puro effetto del caso (o della scalogna!).
Poichè all’incertezza noi associamo sempre una probabilità, abbiamo di conseguenza una
certa probabilità di commettere un errore di primo tipo. Tale probabilità viene indicata
con α.
L’altro tipo di errore, detto di secondo tipo, si commette quando accettiamo l’ipotesi
nulla ma la stessa è falsa. Con β si indica, in genere, la probabilità di commettere tale
errore. Riassumiamo quanto visto in una tabella
1
2
Rifiuto H0
Non Rifuto H0
o
è vera H0 errore I tipo
nessun errore
α
1−α
è falsa H0 nessun errore errore di IIo tipo
1−β
β
Possiamo quindi scrivere che l’errore di primo tipo è null’altro se non la seguente
probabilità
α = P (rifiutare H0 |H0 è vera)
Torniamo all’esempio della media. La regola che possiamo introdurre è del tipo “se X̄n −µ0
è maggiore di un certo valore k rifiutiamo l’ipotesi nulla H0 : µ = µ0 in favore dell’ipotesi
alternativa H1 : µ 6= µ0 ”. Quando si effettua un test è sempre necessario specificare sia
l’ipotesi nulla che quella alternativa. In particolare, la specificazione dell’ipotesi alternativa ci permette di calcolare, o meglio fissare, l’errore di primo tipo. Esattamente come
per gli intervalli di confidenza in cui viene fissato il livello di confidenza, nei test si può
fissare il livello di significatività α. Infatti, fissato α il nostro test deve essere costruito in
modo tale da rifiutare H0 quando questa è vera con probabilità α. Se scegliamo la regola
si rifiuta H0 quando |X̄n − µ0 | > k allora sarà
P (|X̄n − µ0 | > k|H0 ) = α
Da questa relazione siamo in grado di calcolare k = kα che viene anche denominato valore
soglia del test. √Ecco come si procede: quando è vera H0 allora X̄n ∼ N (µ0 , σ 2 /n), quindi
(X̄n − µ0 )/(σ/ n) ∼ N (0, 1). Allora
!
X̄ − µ k
n
0
>
α = P (|X̄n − µ0 | > k|H0 ) = P H0
√σ √σn n
!
!
(1)
k
k
k
= P |Z| > σ
=P Z<− σ eZ> σ
√
√
n
n
√
n
Le ultime due espressioni
indicano
√
√ semplicemente che Z deve trovarsi al di fuori dell’intervallo (−k/(σ/ n), +k/(σ/
n)) e che questo deve avvenire con probabilità α. In
√
n)
è
quel
valore di z tale per cui Φ(z) = α/2 cioè z = zα/2 .
sostanza, il punto −k/(σ/
√
Mentre il punto k/(σ/ n) è quel valore di z che lascia alla sua destra 1 − α/2 ovvero
Φ(z) = 1 − α/2, dunque z = z1−α/2 . Si veda a riguardo la Figura 1. Poiché, come già
visto anche con gli intervalli di confidenza, si può sfruttare la simmetria di Z, il valore k
che ci interessa si trova come segue
k
√σ
n
= z1− α2
e dunque
(2)
σ
k = √ · z1− α2 .
n
1. LA VERIFICA DELLE IPOTESI
3
Regione
di rifiuto
Regione
di rifiuto
α
α
Regione di accettazione
2
2
zα
0
2
z1−α
2
Figura 1. Regione di rifiuto e accettazione di H0 : µ = µ0 per un test a due
code del tipo H1 : µ 6= µ0 .
Non ci resta che tirare le somme. Indichiamo con Z la statistica test
Z=
X̄n − µ0
√σ
n
Se per un dato campione calcoliamo un valore z di Z ottenuto come segue
z=
x̄n − µ0
√σ
n
il test ci dice di rifiutare l’ipotesi nulla H0 : µ = µ0 in favore di H1 : µ 6= µ0 se z cade
all’esterno dell’intervallo chiamato zona di rifiuto del test: (−z1− α2 , z1− α2 ) infatti basta
sostituire il valore soglia k ottenuto in (2) nella formula dell’errore di primo tipo (1).
Questo tipo di test è anche denominato test a due code.
4
Test sulla media (σ 2 nota)
Sia X una variabile casuale normale di media incognita µ e varianza σ 2 nota. Se
X1 , X2 , . . . , Xn è un campione i.i.d. estratto da X allora il test per la verifica di ipotesi
del tipo
H 0 : µ = µ0
H1 : µ 6= µ0
ha un livello di significatività α se corrisponde alla seguente regola di decisione
Rifiutare H0 se |z| > z1− α2
dove
z=
x̄n − µ0
√σ
n
Vi possono essere altri due tipi di ipotesi alternative della forma H1 : µ < µ0 e
H1 : µ > µ0 . In tal caso il test è sempre basato sulla statistica Z vista sopra ma sarà
differente il valore soglia. Vediamo cosa accade ad un test con ipotesi nulla H0 : µ =
µ0 contro un’alternativa H1 : µ > µ0 . Notiamo subito che un test ragionevole deve
essere un test che ci condurrà al rifiuto dell’ipotesi nulla quando la distanza tra X̄n e il
valore ipotizzato µ0 risulta essere troppo elevata per eccesso, quindi per trovare la soglia
scriveremo, tralasciando alcuni passaggi, quanto segue:
α = P (X̄n − µ0 > k|H0 ) = P
Z>
k
!
√σ
n
√
in questo caso k/(σ/ n) è quel valore di z che lascia alla sua sinistra un’area pari a 1 − α,
cioè lo z tale per cui Φ(z) = 1 − α. Quindi per determinare k scriveremo
k
√σ
n
= z1−α
e dunque il nostro test rifiuterà l’ipotesi nulla se
z=
x̄n − µ0
√σ
n
> z1−α
Si veda in proposito la Figura 3.
Analogamente, se l’ipotesi alternativa è H1 : µ < µ0 il nostro test rifiuterà per valori di
z troppo piccoli e in particolare quando z < zα . Si veda a riguardo la Figura 3. Entrambi
i tipi di test vengono detti test ad una coda. Riassumiamo ora quanto segue in un unico
schema
1. LA VERIFICA DELLE IPOTESI
5
Regione
di rifiuto
Regione di accettazione
0
α
z1−α
Figura 2. Regione di rifiuto e accettazione di H0 : µ = µ0 per un test ad una
coda del tipo H1 : µ > µ0 .
Test sulla media (σ 2 nota)
Sia X una variabile casuale normale di media incognita µ e varianza σ 2 nota. Se
X1 , X2 , . . . , Xn è un campione i.i.d. estratto da X allora il test di livello α, per la verifica
di ipotesi del tipo H0 : µ = µ0 , ha la seguente forma a seconda delle alternative:
quando H1 : µ 6= µ0 , Rifiutare H0 se |z| > z1− α2
quando H1 : µ > µ0 , Rifiutare H0 se z > z1−α
quando H1 : µ < µ0 , Rifiutare H0 se z < zα
dove
z=
x̄n − µ0
√σ
n
Se la varianza non è nota, si procede come nel caso degli intervalli di confidenza sostituendo
al valore σ 2 la sua stima s̄2n e utilizzando le tavole della t di Student. Se i dati non sono
distribuiti in modo gaussiano e l’ampiezza campionaria è elevata si usa la tecnica appena
vista basata sulla statistica t ma per i valori soglia si ricorre alle tavole della Normale.
6
Regione
di rifiuto
Regione di accettazione
α
zα
0
Figura 3. Regione di rifiuto e accettazione di H0 : µ = µ0 per un test ad una
coda del tipo H1 : µ < µ0 .
Test sulla media (σ 2 incognita)
Sia X una variabile casuale Normale di media incognita µ e varianza σ 2 non nota. Se
X1 , X2 , . . . , Xn è un campione i.i.d. estratto da X allora il test di livello α, per la verifica
di ipotesi del tipo H0 : µ = µ0 , ha la seguente forma a seconda delle alternative:
n−1
quando H1 : µ 6= µ0 , Rifiutare H0 se |t| > t1−
α
2
n−1
quando H1 : µ > µ0 , Rifiutare H0 se t > t1−α
quando H1 : µ < µ0 , Rifiutare H0 se t < tn−1
α
dove
t=
x̄n − µ0
s̄n
√
n
,
s̄n =
p
s̄2n
1.2. Verifica di ipotesi sulle proporzioni. Questo caso è del tutto analogo al
problema di verifica di ipotesi per la media. Possiamo volere sottoporre ad ipotesi H0 :
p = p0 contro un’alternativa H1 : p 6= p0 . Misureremo la distanza sempre con |p̂n − p0 | e
1. LA VERIFICA DELLE IPOTESI
7
per trovare il valore soglia scriveremo quanto segue
α = P (|p̂n − p0 | > k|H0 )
l’unica differenza, rispetto anche agli intervalli di confidenza, è che se risulta vera H0 allora
p = p0 e non abbiamo bisogno di utilizzare p̂n per standardizzare la differenza p̂n − p0 .
Infatti scriveremo
α = P (|p̂n − p0 | > k|H0 )


p̂n − p0 > q k

= P  q
p0 (1−p0 )
p0 (1−p0 ) n
n


k

' P |Z| > q
p0 (1−p0 )
n
e k sarà lo stesso valore determinato per il caso del test sulla media. Abbiamo quindi
la stessa casistica del caso del test sulla media e la statistica impiegata sarà ancora una
volta la z anche se costruita in modo differente. Dunque possiamo scrivere direttamente
l’elenco delle regole di test per i vari casi.
Test sulla proporzione
Sia X una variabile casuale di Bernoulli di parametro p incognito. Se X1 , X2 , . . . , Xn è
un campione i.i.d. estratto da X allora il test di livello α, per la verifica di ipotesi del
tipo H0 : p = p0 , ha la seguente forma a seconda delle alternative:
quando H1 : p 6= p0 , Rifiutare H0 se |z| > z1− α2
quando H1 : p > p0 , Rifiutare H0 se z > z1−α
quando H1 : p < p0 , Rifiutare H0 se z < zα
dove
p̂n − p0
z=q
p0 (1−p0 )
n
Attenzione! : il test si può eseguire solo se n > 30. Inoltre, nel denominatore di z si
utilizza p0 e non p̂n per la standardizzazione.
1.3. Esercizi riepilogativi.
Esercizio 1. Il tempo medio di vita di un campione di 100 lampadine fluorescenti
prodotte da una fabbrica è stimato in 1570 h, mentre è noto, da precedenti analisi, che
lo scarto quadratico medio è pari a 120 h. Per poter immettere sul mercato interno tali
lampadine si deve indicare sulla scatola un tempo medio di vita che abbia una significatività
del 5% mentre per l’estero è necessario che sia del 1%. Verificare se il valore 1600 h è
compatibile con i due mercati.
8
Si deve costruire un test d’ipotesi per verificare l’ipotesi nulla H0 : µ = µ0 = 1600h
contro l’alternativa che la vita media sia in realtà inferiore ai parametri minimi richiesti,
cioè H1 : µ < µ0 . Poiché sappiamo che lo scarto quadratico medio è pari a 120h, si
utilizzerà il test z ad una coda. La regola del test è quindi
x̄n − µ0
Rifiutare H0 se z =
< zα
σ
√
n
1570−1600
= −2.5 mentre i quantili della Gaussiana sono z0.01 = −2.33 e
Quindi z =
120
10
z0.05 = −1.64. In entrambi i casi il test rifiuta l’ipotesi nulla, quindi ciò vuol dire che non
si possono immettere sul mercato lampadine con quei valori dichiarati sulla scatola. Se
avessimo effettuato un test a due code, la regola del test sarebbe stata
Rifiutare H0 se |z| > z1−α/2
e in tal caso z0.975 = 1.96 e z0.995 = 2.57 avremmo rifiutato al livello 5% ma accettato al
livello 1%. Il valore -2.5 è molto vicino alla soglia di rifiuto del test di livello 1% e quindi
comunque il buon senso ci avrebbe portato a rifiutare l’ipotesi nulla.
Esercizio 2. Le resistenze alla rottura delle funi prodotte da una fabbrica hanno
media pari a 1800 N . Immettendo una nuova tecnica nel processo produttivo, si pensa
che la resistenza alla rottura possa essere accresciuta. Per provare ciò, si prende un
campione di 50 funi e si trova che la resistenza media alla rottura è di 1850 N mentre
lo scarto quadratico medio è stimato in 100 N . Si può pensare che vi sia stato un reale
miglioramento al livello di significatività dell’ 1%?
In questo secondo test, la varianza è incognita e quindi stimata attraverso i dati
campionari. Il test che si costruisce sarà concepito in modo tale da rifiutare l’ipotesi nulla
contrariamente al caso precedente in cui avremmo preferito non rifutarla. Costruiamo un
test per verificare l’ipotesi nulla H0 che la qualità dei materiali sia rimasta invariata, cioè
H0 : µ = µ0 = 1800N contro l’alternativa H1 : µ > µ0 . Quindi rifiutare vuol dire che si
certifica un aumento di qualità del prodotto. Si usa il test t con n − 1 gradi di libertà.
La regola del test è la seguente
x̄n − µ0
n−1
Rifiutare H0 se t =
> t1−α
s̄n
√
Nel nostro caso t =
1850−1800
100
√
50
n
40
= 3.54 e t49
0.99 < 2.423 = t0.99 quindi rifiutiamo l’ipotesi nulla
(anche un test al 5% avrebbe dato lo stesso risultato).
Esercizio 3. Un esperto di organizzazione aziendale afferma che l’introduzione di una
nuova procedura amministrativa può ridurre in modo sostanziale il tempo di completamento di una pratica amministrativa. A causa dei costi aggiuntivi di esercizio (personale e
attrezzature) la direzione dell’azienda decide di adottare la nuova procedura a condizione
che la riduzione dei tempi di espletamento delle pratiche risulti di almeno l’8%. Vengono
1. LA VERIFICA DELLE IPOTESI
9
fatti 6 esperimenti e si trova che la riduzione media di smaltimento è dell’8.4% con una
deviazione standard dello 0.32%. Decidere se, sulla base di questi risultati, all’azienda
conviene adottare la nuova procedura oppure no.
Siamo di fronte ad un test ad una coda in cui l’ipotesi nulla è H0 : µ = 0.08 contro
un’alternativa H1 : µ > 0.08. Costruito in questo modo, il test permette all’esperto di
organizzazione aziendale di convincere l’azienda ad adottare la nuova procedura nel caso
si riesca a rifiutare l’ipotesi nulla H0 . Calcoliamo la statistica t
x̄n − µ0
0.084 − 0.08
t= q
=
= 3.06
0.0032
s̄2n
n
√
6
n−1
Il test rifiuta l’ipotesi nulla quando t > t1−α
. Quindi, con un test di livello α = 1% si
5
ha t0.99 = 3.14267 > 3.06 e quindi non si rifiuta l’ipotesi nulla poiché il valore 3.06 cade
all’interno della regione di accetazione del test. Se invece eseguiamo un test di livello
α = 0.05, il valore soglia è t50.95 = 2.01 ed in questo caso il test ci permette di rifiutare H0
in quanto t = 3.06 > 2.01.
Esercizio 4. Alla vostra festa di compleanno si presenta Giukas, un amico, il quale
sostiene di avere poteri paranormali. In particolare, il tale afferma di poter leggere nel
pensiero delle persone. Ci proponiamo allora di mettere alla prova le qualità extrasensoriali di Giukas attraverso il metodo statistico e costruiamo un esperimento in modo tale
da evidenziare eventuali frodi. Prendiamo un mazzo di 40 carte (20 di colore rosso e
20 di colore nero) e ci sistemiamo in una stanza ben separata da dove si trova Giukas.
Estraiamo in successione una carta, guardiamo di quale colore è, e prima di rimetterla nel
mazzo chiediamo a Giukas di indovinare il colore della carta dall’altra stanza. Dopo 50
estrazioni ripetute, Giukas ha indovinato 32 carte su 50. La platea applaude contenta. Ci
chiediamo se, alla luce di tali risultati, si possa sostenere che Giukas possegga realmente
poteri paranormali (cioè sia dotato di ESP1 positivo).
Vediamo di formalizzare meglio l’esperimento. Abbiamo una successione di 50 prove
ripetute che, si suppone, sono state effettuate nelle stesse condizioni ed in modo indipendente tra loro. Ad ogni prova possiamo avere solo due esiti: Giukas indovina o non
indovina la carta estratta. Pensiamo all’evento indovina come ad un successo. Siamo
quindi di fronte ad uno schema Binomiale con n = 50 prove e p la probabilità a priori che
Giukas indovini la carta estratta in ciascuna prova.
A rigor di logica, se l’indovino fosse dotato di poteri paranormali, la probabilità di
indovinare la carta estratta dovrebbe essere pari ad 1 e quindi Giukas dovrebbe indovinare
50 carte su 50. Potremmo quindi costruire un test in cui l’ipotesi da sottoporre a verifica
1Extra
Sensory Perception. Un esperimento simile fu realmente condotto durante le missioni Apollo
dalla NASA. L’astronauta a bordo del modulo orbitante attorno alla Luna estraeva una carta e un secondo
astronauta nel modulo lunare LEM (posato sulla superficie lunare) doveva indovinare di quale carta si
trattasse. I risultati furono disastrosi con una percentuale di risposte sbagliate talmente elevata che i
sostenitori delle teorie paranormali coniarono per l’occasione il termine ESP “negativo” !
10
è H0 : p = 1 contro l’ipotesi H1 : p < 1. Questo genere di test è però inapplicabile alla
distribuzione Binomiale in quanto il parametro p deve rispettare la condizione 0 < p < 1.
Partiamo però da un principio di “buona fede” dell’aspirante lettore di pensiero e
ammettiamo che anche nelle condizioni migliori Giukas non potrebbe essere in grado di
indovinare tutte le carte a causa del cemento armato che si frappone tra la carta estratta
e la sua antenna extrasensoriale, dello stress da esame e da altri fattori.
Poniamoci allora la domanda opposta: Giukas indovina per puro caso? Poiché i
test vengono generalmente2 costruiti per rifiutare l’ipotesi nulla cercheremo di avere un
test che rifiuti l’ipotesi che il soggetto indovini a caso in favore delle capacità ESP del
soggetto. Scegliamo quindi l’ipotesi nulla come segue: H0 : p = p0 = 21 contro l’alternativa
H1 : p > 12 . Indichiamo con Xi la variabile casuale che, nella generica prova i-esima,
assume il valore 1 se Giukas indovina e 0 in caso contrario con probabilità 1 − p. Le
Xi sono quindi un campione di variabili casuali indipendenti bernoulliane di parametro p
(supponendo che sia p la vera probabilità con cui Giukas indovina le carte).
Notiamo che sotto l’ipotesi nulla (p = p0 ) sappiamo che se poniamo
n
X
Y =
Xi
i=1
allora Y è una variabile casuale Binomiale di parametri n e p0 . Inoltre ricordando che
p̂n = Y /n, abbiamo
p̂ − p0
qn
∼Z
p0 (1−p0 )
n
e ancora una volta ci siamo ricondotti alla variabile casuale Z.
Costruire il test per H0 : p = p0 = 21 contro l’alternativa H1 : p > 12 vuol dire rifiutare
l’ipotesi nulla se la distanza tra p̂n e p0 (opportunamente standardizzata) è molto elevata.
Cosa si intenda per “molto” lo specifichiamo attraverso la probabilità imponendo che il
nostro test sia significativo ad un certo livello α. Cioè, come ricordato nell’introduzione,
cerchiamo quel valore z1−α tale che
P (Z > z1−α ) = α
Il nostro test rifiuterà l’ipotesi nulla che si tratti del puro effetto del caso – il fatto che
Giukas abbia indovinato 32 carte su 50 – se
p̂n − p0
z=q
> z1−α
p0 (1−p0 )
n
Vediamo allora quanto vale z, cioè il valore assunto dalla variabile casuale Z nel nostro
campione:
32
−1
0.64 − 0.5
q 1 12 = q
z = 50
= 1.97
·
50
2 2
2Questa
1
200
affermazione è opinabile se si cambia il paradigma statistisco di riferimento ma, ai fini di
queste lezioni, può ritenersi valida.
1. LA VERIFICA DELLE IPOTESI
11
α = 0.05
α = 0.01
p
1.65
1.97
2.33
Figura 4. In grigio è segnata l’area sotto la curva Gaussiana che corrisponde
al p-value, cioè a destra di 1.97. A destra di 1.65 si trova la regione di rifiuto del
test al livello α = 5% e a destra di 2.33 quella del test al livello α = 1%.
Se vogliamo un test che ci garantisce un errore massimo dell 1%, (cioè poniamo α = 0.01)
il quantile da considerare è z1−α = z0.99 = 2.33. La regola del test ci dice di rifiutare H0 se
z > z1−α . Nel nostro caso otteniamo 1.97 < 2.33, quindi non possiamo rifiutare l’ipotesi
nulla e non possiamo concludere che Giukas sia dotato di ESP, ovvero, qualsiasi altra
persona avrebbepotuto indovinare lo stesso numero di carte di Giukas per puro effetto
del caso p0 = 21 .
Se ci poniamo in condizioni meno restrittive accettando un errore pari a α = 5%,
ricaviamo che il quantile è z1−α = z0.95 = 1.65 e il test ci suggerisce di rifiutare l’ipotesi
nulla in favore di presunte capacità paranormali di Giukas (infatti 1.97 > 1.65).
Questo è un tipico caso di incertezza: a quale delle due conclusioni dar fede? Un
modo per capire quale delle due conclusioni sia più attendibile è fare ricorso al calcolo3
del p-value. Il p-value è quel valore della probabilità che si ha nella coda di destra della
distribuzione di Z a partire dal valore z che il test ci ha fornito. In sostanza si calcola
come segue
p = P (Z > z) = P (Z > 1.97) = 1 − Φ(1.97) = 1 − 0.976 = 0.024
Se avessimo fissato un livello di significatività pari a p = 2.4% il test avrebbe comunque
rifiutato l’ipotesi nulla. Quindi il p-value è il massimo livello di α che avremmo potuto
fissare che ci avrebbe permesso di rifiutare l’ipotesi nulla H0 alla luce dei nostri dati.
3Tutti
i software statistici forniscono come indicazione solo il valore del p-value del test e non i livelli
di significatività. Quindi è importante saper districarsi con questa nozione.
12
Quindi, se abbiamo scelto un livello di significatività α ≤ p “accettiamo” H0 , mentre se
α > p rifiutiamo H0 . Si veda in proposito la Figura 4.
Per risolvere l’enigma di Giukas, si può utilizzare come regola empirica la seguente: ci
fidiamo della decisione del test il cui errore α è più lontano al p-value calcolato.
Nel nostro caso 0.024 è più vicino a 0.01 che a 0.05 e quindi accettiamo la decisione del
primo test: Giukas non è dotato di poteri paranormali. Uno studio più scrupoloso chiederebbe di ripetere più volte l’esperimento e non di limitarsi ad un solo esame concludendo
solo sulla base del p-value.
Esercizio 5. Una ditta farmaceutica reclamizza un prodotto da banco che, si dice nel
comunicato pubblicitario, è in grado di mitigare gli effetti dell’età riducendo di un fattore 2
gli inestetismi (le rughe) del viso nel 90% dei casi. Per verificare che quanto pubblicizzato
sia vero, si estrae a caso un campione di 200 individui a cui viene somministrata l’intera
“cura” di ringiovanimento. Alla fine del test, ben 160 di questi 200 individui hanno
ottenuto la riduzione dichiarata dalla ditta farmaceutica. Si può quindi affermare sulla
base di questo esperimento che quanto dice il venditore sia vero?
Indichiamo con p la probabilità che un individuo sottoposto alla cura benefici del
trattamento di riduzione degli inestetismi. Poniamo come ipotesi nulla H0 : p = 0.9 e
come ipotesi alternativa H1 : p < 0.9 questo per mettere in evidenza eventuali problemi.
Abbiamo dunque un test ad una coda sulle proporzioni. Il campione di 200 indivui ha
160
fornito come risultato p̂n = 200
= 0.8. Calcoliamo la statistica z
p̂n − p0
0.8 − 0.9
z=q
= −4.71
= q
p0 (1−p0 )
n
0.9·0.1
200
Se usiamo un test di livello 1%, il valore soglia al di sotto del quale rifutare è z0.01 = −2.33,
poiché z < z0.01 rifiutiamo l’ipotesi nulla che il trattamento ha un effetto nel 90% dei casi
in favore dell’ipotesi alternativa che l’efficacia sia minore.
Fly UP