note PDF - Università degli Studi di Milano

by user

on 06 июля 2016

Category: Documents

>> Downloads: 2

views

Report

Comments

Description

Download note PDF - Università degli Studi di Milano

Transcript

note PDF - Università degli Studi di Milano

1. La verifica delle ipotesi
Nelle due sezioni precedenti abbiamo visto che la media campionaria è un buon stimatore del valore atteso della distribuzione da cui provengono i dati ed è stato anche
possibile controllare la variabilità, cioè la precisione, del nostro stimatore attraverso gli
intervalli di confidenza. Questi ultimi, come abbiamo visto, sono centrati attorno al valore
assunto dalla media campionaria.
Il problema di cui ci occuperemo ora è il seguente: supponiamo di avere un’idea
di quale possa essere il valore incognito di una media (magari perché stiamo ripetendo
uno stesso esperimento a distanza di tempo) e studiamo una strategia che, sulla base
dei dati osservati, ci permetta di giungere ad una conferma o una smentita della nostra
supposizione iniziale. Cioè ci stiamo occupando di sottoporre a verifica una ipotesi.
1.1. Test d’ipotesi per la media. Supponiamo di avere un campione i.i.d. di variabili casuali normali di media µ incognita e varianza nota σ 2 . Ci proponiamo di sottoporre
a verifica l’ipotesi (statistica) che il vero valore incognito della media sia µ0 . Indichiamo
con H0 questa ipotesi che nel seguito denomineremo ipotesi nulla. Dal campione noi possiamo ricavare il valore della media campionaria X̄n che, come sappiamo, si distribuisce
come una N (µ, σ 2 /n).
Se per un dato campione avessimo x̄n = µ0 la nostra fiducia che sia proprio µ0 il
valore incognito di µ sarebbe massima ma, in generale, osserveremo dei valori x̄n che
sono, magari di poco, diversi da µ0 . Una procedura di test quindi, si occuperà di valutare
se la distanza tra x̄n e µ0 è poco o molto elevata. Passando alle variabili aleatorie, il test
si occuperà di verificare che la distanza |X̄n − µ0 | non sia troppo elevata (in probabilità).
Alla fine della procedura un test conduce sempre a due sole alternative: o rifiutiamo
l’ipotesi nulla H0 , oppure la accettiamo (o più correttamente non la rifiutiamo). Se
rifiutiamo l’ipotesi nulla quando questa è falsa non commettiamo errori, cosı̀ come quando
non la rifiutiamo se questa è vera. Ci sono però altre due situazioni che conducono ad
errori: se l’ipotesi nulla è vera e noi la rifiutiamo attraverso il test stiamo commettendo
un errore. Tale errore prende il nome di errore di Io tipo o di Ia specie. La possibilità
di commettere errori, come al solito, è legata al fatto che le nostre decisioni sono prese
sulla base di un campione, ciò vuol dire che, se estraiamo un campione “sfavorevole”, la
distanza x̄n − µ0 può risultare troppo grande per puro effetto del caso (o della scalogna!).
Poichè all’incertezza noi associamo sempre una probabilità, abbiamo di conseguenza una
certa probabilità di commettere un errore di primo tipo. Tale probabilità viene indicata
con α.
L’altro tipo di errore, detto di secondo tipo, si commette quando accettiamo l’ipotesi
nulla ma la stessa è falsa. Con β si indica, in genere, la probabilità di commettere tale
errore. Riassumiamo quanto visto in una tabella
1
2
Rifiuto H0
Non Rifuto H0
o
è vera H0 errore I tipo
nessun errore
α
1−α
è falsa H0 nessun errore errore di IIo tipo
1−β
β
Possiamo quindi scrivere che l’errore di primo tipo è null’altro se non la seguente
probabilità
α = P (rifiutare H0 |H0 è vera)
Torniamo all’esempio della media. La regola che possiamo introdurre è del tipo “se X̄n −µ0
è maggiore di un certo valore k rifiutiamo l’ipotesi nulla H0 : µ = µ0 in favore dell’ipotesi
alternativa H1 : µ 6= µ0 ”. Quando si effettua un test è sempre necessario specificare sia
l’ipotesi nulla che quella alternativa. In particolare, la specificazione dell’ipotesi alternativa ci permette di calcolare, o meglio fissare, l’errore di primo tipo. Esattamente come
per gli intervalli di confidenza in cui viene fissato il livello di confidenza, nei test si può
fissare il livello di significatività α. Infatti, fissato α il nostro test deve essere costruito in
modo tale da rifiutare H0 quando questa è vera con probabilità α. Se scegliamo la regola
si rifiuta H0 quando |X̄n − µ0 | > k allora sarà
P (|X̄n − µ0 | > k|H0 ) = α
Da questa relazione siamo in grado di calcolare k = kα che viene anche denominato valore
soglia del test. √Ecco come si procede: quando è vera H0 allora X̄n ∼ N (µ0 , σ 2 /n), quindi
(X̄n − µ0 )/(σ/ n) ∼ N (0, 1). Allora
!
X̄ − µ k
n
0
>
α = P (|X̄n − µ0 | > k|H0 ) = P H0
√σ √σn n
!
!
(1)
k
k
k
= P |Z| > σ
=P Z<− σ eZ> σ
√
√
n
n
√
n
Le ultime due espressioni
indicano
√
√ semplicemente che Z deve trovarsi al di fuori dell’intervallo (−k/(σ/ n), +k/(σ/
n)) e che questo deve avvenire con probabilità α. In
√
n)
è
quel
valore di z tale per cui Φ(z) = α/2 cioè z = zα/2 .
sostanza, il punto −k/(σ/
√
Mentre il punto k/(σ/ n) è quel valore di z che lascia alla sua destra 1 − α/2 ovvero
Φ(z) = 1 − α/2, dunque z = z1−α/2 . Si veda a riguardo la Figura 1. Poiché, come già
visto anche con gli intervalli di confidenza, si può sfruttare la simmetria di Z, il valore k
che ci interessa si trova come segue
k
√σ
n
= z1− α2
e dunque
(2)
σ
k = √ · z1− α2 .
n
1. LA VERIFICA DELLE IPOTESI
3
Regione
di rifiuto
Regione
di rifiuto
α
α
Regione di accettazione
2
2
zα
0
2
z1−α
2
Figura 1. Regione di rifiuto e accettazione di H0 : µ = µ0 per un test a due
code del tipo H1 : µ 6= µ0 .
Non ci resta che tirare le somme. Indichiamo con Z la statistica test
Z=
X̄n − µ0
√σ
n
Se per un dato campione calcoliamo un valore z di Z ottenuto come segue
z=
x̄n − µ0
√σ
n
il test ci dice di rifiutare l’ipotesi nulla H0 : µ = µ0 in favore di H1 : µ 6= µ0 se z cade
all’esterno dell’intervallo chiamato zona di rifiuto del test: (−z1− α2 , z1− α2 ) infatti basta
sostituire il valore soglia k ottenuto in (2) nella formula dell’errore di primo tipo (1).
Questo tipo di test è anche denominato test a due code.
4
Test sulla media (σ 2 nota)
Sia X una variabile casuale normale di media incognita µ e varianza σ 2 nota. Se
X1 , X2 , . . . , Xn è un campione i.i.d. estratto da X allora il test per la verifica di ipotesi
del tipo
H 0 : µ = µ0
H1 : µ 6= µ0
ha un livello di significatività α se corrisponde alla seguente regola di decisione
Rifiutare H0 se |z| > z1− α2
dove
z=
x̄n − µ0
√σ
n
Vi possono essere altri due tipi di ipotesi alternative della forma H1 : µ < µ0 e
H1 : µ > µ0 . In tal caso il test è sempre basato sulla statistica Z vista sopra ma sarà
differente il valore soglia. Vediamo cosa accade ad un test con ipotesi nulla H0 : µ =
µ0 contro un’alternativa H1 : µ > µ0 . Notiamo subito che un test ragionevole deve
essere un test che ci condurrà al rifiuto dell’ipotesi nulla quando la distanza tra X̄n e il
valore ipotizzato µ0 risulta essere troppo elevata per eccesso, quindi per trovare la soglia
scriveremo, tralasciando alcuni passaggi, quanto segue:
α = P (X̄n − µ0 > k|H0 ) = P
Z>
k
!
√σ
n
√
in questo caso k/(σ/ n) è quel valore di z che lascia alla sua sinistra un’area pari a 1 − α,
cioè lo z tale per cui Φ(z) = 1 − α. Quindi per determinare k scriveremo
k
√σ
n
= z1−α
e dunque il nostro test rifiuterà l’ipotesi nulla se
z=
x̄n − µ0
√σ
n
> z1−α
Si veda in proposito la Figura 3.
Analogamente, se l’ipotesi alternativa è H1 : µ < µ0 il nostro test rifiuterà per valori di
z troppo piccoli e in particolare quando z < zα . Si veda a riguardo la Figura 3. Entrambi
i tipi di test vengono detti test ad una coda. Riassumiamo ora quanto segue in un unico
schema
1. LA VERIFICA DELLE IPOTESI
5
Regione
di rifiuto
Regione di accettazione
0
α
z1−α
Figura 2. Regione di rifiuto e accettazione di H0 : µ = µ0 per un test ad una
coda del tipo H1 : µ > µ0 .
Test sulla media (σ 2 nota)
Sia X una variabile casuale normale di media incognita µ e varianza σ 2 nota. Se
X1 , X2 , . . . , Xn è un campione i.i.d. estratto da X allora il test di livello α, per la verifica
di ipotesi del tipo H0 : µ = µ0 , ha la seguente forma a seconda delle alternative:
quando H1 : µ 6= µ0 , Rifiutare H0 se |z| > z1− α2
quando H1 : µ > µ0 , Rifiutare H0 se z > z1−α
quando H1 : µ < µ0 , Rifiutare H0 se z < zα
dove
z=
x̄n − µ0
√σ
n
Se la varianza non è nota, si procede come nel caso degli intervalli di confidenza sostituendo
al valore σ 2 la sua stima s̄2n e utilizzando le tavole della t di Student. Se i dati non sono
distribuiti in modo gaussiano e l’ampiezza campionaria è elevata si usa la tecnica appena
vista basata sulla statistica t ma per i valori soglia si ricorre alle tavole della Normale.
6
Regione
di rifiuto
Regione di accettazione
α
zα
0
Figura 3. Regione di rifiuto e accettazione di H0 : µ = µ0 per un test ad una
coda del tipo H1 : µ < µ0 .
Test sulla media (σ 2 incognita)
Sia X una variabile casuale Normale di media incognita µ e varianza σ 2 non nota. Se
X1 , X2 , . . . , Xn è un campione i.i.d. estratto da X allora il test di livello α, per la verifica
di ipotesi del tipo H0 : µ = µ0 , ha la seguente forma a seconda delle alternative:
n−1
quando H1 : µ 6= µ0 , Rifiutare H0 se |t| > t1−
α
2
n−1
quando H1 : µ > µ0 , Rifiutare H0 se t > t1−α
quando H1 : µ < µ0 , Rifiutare H0 se t < tn−1
α
dove
t=
x̄n − µ0
s̄n
√
n
,
s̄n =
p
s̄2n
1.2. Verifica di ipotesi sulle proporzioni. Questo caso è del tutto analogo al
problema di verifica di ipotesi per la media. Possiamo volere sottoporre ad ipotesi H0 :
p = p0 contro un’alternativa H1 : p 6= p0 . Misureremo la distanza sempre con |p̂n − p0 | e
1. LA VERIFICA DELLE IPOTESI
7
per trovare il valore soglia scriveremo quanto segue
α = P (|p̂n − p0 | > k|H0 )
l’unica differenza, rispetto anche agli intervalli di confidenza, è che se risulta vera H0 allora
p = p0 e non abbiamo bisogno di utilizzare p̂n per standardizzare la differenza p̂n − p0 .
Infatti scriveremo
α = P (|p̂n − p0 | > k|H0 )


p̂n − p0 > q k

= P  q
p0 (1−p0 )
p0 (1−p0 ) n
n


k

' P |Z| > q
p0 (1−p0 )
n
e k sarà lo stesso valore determinato per il caso del test sulla media. Abbiamo quindi
la stessa casistica del caso del test sulla media e la statistica impiegata sarà ancora una
volta la z anche se costruita in modo differente. Dunque possiamo scrivere direttamente
l’elenco delle regole di test per i vari casi.
Test sulla proporzione
Sia X una variabile casuale di Bernoulli di parametro p incognito. Se X1 , X2 , . . . , Xn è
un campione i.i.d. estratto da X allora il test di livello α, per la verifica di ipotesi del
tipo H0 : p = p0 , ha la seguente forma a seconda delle alternative:
quando H1 : p 6= p0 , Rifiutare H0 se |z| > z1− α2
quando H1 : p > p0 , Rifiutare H0 se z > z1−α
quando H1 : p < p0 , Rifiutare H0 se z < zα
dove
p̂n − p0
z=q
p0 (1−p0 )
n
Attenzione! : il test si può eseguire solo se n > 30. Inoltre, nel denominatore di z si
utilizza p0 e non p̂n per la standardizzazione.
1.3. Esercizi riepilogativi.
Esercizio 1. Il tempo medio di vita di un campione di 100 lampadine fluorescenti
prodotte da una fabbrica è stimato in 1570 h, mentre è noto, da precedenti analisi, che
lo scarto quadratico medio è pari a 120 h. Per poter immettere sul mercato interno tali
lampadine si deve indicare sulla scatola un tempo medio di vita che abbia una significatività
del 5% mentre per l’estero è necessario che sia del 1%. Verificare se il valore 1600 h è
compatibile con i due mercati.
8
Si deve costruire un test d’ipotesi per verificare l’ipotesi nulla H0 : µ = µ0 = 1600h
contro l’alternativa che la vita media sia in realtà inferiore ai parametri minimi richiesti,
cioè H1 : µ < µ0 . Poiché sappiamo che lo scarto quadratico medio è pari a 120h, si
utilizzerà il test z ad una coda. La regola del test è quindi
x̄n − µ0
Rifiutare H0 se z =
< zα
σ
√
n
1570−1600
= −2.5 mentre i quantili della Gaussiana sono z0.01 = −2.33 e
Quindi z =
120
10
z0.05 = −1.64. In entrambi i casi il test rifiuta l’ipotesi nulla, quindi ciò vuol dire che non
si possono immettere sul mercato lampadine con quei valori dichiarati sulla scatola. Se
avessimo effettuato un test a due code, la regola del test sarebbe stata
Rifiutare H0 se |z| > z1−α/2
e in tal caso z0.975 = 1.96 e z0.995 = 2.57 avremmo rifiutato al livello 5% ma accettato al
livello 1%. Il valore -2.5 è molto vicino alla soglia di rifiuto del test di livello 1% e quindi
comunque il buon senso ci avrebbe portato a rifiutare l’ipotesi nulla.
Esercizio 2. Le resistenze alla rottura delle funi prodotte da una fabbrica hanno
media pari a 1800 N . Immettendo una nuova tecnica nel processo produttivo, si pensa
che la resistenza alla rottura possa essere accresciuta. Per provare ciò, si prende un
campione di 50 funi e si trova che la resistenza media alla rottura è di 1850 N mentre
lo scarto quadratico medio è stimato in 100 N . Si può pensare che vi sia stato un reale
miglioramento al livello di significatività dell’ 1%?
In questo secondo test, la varianza è incognita e quindi stimata attraverso i dati
campionari. Il test che si costruisce sarà concepito in modo tale da rifiutare l’ipotesi nulla
contrariamente al caso precedente in cui avremmo preferito non rifutarla. Costruiamo un
test per verificare l’ipotesi nulla H0 che la qualità dei materiali sia rimasta invariata, cioè
H0 : µ = µ0 = 1800N contro l’alternativa H1 : µ > µ0 . Quindi rifiutare vuol dire che si
certifica un aumento di qualità del prodotto. Si usa il test t con n − 1 gradi di libertà.
La regola del test è la seguente
x̄n − µ0
n−1
Rifiutare H0 se t =
> t1−α
s̄n
√
Nel nostro caso t =
1850−1800
100
√
50
n
40
= 3.54 e t49
0.99 < 2.423 = t0.99 quindi rifiutiamo l’ipotesi nulla
(anche un test al 5% avrebbe dato lo stesso risultato).
Esercizio 3. Un esperto di organizzazione aziendale afferma che l’introduzione di una
nuova procedura amministrativa può ridurre in modo sostanziale il tempo di completamento di una pratica amministrativa. A causa dei costi aggiuntivi di esercizio (personale e
attrezzature) la direzione dell’azienda decide di adottare la nuova procedura a condizione
che la riduzione dei tempi di espletamento delle pratiche risulti di almeno l’8%. Vengono
1. LA VERIFICA DELLE IPOTESI
9
fatti 6 esperimenti e si trova che la riduzione media di smaltimento è dell’8.4% con una
deviazione standard dello 0.32%. Decidere se, sulla base di questi risultati, all’azienda
conviene adottare la nuova procedura oppure no.
Siamo di fronte ad un test ad una coda in cui l’ipotesi nulla è H0 : µ = 0.08 contro
un’alternativa H1 : µ > 0.08. Costruito in questo modo, il test permette all’esperto di
organizzazione aziendale di convincere l’azienda ad adottare la nuova procedura nel caso
si riesca a rifiutare l’ipotesi nulla H0 . Calcoliamo la statistica t
x̄n − µ0
0.084 − 0.08
t= q
=
= 3.06
0.0032
s̄2n
n
√
6
n−1
Il test rifiuta l’ipotesi nulla quando t > t1−α
. Quindi, con un test di livello α = 1% si
5
ha t0.99 = 3.14267 > 3.06 e quindi non si rifiuta l’ipotesi nulla poiché il valore 3.06 cade
all’interno della regione di accetazione del test. Se invece eseguiamo un test di livello
α = 0.05, il valore soglia è t50.95 = 2.01 ed in questo caso il test ci permette di rifiutare H0
in quanto t = 3.06 > 2.01.
Esercizio 4. Alla vostra festa di compleanno si presenta Giukas, un amico, il quale
sostiene di avere poteri paranormali. In particolare, il tale afferma di poter leggere nel
pensiero delle persone. Ci proponiamo allora di mettere alla prova le qualità extrasensoriali di Giukas attraverso il metodo statistico e costruiamo un esperimento in modo tale
da evidenziare eventuali frodi. Prendiamo un mazzo di 40 carte (20 di colore rosso e
20 di colore nero) e ci sistemiamo in una stanza ben separata da dove si trova Giukas.
Estraiamo in successione una carta, guardiamo di quale colore è, e prima di rimetterla nel
mazzo chiediamo a Giukas di indovinare il colore della carta dall’altra stanza. Dopo 50
estrazioni ripetute, Giukas ha indovinato 32 carte su 50. La platea applaude contenta. Ci
chiediamo se, alla luce di tali risultati, si possa sostenere che Giukas possegga realmente
poteri paranormali (cioè sia dotato di ESP1 positivo).
Vediamo di formalizzare meglio l’esperimento. Abbiamo una successione di 50 prove
ripetute che, si suppone, sono state effettuate nelle stesse condizioni ed in modo indipendente tra loro. Ad ogni prova possiamo avere solo due esiti: Giukas indovina o non
indovina la carta estratta. Pensiamo all’evento indovina come ad un successo. Siamo
quindi di fronte ad uno schema Binomiale con n = 50 prove e p la probabilità a priori che
Giukas indovini la carta estratta in ciascuna prova.
A rigor di logica, se l’indovino fosse dotato di poteri paranormali, la probabilità di
indovinare la carta estratta dovrebbe essere pari ad 1 e quindi Giukas dovrebbe indovinare
50 carte su 50. Potremmo quindi costruire un test in cui l’ipotesi da sottoporre a verifica
1Extra
Sensory Perception. Un esperimento simile fu realmente condotto durante le missioni Apollo
dalla NASA. L’astronauta a bordo del modulo orbitante attorno alla Luna estraeva una carta e un secondo
astronauta nel modulo lunare LEM (posato sulla superficie lunare) doveva indovinare di quale carta si
trattasse. I risultati furono disastrosi con una percentuale di risposte sbagliate talmente elevata che i
sostenitori delle teorie paranormali coniarono per l’occasione il termine ESP “negativo” !
10
è H0 : p = 1 contro l’ipotesi H1 : p < 1. Questo genere di test è però inapplicabile alla
distribuzione Binomiale in quanto il parametro p deve rispettare la condizione 0 < p < 1.
Partiamo però da un principio di “buona fede” dell’aspirante lettore di pensiero e
ammettiamo che anche nelle condizioni migliori Giukas non potrebbe essere in grado di
indovinare tutte le carte a causa del cemento armato che si frappone tra la carta estratta
e la sua antenna extrasensoriale, dello stress da esame e da altri fattori.
Poniamoci allora la domanda opposta: Giukas indovina per puro caso? Poiché i
test vengono generalmente2 costruiti per rifiutare l’ipotesi nulla cercheremo di avere un
test che rifiuti l’ipotesi che il soggetto indovini a caso in favore delle capacità ESP del
soggetto. Scegliamo quindi l’ipotesi nulla come segue: H0 : p = p0 = 21 contro l’alternativa
H1 : p > 12 . Indichiamo con Xi la variabile casuale che, nella generica prova i-esima,
assume il valore 1 se Giukas indovina e 0 in caso contrario con probabilità 1 − p. Le
Xi sono quindi un campione di variabili casuali indipendenti bernoulliane di parametro p
(supponendo che sia p la vera probabilità con cui Giukas indovina le carte).
Notiamo che sotto l’ipotesi nulla (p = p0 ) sappiamo che se poniamo
n
X
Y =
Xi
i=1
allora Y è una variabile casuale Binomiale di parametri n e p0 . Inoltre ricordando che
p̂n = Y /n, abbiamo
p̂ − p0
qn
∼Z
p0 (1−p0 )
n
e ancora una volta ci siamo ricondotti alla variabile casuale Z.
Costruire il test per H0 : p = p0 = 21 contro l’alternativa H1 : p > 12 vuol dire rifiutare
l’ipotesi nulla se la distanza tra p̂n e p0 (opportunamente standardizzata) è molto elevata.
Cosa si intenda per “molto” lo specifichiamo attraverso la probabilità imponendo che il
nostro test sia significativo ad un certo livello α. Cioè, come ricordato nell’introduzione,
cerchiamo quel valore z1−α tale che
P (Z > z1−α ) = α
Il nostro test rifiuterà l’ipotesi nulla che si tratti del puro effetto del caso – il fatto che
Giukas abbia indovinato 32 carte su 50 – se
p̂n − p0
z=q
> z1−α
p0 (1−p0 )
n
Vediamo allora quanto vale z, cioè il valore assunto dalla variabile casuale Z nel nostro
campione:
32
−1
0.64 − 0.5
q 1 12 = q
z = 50
= 1.97
·
50
2 2
2Questa
1
200
affermazione è opinabile se si cambia il paradigma statistisco di riferimento ma, ai fini di
queste lezioni, può ritenersi valida.
1. LA VERIFICA DELLE IPOTESI
11
α = 0.05
α = 0.01
p
1.65
1.97
2.33
Figura 4. In grigio è segnata l’area sotto la curva Gaussiana che corrisponde
al p-value, cioè a destra di 1.97. A destra di 1.65 si trova la regione di rifiuto del
test al livello α = 5% e a destra di 2.33 quella del test al livello α = 1%.
Se vogliamo un test che ci garantisce un errore massimo dell 1%, (cioè poniamo α = 0.01)
il quantile da considerare è z1−α = z0.99 = 2.33. La regola del test ci dice di rifiutare H0 se
z > z1−α . Nel nostro caso otteniamo 1.97 < 2.33, quindi non possiamo rifiutare l’ipotesi
nulla e non possiamo concludere che Giukas sia dotato di ESP, ovvero, qualsiasi altra
persona avrebbepotuto indovinare lo stesso numero di carte di Giukas per puro effetto
del caso p0 = 21 .
Se ci poniamo in condizioni meno restrittive accettando un errore pari a α = 5%,
ricaviamo che il quantile è z1−α = z0.95 = 1.65 e il test ci suggerisce di rifiutare l’ipotesi
nulla in favore di presunte capacità paranormali di Giukas (infatti 1.97 > 1.65).
Questo è un tipico caso di incertezza: a quale delle due conclusioni dar fede? Un
modo per capire quale delle due conclusioni sia più attendibile è fare ricorso al calcolo3
del p-value. Il p-value è quel valore della probabilità che si ha nella coda di destra della
distribuzione di Z a partire dal valore z che il test ci ha fornito. In sostanza si calcola
come segue
p = P (Z > z) = P (Z > 1.97) = 1 − Φ(1.97) = 1 − 0.976 = 0.024
Se avessimo fissato un livello di significatività pari a p = 2.4% il test avrebbe comunque
rifiutato l’ipotesi nulla. Quindi il p-value è il massimo livello di α che avremmo potuto
fissare che ci avrebbe permesso di rifiutare l’ipotesi nulla H0 alla luce dei nostri dati.
3Tutti
i software statistici forniscono come indicazione solo il valore del p-value del test e non i livelli
di significatività. Quindi è importante saper districarsi con questa nozione.
12
Quindi, se abbiamo scelto un livello di significatività α ≤ p “accettiamo” H0 , mentre se
α > p rifiutiamo H0 . Si veda in proposito la Figura 4.
Per risolvere l’enigma di Giukas, si può utilizzare come regola empirica la seguente: ci
fidiamo della decisione del test il cui errore α è più lontano al p-value calcolato.
Nel nostro caso 0.024 è più vicino a 0.01 che a 0.05 e quindi accettiamo la decisione del
primo test: Giukas non è dotato di poteri paranormali. Uno studio più scrupoloso chiederebbe di ripetere più volte l’esperimento e non di limitarsi ad un solo esame concludendo
solo sulla base del p-value.
Esercizio 5. Una ditta farmaceutica reclamizza un prodotto da banco che, si dice nel
comunicato pubblicitario, è in grado di mitigare gli effetti dell’età riducendo di un fattore 2
gli inestetismi (le rughe) del viso nel 90% dei casi. Per verificare che quanto pubblicizzato
sia vero, si estrae a caso un campione di 200 individui a cui viene somministrata l’intera
“cura” di ringiovanimento. Alla fine del test, ben 160 di questi 200 individui hanno
ottenuto la riduzione dichiarata dalla ditta farmaceutica. Si può quindi affermare sulla
base di questo esperimento che quanto dice il venditore sia vero?
Indichiamo con p la probabilità che un individuo sottoposto alla cura benefici del
trattamento di riduzione degli inestetismi. Poniamo come ipotesi nulla H0 : p = 0.9 e
come ipotesi alternativa H1 : p < 0.9 questo per mettere in evidenza eventuali problemi.
Abbiamo dunque un test ad una coda sulle proporzioni. Il campione di 200 indivui ha
160
fornito come risultato p̂n = 200
= 0.8. Calcoliamo la statistica z
p̂n − p0
0.8 − 0.9
z=q
= −4.71
= q
p0 (1−p0 )
n
0.9·0.1
200
Se usiamo un test di livello 1%, il valore soglia al di sotto del quale rifutare è z0.01 = −2.33,
poiché z < z0.01 rifiutiamo l’ipotesi nulla che il trattamento ha un effetto nel 90% dei casi
in favore dell’ipotesi alternativa che l’efficacia sia minore.