Comments
Transcript
note PDF - Università degli Studi di Milano
1. La verifica delle ipotesi Nelle due sezioni precedenti abbiamo visto che la media campionaria è un buon stimatore del valore atteso della distribuzione da cui provengono i dati ed è stato anche possibile controllare la variabilità, cioè la precisione, del nostro stimatore attraverso gli intervalli di confidenza. Questi ultimi, come abbiamo visto, sono centrati attorno al valore assunto dalla media campionaria. Il problema di cui ci occuperemo ora è il seguente: supponiamo di avere un’idea di quale possa essere il valore incognito di una media (magari perché stiamo ripetendo uno stesso esperimento a distanza di tempo) e studiamo una strategia che, sulla base dei dati osservati, ci permetta di giungere ad una conferma o una smentita della nostra supposizione iniziale. Cioè ci stiamo occupando di sottoporre a verifica una ipotesi. 1.1. Test d’ipotesi per la media. Supponiamo di avere un campione i.i.d. di variabili casuali normali di media µ incognita e varianza nota σ 2 . Ci proponiamo di sottoporre a verifica l’ipotesi (statistica) che il vero valore incognito della media sia µ0 . Indichiamo con H0 questa ipotesi che nel seguito denomineremo ipotesi nulla. Dal campione noi possiamo ricavare il valore della media campionaria X̄n che, come sappiamo, si distribuisce come una N (µ, σ 2 /n). Se per un dato campione avessimo x̄n = µ0 la nostra fiducia che sia proprio µ0 il valore incognito di µ sarebbe massima ma, in generale, osserveremo dei valori x̄n che sono, magari di poco, diversi da µ0 . Una procedura di test quindi, si occuperà di valutare se la distanza tra x̄n e µ0 è poco o molto elevata. Passando alle variabili aleatorie, il test si occuperà di verificare che la distanza |X̄n − µ0 | non sia troppo elevata (in probabilità). Alla fine della procedura un test conduce sempre a due sole alternative: o rifiutiamo l’ipotesi nulla H0 , oppure la accettiamo (o più correttamente non la rifiutiamo). Se rifiutiamo l’ipotesi nulla quando questa è falsa non commettiamo errori, cosı̀ come quando non la rifiutiamo se questa è vera. Ci sono però altre due situazioni che conducono ad errori: se l’ipotesi nulla è vera e noi la rifiutiamo attraverso il test stiamo commettendo un errore. Tale errore prende il nome di errore di Io tipo o di Ia specie. La possibilità di commettere errori, come al solito, è legata al fatto che le nostre decisioni sono prese sulla base di un campione, ciò vuol dire che, se estraiamo un campione “sfavorevole”, la distanza x̄n − µ0 può risultare troppo grande per puro effetto del caso (o della scalogna!). Poichè all’incertezza noi associamo sempre una probabilità, abbiamo di conseguenza una certa probabilità di commettere un errore di primo tipo. Tale probabilità viene indicata con α. L’altro tipo di errore, detto di secondo tipo, si commette quando accettiamo l’ipotesi nulla ma la stessa è falsa. Con β si indica, in genere, la probabilità di commettere tale errore. Riassumiamo quanto visto in una tabella 1 2 Rifiuto H0 Non Rifuto H0 o è vera H0 errore I tipo nessun errore α 1−α è falsa H0 nessun errore errore di IIo tipo 1−β β Possiamo quindi scrivere che l’errore di primo tipo è null’altro se non la seguente probabilità α = P (rifiutare H0 |H0 è vera) Torniamo all’esempio della media. La regola che possiamo introdurre è del tipo “se X̄n −µ0 è maggiore di un certo valore k rifiutiamo l’ipotesi nulla H0 : µ = µ0 in favore dell’ipotesi alternativa H1 : µ 6= µ0 ”. Quando si effettua un test è sempre necessario specificare sia l’ipotesi nulla che quella alternativa. In particolare, la specificazione dell’ipotesi alternativa ci permette di calcolare, o meglio fissare, l’errore di primo tipo. Esattamente come per gli intervalli di confidenza in cui viene fissato il livello di confidenza, nei test si può fissare il livello di significatività α. Infatti, fissato α il nostro test deve essere costruito in modo tale da rifiutare H0 quando questa è vera con probabilità α. Se scegliamo la regola si rifiuta H0 quando |X̄n − µ0 | > k allora sarà P (|X̄n − µ0 | > k|H0 ) = α Da questa relazione siamo in grado di calcolare k = kα che viene anche denominato valore soglia del test. √Ecco come si procede: quando è vera H0 allora X̄n ∼ N (µ0 , σ 2 /n), quindi (X̄n − µ0 )/(σ/ n) ∼ N (0, 1). Allora ! X̄ − µ k n 0 > α = P (|X̄n − µ0 | > k|H0 ) = P H0 √σ √σn n ! ! (1) k k k = P |Z| > σ =P Z<− σ eZ> σ √ √ n n √ n Le ultime due espressioni indicano √ √ semplicemente che Z deve trovarsi al di fuori dell’intervallo (−k/(σ/ n), +k/(σ/ n)) e che questo deve avvenire con probabilità α. In √ n) è quel valore di z tale per cui Φ(z) = α/2 cioè z = zα/2 . sostanza, il punto −k/(σ/ √ Mentre il punto k/(σ/ n) è quel valore di z che lascia alla sua destra 1 − α/2 ovvero Φ(z) = 1 − α/2, dunque z = z1−α/2 . Si veda a riguardo la Figura 1. Poiché, come già visto anche con gli intervalli di confidenza, si può sfruttare la simmetria di Z, il valore k che ci interessa si trova come segue k √σ n = z1− α2 e dunque (2) σ k = √ · z1− α2 . n 1. LA VERIFICA DELLE IPOTESI 3 Regione di rifiuto Regione di rifiuto α α Regione di accettazione 2 2 zα 0 2 z1−α 2 Figura 1. Regione di rifiuto e accettazione di H0 : µ = µ0 per un test a due code del tipo H1 : µ 6= µ0 . Non ci resta che tirare le somme. Indichiamo con Z la statistica test Z= X̄n − µ0 √σ n Se per un dato campione calcoliamo un valore z di Z ottenuto come segue z= x̄n − µ0 √σ n il test ci dice di rifiutare l’ipotesi nulla H0 : µ = µ0 in favore di H1 : µ 6= µ0 se z cade all’esterno dell’intervallo chiamato zona di rifiuto del test: (−z1− α2 , z1− α2 ) infatti basta sostituire il valore soglia k ottenuto in (2) nella formula dell’errore di primo tipo (1). Questo tipo di test è anche denominato test a due code. 4 Test sulla media (σ 2 nota) Sia X una variabile casuale normale di media incognita µ e varianza σ 2 nota. Se X1 , X2 , . . . , Xn è un campione i.i.d. estratto da X allora il test per la verifica di ipotesi del tipo H 0 : µ = µ0 H1 : µ 6= µ0 ha un livello di significatività α se corrisponde alla seguente regola di decisione Rifiutare H0 se |z| > z1− α2 dove z= x̄n − µ0 √σ n Vi possono essere altri due tipi di ipotesi alternative della forma H1 : µ < µ0 e H1 : µ > µ0 . In tal caso il test è sempre basato sulla statistica Z vista sopra ma sarà differente il valore soglia. Vediamo cosa accade ad un test con ipotesi nulla H0 : µ = µ0 contro un’alternativa H1 : µ > µ0 . Notiamo subito che un test ragionevole deve essere un test che ci condurrà al rifiuto dell’ipotesi nulla quando la distanza tra X̄n e il valore ipotizzato µ0 risulta essere troppo elevata per eccesso, quindi per trovare la soglia scriveremo, tralasciando alcuni passaggi, quanto segue: α = P (X̄n − µ0 > k|H0 ) = P Z> k ! √σ n √ in questo caso k/(σ/ n) è quel valore di z che lascia alla sua sinistra un’area pari a 1 − α, cioè lo z tale per cui Φ(z) = 1 − α. Quindi per determinare k scriveremo k √σ n = z1−α e dunque il nostro test rifiuterà l’ipotesi nulla se z= x̄n − µ0 √σ n > z1−α Si veda in proposito la Figura 3. Analogamente, se l’ipotesi alternativa è H1 : µ < µ0 il nostro test rifiuterà per valori di z troppo piccoli e in particolare quando z < zα . Si veda a riguardo la Figura 3. Entrambi i tipi di test vengono detti test ad una coda. Riassumiamo ora quanto segue in un unico schema 1. LA VERIFICA DELLE IPOTESI 5 Regione di rifiuto Regione di accettazione 0 α z1−α Figura 2. Regione di rifiuto e accettazione di H0 : µ = µ0 per un test ad una coda del tipo H1 : µ > µ0 . Test sulla media (σ 2 nota) Sia X una variabile casuale normale di media incognita µ e varianza σ 2 nota. Se X1 , X2 , . . . , Xn è un campione i.i.d. estratto da X allora il test di livello α, per la verifica di ipotesi del tipo H0 : µ = µ0 , ha la seguente forma a seconda delle alternative: quando H1 : µ 6= µ0 , Rifiutare H0 se |z| > z1− α2 quando H1 : µ > µ0 , Rifiutare H0 se z > z1−α quando H1 : µ < µ0 , Rifiutare H0 se z < zα dove z= x̄n − µ0 √σ n Se la varianza non è nota, si procede come nel caso degli intervalli di confidenza sostituendo al valore σ 2 la sua stima s̄2n e utilizzando le tavole della t di Student. Se i dati non sono distribuiti in modo gaussiano e l’ampiezza campionaria è elevata si usa la tecnica appena vista basata sulla statistica t ma per i valori soglia si ricorre alle tavole della Normale. 6 Regione di rifiuto Regione di accettazione α zα 0 Figura 3. Regione di rifiuto e accettazione di H0 : µ = µ0 per un test ad una coda del tipo H1 : µ < µ0 . Test sulla media (σ 2 incognita) Sia X una variabile casuale Normale di media incognita µ e varianza σ 2 non nota. Se X1 , X2 , . . . , Xn è un campione i.i.d. estratto da X allora il test di livello α, per la verifica di ipotesi del tipo H0 : µ = µ0 , ha la seguente forma a seconda delle alternative: n−1 quando H1 : µ 6= µ0 , Rifiutare H0 se |t| > t1− α 2 n−1 quando H1 : µ > µ0 , Rifiutare H0 se t > t1−α quando H1 : µ < µ0 , Rifiutare H0 se t < tn−1 α dove t= x̄n − µ0 s̄n √ n , s̄n = p s̄2n 1.2. Verifica di ipotesi sulle proporzioni. Questo caso è del tutto analogo al problema di verifica di ipotesi per la media. Possiamo volere sottoporre ad ipotesi H0 : p = p0 contro un’alternativa H1 : p 6= p0 . Misureremo la distanza sempre con |p̂n − p0 | e 1. LA VERIFICA DELLE IPOTESI 7 per trovare il valore soglia scriveremo quanto segue α = P (|p̂n − p0 | > k|H0 ) l’unica differenza, rispetto anche agli intervalli di confidenza, è che se risulta vera H0 allora p = p0 e non abbiamo bisogno di utilizzare p̂n per standardizzare la differenza p̂n − p0 . Infatti scriveremo α = P (|p̂n − p0 | > k|H0 ) p̂n − p0 > q k = P q p0 (1−p0 ) p0 (1−p0 ) n n k ' P |Z| > q p0 (1−p0 ) n e k sarà lo stesso valore determinato per il caso del test sulla media. Abbiamo quindi la stessa casistica del caso del test sulla media e la statistica impiegata sarà ancora una volta la z anche se costruita in modo differente. Dunque possiamo scrivere direttamente l’elenco delle regole di test per i vari casi. Test sulla proporzione Sia X una variabile casuale di Bernoulli di parametro p incognito. Se X1 , X2 , . . . , Xn è un campione i.i.d. estratto da X allora il test di livello α, per la verifica di ipotesi del tipo H0 : p = p0 , ha la seguente forma a seconda delle alternative: quando H1 : p 6= p0 , Rifiutare H0 se |z| > z1− α2 quando H1 : p > p0 , Rifiutare H0 se z > z1−α quando H1 : p < p0 , Rifiutare H0 se z < zα dove p̂n − p0 z=q p0 (1−p0 ) n Attenzione! : il test si può eseguire solo se n > 30. Inoltre, nel denominatore di z si utilizza p0 e non p̂n per la standardizzazione. 1.3. Esercizi riepilogativi. Esercizio 1. Il tempo medio di vita di un campione di 100 lampadine fluorescenti prodotte da una fabbrica è stimato in 1570 h, mentre è noto, da precedenti analisi, che lo scarto quadratico medio è pari a 120 h. Per poter immettere sul mercato interno tali lampadine si deve indicare sulla scatola un tempo medio di vita che abbia una significatività del 5% mentre per l’estero è necessario che sia del 1%. Verificare se il valore 1600 h è compatibile con i due mercati. 8 Si deve costruire un test d’ipotesi per verificare l’ipotesi nulla H0 : µ = µ0 = 1600h contro l’alternativa che la vita media sia in realtà inferiore ai parametri minimi richiesti, cioè H1 : µ < µ0 . Poiché sappiamo che lo scarto quadratico medio è pari a 120h, si utilizzerà il test z ad una coda. La regola del test è quindi x̄n − µ0 Rifiutare H0 se z = < zα σ √ n 1570−1600 = −2.5 mentre i quantili della Gaussiana sono z0.01 = −2.33 e Quindi z = 120 10 z0.05 = −1.64. In entrambi i casi il test rifiuta l’ipotesi nulla, quindi ciò vuol dire che non si possono immettere sul mercato lampadine con quei valori dichiarati sulla scatola. Se avessimo effettuato un test a due code, la regola del test sarebbe stata Rifiutare H0 se |z| > z1−α/2 e in tal caso z0.975 = 1.96 e z0.995 = 2.57 avremmo rifiutato al livello 5% ma accettato al livello 1%. Il valore -2.5 è molto vicino alla soglia di rifiuto del test di livello 1% e quindi comunque il buon senso ci avrebbe portato a rifiutare l’ipotesi nulla. Esercizio 2. Le resistenze alla rottura delle funi prodotte da una fabbrica hanno media pari a 1800 N . Immettendo una nuova tecnica nel processo produttivo, si pensa che la resistenza alla rottura possa essere accresciuta. Per provare ciò, si prende un campione di 50 funi e si trova che la resistenza media alla rottura è di 1850 N mentre lo scarto quadratico medio è stimato in 100 N . Si può pensare che vi sia stato un reale miglioramento al livello di significatività dell’ 1%? In questo secondo test, la varianza è incognita e quindi stimata attraverso i dati campionari. Il test che si costruisce sarà concepito in modo tale da rifiutare l’ipotesi nulla contrariamente al caso precedente in cui avremmo preferito non rifutarla. Costruiamo un test per verificare l’ipotesi nulla H0 che la qualità dei materiali sia rimasta invariata, cioè H0 : µ = µ0 = 1800N contro l’alternativa H1 : µ > µ0 . Quindi rifiutare vuol dire che si certifica un aumento di qualità del prodotto. Si usa il test t con n − 1 gradi di libertà. La regola del test è la seguente x̄n − µ0 n−1 Rifiutare H0 se t = > t1−α s̄n √ Nel nostro caso t = 1850−1800 100 √ 50 n 40 = 3.54 e t49 0.99 < 2.423 = t0.99 quindi rifiutiamo l’ipotesi nulla (anche un test al 5% avrebbe dato lo stesso risultato). Esercizio 3. Un esperto di organizzazione aziendale afferma che l’introduzione di una nuova procedura amministrativa può ridurre in modo sostanziale il tempo di completamento di una pratica amministrativa. A causa dei costi aggiuntivi di esercizio (personale e attrezzature) la direzione dell’azienda decide di adottare la nuova procedura a condizione che la riduzione dei tempi di espletamento delle pratiche risulti di almeno l’8%. Vengono 1. LA VERIFICA DELLE IPOTESI 9 fatti 6 esperimenti e si trova che la riduzione media di smaltimento è dell’8.4% con una deviazione standard dello 0.32%. Decidere se, sulla base di questi risultati, all’azienda conviene adottare la nuova procedura oppure no. Siamo di fronte ad un test ad una coda in cui l’ipotesi nulla è H0 : µ = 0.08 contro un’alternativa H1 : µ > 0.08. Costruito in questo modo, il test permette all’esperto di organizzazione aziendale di convincere l’azienda ad adottare la nuova procedura nel caso si riesca a rifiutare l’ipotesi nulla H0 . Calcoliamo la statistica t x̄n − µ0 0.084 − 0.08 t= q = = 3.06 0.0032 s̄2n n √ 6 n−1 Il test rifiuta l’ipotesi nulla quando t > t1−α . Quindi, con un test di livello α = 1% si 5 ha t0.99 = 3.14267 > 3.06 e quindi non si rifiuta l’ipotesi nulla poiché il valore 3.06 cade all’interno della regione di accetazione del test. Se invece eseguiamo un test di livello α = 0.05, il valore soglia è t50.95 = 2.01 ed in questo caso il test ci permette di rifiutare H0 in quanto t = 3.06 > 2.01. Esercizio 4. Alla vostra festa di compleanno si presenta Giukas, un amico, il quale sostiene di avere poteri paranormali. In particolare, il tale afferma di poter leggere nel pensiero delle persone. Ci proponiamo allora di mettere alla prova le qualità extrasensoriali di Giukas attraverso il metodo statistico e costruiamo un esperimento in modo tale da evidenziare eventuali frodi. Prendiamo un mazzo di 40 carte (20 di colore rosso e 20 di colore nero) e ci sistemiamo in una stanza ben separata da dove si trova Giukas. Estraiamo in successione una carta, guardiamo di quale colore è, e prima di rimetterla nel mazzo chiediamo a Giukas di indovinare il colore della carta dall’altra stanza. Dopo 50 estrazioni ripetute, Giukas ha indovinato 32 carte su 50. La platea applaude contenta. Ci chiediamo se, alla luce di tali risultati, si possa sostenere che Giukas possegga realmente poteri paranormali (cioè sia dotato di ESP1 positivo). Vediamo di formalizzare meglio l’esperimento. Abbiamo una successione di 50 prove ripetute che, si suppone, sono state effettuate nelle stesse condizioni ed in modo indipendente tra loro. Ad ogni prova possiamo avere solo due esiti: Giukas indovina o non indovina la carta estratta. Pensiamo all’evento indovina come ad un successo. Siamo quindi di fronte ad uno schema Binomiale con n = 50 prove e p la probabilità a priori che Giukas indovini la carta estratta in ciascuna prova. A rigor di logica, se l’indovino fosse dotato di poteri paranormali, la probabilità di indovinare la carta estratta dovrebbe essere pari ad 1 e quindi Giukas dovrebbe indovinare 50 carte su 50. Potremmo quindi costruire un test in cui l’ipotesi da sottoporre a verifica 1Extra Sensory Perception. Un esperimento simile fu realmente condotto durante le missioni Apollo dalla NASA. L’astronauta a bordo del modulo orbitante attorno alla Luna estraeva una carta e un secondo astronauta nel modulo lunare LEM (posato sulla superficie lunare) doveva indovinare di quale carta si trattasse. I risultati furono disastrosi con una percentuale di risposte sbagliate talmente elevata che i sostenitori delle teorie paranormali coniarono per l’occasione il termine ESP “negativo” ! 10 è H0 : p = 1 contro l’ipotesi H1 : p < 1. Questo genere di test è però inapplicabile alla distribuzione Binomiale in quanto il parametro p deve rispettare la condizione 0 < p < 1. Partiamo però da un principio di “buona fede” dell’aspirante lettore di pensiero e ammettiamo che anche nelle condizioni migliori Giukas non potrebbe essere in grado di indovinare tutte le carte a causa del cemento armato che si frappone tra la carta estratta e la sua antenna extrasensoriale, dello stress da esame e da altri fattori. Poniamoci allora la domanda opposta: Giukas indovina per puro caso? Poiché i test vengono generalmente2 costruiti per rifiutare l’ipotesi nulla cercheremo di avere un test che rifiuti l’ipotesi che il soggetto indovini a caso in favore delle capacità ESP del soggetto. Scegliamo quindi l’ipotesi nulla come segue: H0 : p = p0 = 21 contro l’alternativa H1 : p > 12 . Indichiamo con Xi la variabile casuale che, nella generica prova i-esima, assume il valore 1 se Giukas indovina e 0 in caso contrario con probabilità 1 − p. Le Xi sono quindi un campione di variabili casuali indipendenti bernoulliane di parametro p (supponendo che sia p la vera probabilità con cui Giukas indovina le carte). Notiamo che sotto l’ipotesi nulla (p = p0 ) sappiamo che se poniamo n X Y = Xi i=1 allora Y è una variabile casuale Binomiale di parametri n e p0 . Inoltre ricordando che p̂n = Y /n, abbiamo p̂ − p0 qn ∼Z p0 (1−p0 ) n e ancora una volta ci siamo ricondotti alla variabile casuale Z. Costruire il test per H0 : p = p0 = 21 contro l’alternativa H1 : p > 12 vuol dire rifiutare l’ipotesi nulla se la distanza tra p̂n e p0 (opportunamente standardizzata) è molto elevata. Cosa si intenda per “molto” lo specifichiamo attraverso la probabilità imponendo che il nostro test sia significativo ad un certo livello α. Cioè, come ricordato nell’introduzione, cerchiamo quel valore z1−α tale che P (Z > z1−α ) = α Il nostro test rifiuterà l’ipotesi nulla che si tratti del puro effetto del caso – il fatto che Giukas abbia indovinato 32 carte su 50 – se p̂n − p0 z=q > z1−α p0 (1−p0 ) n Vediamo allora quanto vale z, cioè il valore assunto dalla variabile casuale Z nel nostro campione: 32 −1 0.64 − 0.5 q 1 12 = q z = 50 = 1.97 · 50 2 2 2Questa 1 200 affermazione è opinabile se si cambia il paradigma statistisco di riferimento ma, ai fini di queste lezioni, può ritenersi valida. 1. LA VERIFICA DELLE IPOTESI 11 α = 0.05 α = 0.01 p 1.65 1.97 2.33 Figura 4. In grigio è segnata l’area sotto la curva Gaussiana che corrisponde al p-value, cioè a destra di 1.97. A destra di 1.65 si trova la regione di rifiuto del test al livello α = 5% e a destra di 2.33 quella del test al livello α = 1%. Se vogliamo un test che ci garantisce un errore massimo dell 1%, (cioè poniamo α = 0.01) il quantile da considerare è z1−α = z0.99 = 2.33. La regola del test ci dice di rifiutare H0 se z > z1−α . Nel nostro caso otteniamo 1.97 < 2.33, quindi non possiamo rifiutare l’ipotesi nulla e non possiamo concludere che Giukas sia dotato di ESP, ovvero, qualsiasi altra persona avrebbepotuto indovinare lo stesso numero di carte di Giukas per puro effetto del caso p0 = 21 . Se ci poniamo in condizioni meno restrittive accettando un errore pari a α = 5%, ricaviamo che il quantile è z1−α = z0.95 = 1.65 e il test ci suggerisce di rifiutare l’ipotesi nulla in favore di presunte capacità paranormali di Giukas (infatti 1.97 > 1.65). Questo è un tipico caso di incertezza: a quale delle due conclusioni dar fede? Un modo per capire quale delle due conclusioni sia più attendibile è fare ricorso al calcolo3 del p-value. Il p-value è quel valore della probabilità che si ha nella coda di destra della distribuzione di Z a partire dal valore z che il test ci ha fornito. In sostanza si calcola come segue p = P (Z > z) = P (Z > 1.97) = 1 − Φ(1.97) = 1 − 0.976 = 0.024 Se avessimo fissato un livello di significatività pari a p = 2.4% il test avrebbe comunque rifiutato l’ipotesi nulla. Quindi il p-value è il massimo livello di α che avremmo potuto fissare che ci avrebbe permesso di rifiutare l’ipotesi nulla H0 alla luce dei nostri dati. 3Tutti i software statistici forniscono come indicazione solo il valore del p-value del test e non i livelli di significatività. Quindi è importante saper districarsi con questa nozione. 12 Quindi, se abbiamo scelto un livello di significatività α ≤ p “accettiamo” H0 , mentre se α > p rifiutiamo H0 . Si veda in proposito la Figura 4. Per risolvere l’enigma di Giukas, si può utilizzare come regola empirica la seguente: ci fidiamo della decisione del test il cui errore α è più lontano al p-value calcolato. Nel nostro caso 0.024 è più vicino a 0.01 che a 0.05 e quindi accettiamo la decisione del primo test: Giukas non è dotato di poteri paranormali. Uno studio più scrupoloso chiederebbe di ripetere più volte l’esperimento e non di limitarsi ad un solo esame concludendo solo sulla base del p-value. Esercizio 5. Una ditta farmaceutica reclamizza un prodotto da banco che, si dice nel comunicato pubblicitario, è in grado di mitigare gli effetti dell’età riducendo di un fattore 2 gli inestetismi (le rughe) del viso nel 90% dei casi. Per verificare che quanto pubblicizzato sia vero, si estrae a caso un campione di 200 individui a cui viene somministrata l’intera “cura” di ringiovanimento. Alla fine del test, ben 160 di questi 200 individui hanno ottenuto la riduzione dichiarata dalla ditta farmaceutica. Si può quindi affermare sulla base di questo esperimento che quanto dice il venditore sia vero? Indichiamo con p la probabilità che un individuo sottoposto alla cura benefici del trattamento di riduzione degli inestetismi. Poniamo come ipotesi nulla H0 : p = 0.9 e come ipotesi alternativa H1 : p < 0.9 questo per mettere in evidenza eventuali problemi. Abbiamo dunque un test ad una coda sulle proporzioni. Il campione di 200 indivui ha 160 fornito come risultato p̂n = 200 = 0.8. Calcoliamo la statistica z p̂n − p0 0.8 − 0.9 z=q = −4.71 = q p0 (1−p0 ) n 0.9·0.1 200 Se usiamo un test di livello 1%, il valore soglia al di sotto del quale rifutare è z0.01 = −2.33, poiché z < z0.01 rifiutiamo l’ipotesi nulla che il trattamento ha un effetto nel 90% dei casi in favore dell’ipotesi alternativa che l’efficacia sia minore.