Comments
Description
Transcript
Test di Ipotesi
Test di Ipotesi Test di ipotesi - Prob. e Stat. a.a. 04/05 1 Metodologia statistica che consente di prendere una decisione circa: - una ipotesi formulata sul modello di una popolazione - un parametro incognito del modello di una popolazione. Definizione Una ipotesi statistica è una proposizione circa uno o più parametri di una popolazione o circa la distribuzione di probabilità della variabile aleatoria X che descrive la popolazione. Esempio: Si vuole stabilire se una certa moneta è equa, ossia se p=P(T)=P(C)=0.5. Si formula l’ipotesi di base (quella da sottoporre a test) che la moneta è onesta e si verifica l’attendibilità di tale ipotesi contro l’ipotesi alternativa (che la moneta sia disonesta). H 0 : p = 0.5 (ipotesi nulla) H 1: p ≠ 0.5 (ipotesi alternativa) Test di ipotesi - Prob. e Stat. a.a. 04/05 2 H 0 : p = 0.5 (ipotesi nulla) H 1: p ≠ 0 .5 (ipotesi alternativ a) Ipotesi alternativa a due code H 0 : p = 0.5 (ipotesi nulla) H 1: p < 0 .5 (ipotesi alternativ a) Ipotesi alternativa a una coda H 0 : p = 0.5 (ipotesi nulla) H 1: p > 0 .5 (ipotesi alternativ a) Determinare se il valore del parametro è cambiato Obbiettivo Risultato da esperienza passata o conoscenza del processo Verificare la teoria sul modello Risultato di una ipotesi formulata sul modello Test di conformità Risultato di specifiche di progetto o obblighi contrattuali Test di ipotesi - Prob. e Stat. a.a. 04/05 3 Si chiama test di ipotesi una procedura che consente di prendere una decisione circa una particolare ipotesi (nulla) a partire dalle informazioni contenute in un campione casuale estratto dalla popolazione in esame. Se questa informazione è consistente con l’ipotesi Se questa informazione non è consistente con l’ipotesi H 0 non è rigettabile H 0 è falsa Una ipotesi non potrà mai essera accettata con certezza, ma il risultato del test sarà sempre accompagnato da una valutazione della possibilità di commettere un errore accettando o rigettando l’ipotesi. Procedura • selezionare un campione casuale • calcolare una statistica test • usando il valore calcolato prendere una decisione circa l’ipotesi nulla Test di ipotesi - Prob. e Stat. a.a. 04/05 4 Esempio: Si vuole stabilire se il coefficiente di combustione medio di un propellente solido usato per potenziare un sistema di fuga in un equipaggio aereo è 50 cm al secondo. H 0 : µ = 50cm/s (ipotesi nulla) H 1: µ ≠ 50cm/s (ipotesi alternativa) Si assuma che sia stato osservato un campione casuale di taglia n = 10. Si supponga di poter valutare la media campionaria x. E'legittimo assumere di non rigettare l' ipotesi H 0 se fosse 48.5 ≤ x ≤ 51.5 e di rigettare l' ipotesi H 0 se fosse x > 51.5 oppure x < 48.5. Definizione La regione critica di un test di ipotesi è quel sottoinsieme di numeri reali tale che si rigetta H 0 se il valore calcolato s della statistica test appartiene a tale sottoinsieme e si accetta H 0 se il valore calcolato s della statistca test non appartiene a tale sottoinsieme. Il complemento della regione critica viene chiamato regione di accettazione. Test di ipotesi - Prob. e Stat. a.a. 04/05 5 Questo tipo di procedura decisionale può condurre a due tipi di errori Si commette un errore del I tipo quando si rigetta l’ipotesi nulla pur essendo vera. Si commette un errore del II tipo quando non si rigetta l’ipotesi nulla pur essendo falsa. I tipo Regione critica Reg.accettazione 48.5 50 Regione critica 51.5 µ vero x II tipo µ vero 48.5 50 x 51.5 Test di ipotesi - Prob. e Stat. a.a. 04/05 6 Non si rigetta l’ipotesi nulla Si rigetta l’ipotesi nulla Ipotesi nulla vera Ipotesi nulla falsa no errore errore II tipo errore I tipo no errore Definizione Si definisce livello di significatività del test o taglia del test la probabilità di commettere un errore di I tipo : α = P(errore di I tipo) = P(rigettare H 0 quando è vera) β = P(errore di II tipo) = P(accettare H 0 quando è falsa) Ipotesi nulla vera Ipotesi nulla falsa β 1-α Non si rigetta l’ipotesi nulla α 1- β Si rigetta l’ipotesi nulla Test di ipotesi - Prob. e Stat. a.a. 04/05 7 Torniamo all’esempio del fattore di combustione. Si assuma che la deviazione standard di tale variabile aleatoria sia 2.5 cm al sec. Determinare il livello di significatività del test per un campione di taglia 10. P(rigettare H 0 | H 0 vera ) = P(rigettare H 0 | µ = 50) = P (X ∈ regione critica | µ = 50) ( Υ X > 51,5 | µ = 50) = P(X − 50 < 48,5 − 50)+ P(X − 50 > 51,5 − 50) = = P X < 48,5 X − 50 X − 50 48,5 − 50 51,5 − 50 48,5 − 50 + P = 2 P Z < = P < > = 0.0588 2 . 5 / 10 2 . 5 / 10 2 . 5 / 10 2 . 5 / 10 2.5 / 10 α Regione di accettazione taglia 48.5 ≤ x ≤ 51.5 10 0.0576 48 ≤ x ≤ 52 10 0.0114 48.5 ≤ x ≤ 51.5 16 0.0164 48 ≤ x ≤ 52 16 0.0014 Test di ipotesi - Prob. e Stat. a.a. 04/05 8 Come si calcola la probabilit à di commettere un errore di II tipo? β = P(errore di II tipo) = P(non rigettare H 0 quando è falsa) = P ( non rigettare H 0 | H 1 è vera) Per calcolare l’errore di secondo tipo dobbiamo avere una ipotesi alternativa specifica. Quale? H 1 : µ ≠ 50 Si assuma che è “necessario” rigettare l’ipotesi nulla H 0 : µ = 50 se il coefficiente di combustione medio dovesse raggiungere valori intorno a 52. Ad esempio, si commette un errore di II tipo, se il campione casuale fornisce una stima puntuale della media campionari a compresa tra 48.5 e 51.5 quando µ = 52 . β = P (48 .5 ≤ X ≤ 51 .5 quando µ = 52 ) = 0.2643 Test di ipotesi - Prob. e Stat. a.a. 04/05 9 Lo statistico controlla l’errore di I tipo e in funzione di questo seleziona la regione critica. Rigettare l’ipotesi nulla L’errore di II tipo dipende dal vero valore del parametro in esame, che è normalmente incognito, sicché si procede per tentativi. Accettare l’ipotesi nulla = non si rigetta l’ipotesi nulla Test di ipotesi - Prob. e Stat. a.a. 04/05 10 α Regione di accettazione taglia 48.5 ≤ x ≤ 51.5 10 0.0576 48 ≤ x ≤ 52 10 0.0114 48.5 ≤ x ≤ 51.5 16 0.0164 48 ≤ x ≤ 52 16 0.0014 β con µ = 52 β con µ = 50.5 0.2643 0.8923 0.5000 0.9705 0.2119 0.9445 0.5000 0.9918 •L’errore di I tipo è legato all’errore di II tipo. Se aumenta uno decresce l’altro e viceversa. •Al crescere della taglia del campione, vengono ridotti gli errori di I e II tipo. • L’errore di II tipo diminuisce se il valore assegnato al parametro si allontana da quello impiegato nell’ipotesi nulla. Test di ipotesi - Prob. e Stat. a.a. 04/05 11 Definizione Si definisce potenza del test, la probabilità di rigettare l’ipotesi nulla quando è vera l’ipotesi alternativa. 1 − β è la probabilità di rigettare correttamente un’ipotesi nulla falsa Nell' esempio del fattore di combustione dove si effettua il test sull' ipotesi H 0 : µ = 50 contro l' ipotesi alternativa H 1 : µ ≠ 50, se il valore vero del parametro µ è 52, allora β = 0.2643 ⇒ 1 - β = 0.7357, ossia con in 73 casi su 100 il test riconosce che l' ipotesi nulla è falsa. Se si ritiene questo valore basso, si può aumentare α oppure aumen tare la taglia del campione. 1− β Test di ipotesi - Prob. e Stat. a.a. 04/05 12 Procedura generale per la costruzion e di un test di ipotesi. (a) Dal contesto del problema, identifica re il parametro di interesse. (b) Formulare l' ipotesi nulla H 0 . (c) Specificar e una opportuna ipotesi alternativa H 1 (test a 1 o 2 code). (d) Scegliere un opportuno errore di I tipo α . (e) Scegliere una opportuna statistica test (dipende dal parametro). (f) Costruire una opportuna regione criticaα .. (g) Determinare un campione casuale e valutare una stima puntuale della statistica test. (h) Decidere se rigettare o meno l' ipotesi nulla, verifican do se tale stima puntale appartiene o meno alla regione critica. Esercizio: La specifica assegnata sul coefficiente di combustione di un certo propollente è di 50cm/s. La deviazione standard di tale caratteristica è di 2cm/s. Selezionando un campione casuale di taglia 25, si è trovato che la media campionaria è di 51.3 cm/s. Quale conclusione si può dedurre sulla specifica al livello di significatività del Test di ipotesi - Prob. e Stat. a.a. 04/05 13 5%? Procedura per il test di ipotesi (a) Identificare il parametro di interesse : la media µ . (b) Formulare l' ipotesi nulla H 0 ⇒ H 0 : µ = 50 (c) Specificar e l'ipotesi alternativa H 1 ⇒ H 1 : µ ≠ 50. (d) Scegliere un opportuno errore di I tipo α . ⇒ α = 0.05 (e) Scegliere una opportuna statistica test ⇒ X (media camp.). (f) Costruire una opportuna regione critica : P( X < ? ΥX > ?| H 0 è vera) = α ⇒ P (? < X < ? | µ = 50) = 1 - α X −µ < zα / 2 ) = 1 - α allora la regione σ/ n di accettazione del test è l' intervallo : Poichè si sa che : P ( − zα / 2 < σ σ 2 2 50 − zα / 2 = 50 − 1.96 ,50 + 1.96 = ( 49.21,50.78) ,50 + zα / 2 5 5 n n Test di ipotesi - Prob. e Stat. a.a. 04/05 14 (g) Determinare un campione casuale e valutare una stima puntuale della statistica test. ⇒ x = 51.3. (h) Decidere se rigettare o meno l' ipotesi nulla, verifican do se tale stima puntale appartiene o meno alla regione critica : poichè 51.3 ∉ ( 49.21,50.78), l' ipotesi nulla viene rigettata. Test di ipotesi - Prob. e Stat. a.a. 04/05 15 Esercizio: Si ipotizza che l’età media dei frequentatori di una biblioteca sia 39 anni con una varianza di 10.2 anni. Per verificare tale ipotesi vengono campionati 100 frequentatori e la loro età media risulta essere 38 anni. Si verifichi l’ipotesi iniziale (si assuma la popolazione normale). (a) Identifica re il parametro di interesse : la media µ . (b) Formulare l'ipotesi nulla H 0 ⇒ H 0 : µ = 39.0 (c) Specificar e l'ipotesi alternativa H 1 ⇒ H 1 : µ ≠ 39.0. (d) Scegliere un opportuno errore di I tipo α . ⇒ α = 0.05 (e) Scegliere una opportuna statistica test ⇒ X (media camp.). (f) Costruire una opportuna regione critica : P( X < ? ΥX > ?| H 0 è vera) = α ⇒ P (? < X < ? | µ = 39.0) = 1 - α X −µ < zα / 2 ) = 1 - α allora la regione σ/ n di accettazione del test è l' intervallo : Poichè si sa che : P ( − zα / 2 < σ σ 3.19 3.19 39 − zα / 2 = 39 − 1.96 ,39 + zα / 2 ,39 + 1.96 = (38.48,39.51) 10 10 n n Testdi ipotesi - Prob. e Stat. a.a. 04/05 16 (g) Determinare un campione casuale e valutare una stima puntuale della statistica test. ⇒ x = 38. (h) Decidere se rigettare o meno l' ipotesi nulla, verifican do se tale stima puntale appartiene o meno alla regione critica : poichè 38 ∉ (38.42,39.51), l' ipotesi nulla viene rigettata. Test di ipotesi - Prob. e Stat. a.a. 04/05 17 T es t di Ipotes i s ulla Media: var ianz a nota H : µ = µ 0 Ipotesi (test a due code) 0 H1 : µ ≠ µ 0 X −µ Z= Statistica test σ/ n Regione Accettazione P (− zα / 2 ≤ Z ≤ zα / 2 quando µ = µ 0 ) = 1 − α H : µ = µ0 Ipotesi (test a una coda) 0 H 1 : µ > (< ) µ 0 X −µ Z= Statistica test σ/ n R. Accettazione P(Z ≤ (≥ −) zα | µ = µ 0 ) = 1 − α Test di ipotesi - Prob. e Stat. a.a. 04/05 18 Per calcolare l' errore di II tipo : (a) Ricavare la regione di accettazio ne nella forma X ∈ (x1 , x2 ). ( ) (b) Calcolare β = P X ∈ (x1 , x2 ) | µ1 = ... mediante operazione di standardiz zazione. T es t di Ipotes i s ulla Media: var ianz a incognita H : µ = µ 0 Ipotesi (test a due code) 0 H1 : µ ≠ µ0 X −µ T= Statistica test ( popolazione normale) S/ n Regione Accettazione P (− tα / 2,n −1 ≤ T ≤ tα / 2 ,n −1 quando µ = µ 0 ) = 1 − α Test di ipotesi - Prob. e Stat. a.a. 04/05 19 Esercizio : Un articolo nel giornale Materials Engineerin g (1989) descrive i risultati di un test di adesione su 22 campioni di una certa lega. I coefficien ti di fallimento dei 22 campioni sono : 19,8 18,5 17,6 16,7 15,8 15,4 14,1 13,6 11,9 11,4 11,4 8,8 7,5 15,4 15,4 19,5 14,9 12,7 11,9 11,4 10,1 7,9 Si assuma che i campioni provengano da una popolazion e normale. I dati suggerisco no che si ha un fallimento quando la media è diversa da 10? 8 13,71364 6 0,757625 4 13,85 2 11,4 0 3,553576 7,5 12,6279 -0,75137 -0,01513 12,3 7,5 19,8 301,7 22 19,8 7,5 Test di ipotesi - Prob. e Stat. a.a. 04/05 1,575567 Frequenza M edia E rrore s tandard M ediana M oda Deviaz ione s tandard V arianz a c am pionaria Curtos i A s im m etria Intervallo M inim o M as s im o S om m a Conteggio P iù grande(1) P iù pic c olo(1) Livello di c onfidenz a(95,0% ) 10,575 Dati relativi all’istogramma 13,65 16,725 Altro Classe Frequenza 7,5 1 10,575 3 13,65 7 16,725 7 Altro 4 20 Come ver ificar e l’as s unzione che la popolazione è nor male? 19.8 11,4 Costruendo un box plot, si osserva che la popolazione è simmetrica. 13,8 15,7 7.9 Normal probability plot I dati x1 , x 2 , Κ , x n vengono ordinati in x (1) , x ( 2 ) , Κ , x ( n ) . Tali valori ordinati vengono plottati in coppia con i - 0.5 * 100 (le frequenze n Test di ipotesi - Prob. e Stat. a.a. 04/05 cumulative ) 21 T es t di Ipotes i s ulla Var ianz a: Popolaz ione nor male H : σ 2 = σ 02 Ipotesi (test a due code) 0 2 2 H1 : σ ≠ σ 0 (n − 1) S 2 Statistica test χ2 = ( popolazione normale) σ 02 Regione Accettazione P(χ 12−α / 2 ,n −1 ≤ χ 2 ≤ χ α2 / 2, n −1quando σ 2 = σ 02 ) = 1 − α Esercizio: Una macchina per l’imbottigliamento automatico di liquido detergente viene sottoposta a verifica, selezionando un campione di 20 bottiglie. Per queste 20 bottiglie, viene misurata la quantità di liquido contenuta in ciascuna di esse e calcolata la varianza campionaria che risulta pari a 0.0153. Se la varianza associata al processo di imbottigliamento del liquido supera lo 0.01, si corre il rischio di avere bottiglie troppo piene rispetto alla specifica assegnata o viceversa. C’è una evidenza dai dati raccolti per concludere che il processo di imbottigliamento non funziona bene? Si assuma che il volume di liquido in ciascuna bottiglia sia distribuito come una normale. Test di ipotesi - Prob. e Stat. a.a. 04/05 22 T es t di Ipotes i s ulle Per centuali H : p = p0 Ipotesi (test a due code) 0 H 1 : p ≠ p0 X − np Statistica test Z= np (1 − p ) Regione Accettazione P (− zα / 2 ≤ Z ≤ zα / 2 quando p = p 0 ) = 1 − α T es t di Ipotes i s ulle Differ enz e tr a medie - Var ianz a nota H : µ − µ 2 = ∆ 0 Ipotesi (test a due code) 0 1 H 1 : µ1 − µ 2 ≠ ∆ 0 X − X 2 − ( µ1 − µ 2 ) Statistica test Z= 1 σ 12 σ 22 + n1 n 2 Regione Accettazione P (− zα / 2 ≤ Z ≤ zα / 2 quando µ1 − µ 2 = ∆ 0 ) = 1 − α Test di ipotesi - Prob. e Stat. a.a. 04/05 23 T es t di Ipotes i s ulle Differ enz e tr a medie - Var ianz a incognita H : µ − µ 2 = ∆ 0 Ipotesi (test a due code) 0 1 H 1 : µ1 − µ 2 ≠ ∆ 0 X − X 2 − ( µ1 − µ 2 ) Statistica test T= 1 1 1 Sp + n1 n 2 Regione Accettazione P (− tα / 2, n1 + n2 − 2 ≤ T ≤ tα / 2 ,n1 + n2 − 2 , µ1 − µ 2 = ∆ 0 ) = 1 − α T es t di Ipotes i s ui r appor ti tra var ianz e - Var ianz a incognita H : σ 2 = σ 22 Ipotesi (test a due code) 0 12 2 H1 : σ 1 ≠ σ 2 S2 Statistica test F = 12 S2 Regione Accettazione P( f 1−α / 2,n1 −1,n2 −1 ≤ F ≤ f α / 2 ,n1 −1,n2 −1 , 0 ) = 1 − α Test di ipotesi - Prob. e Stat. a.a. 04/05 24