Comments
Description
Transcript
Lezione 09 - Brigantaggio.net
Verifica d’Ipotesi Se invece che chiederci quale è il valore di una media in una popolazione (stima Se invece che chiederci quale è il avessimo valore di un’idea una media in unache popolazione puntuale e intervallo di confidenza) su quello potrebbe (stima essere puntuale e intervallo di confidenza) avessimo un’idea su quello che potrebbe il valore incognito di una media? Come potremmo verificare se la nostra idea é essere vera il valore incognito di una media? Come potremmo verificare se la nostra idea é vera o falsa? o falsa? Un’IPOTESI STATISTICA è un assunto circa un parametro della funzione di distribuzione di una variabile casuale Il saggio di un’ipotesi statistica (ipotesi nulla H0) si basa sulla dimostrazione per contraddizione Si parte da un assunto (Ipotesi Nulla) si fanno delle argomentazioni logiche Si parte da un Nulla) si fanno delle argomentazioni logiche (applicazione di assunto un test),(Ipotesi se le argomentazioni non confermano l’assunto di (applicazione di un test), se le argomentazioni non confermano l’assunto di partenza (risultato poco probabile), allora si contraddice (Rifiuto dell’Ipotesi partenza (risultato poco probabile), allora si contraddice (Rifiuto dell’Ipotesi Nulla) Nulla) 1 Procedimento: - Definizione di un’ipotesi nulla e di un’alternativa (unilaterale o bilaterale) - Individuazione della statistica test e calcolo del valore numerico della stessa sui dati del campione - Riferimento della statistica test a una distribuzione nota quando l’ipotesi nulla è vera - Determinazione della probabilità di verificarsi (livello soglia) - Confronto del valore empirico verso quello teorico e conclusioni Alla fine della procedura un test conduce sempre a due sole alternative: o si rifiuta l’ipotesi nulla H0, oppure si accetta (non si rifiuta) Se si rifiuta l’ipotesi nulla quando è falsa e se non si rifiuta quando è vera, non si Se si rifiuta l’ipotesi nulla quando che è falsa e se non si rifiuta quando è vera, non si commettono errori. Dal momento le decisioni sono prese sulla base di un commettono errori. Dal momento che le decisioni sono prese sulla base di campione può accadere di commettere errori: rifiutare l’ipotesi nulla quandoun è campione puòtipo), accadere di commettere errori: nulla vera (I° non rifiutare l’ipotesi nulla rifiutare quando èl’ipotesi falsa (II° tipo)quando è vera (I° tipo), non rifiutare l’ipotesi nulla quando è falsa (II° tipo) Come ogni volta che si ha a che fare con l’incertezza, si definiscono delle probabilità di commettere l’errore di I° e di II° tipo, a e b Non rifiuto H0 Rifiuto H0 H0 vera Nessun errore confidenza=1-α Errore di I° tipo (α) H0 falsa Errore di II° tipo (b) Nessun errore Potenza=1-β α = P ( rifiu ta re H 0 | H 0 è v e ra ) ; 1 - α = P ( n o n rifiu tare H 0 | H 0 è ve ra) β = P ( n o n rifiu tare H 0 | H 0 è fa lsa ); 1 - β = P ( rifiu tare H 0 | H 0 è fa lsa ) 2 Test d’ipotesi sulla media Se X ~ ( N µ, σ 2 ) Caso σ2 nota H 0 : µ = µ0 Dato un campione estratto si calcola la statistica media campionaria e ci si chiede se la distanza un campione si calcola campionaria ci siachiede la distanza x − µ 0Dato è troppo elevata,estratto se la distanza è >la distatistica un valoremedia k si rifiuta l’ipotesi enulla favorese dell’alternativa è troppo elevata, se la distanza è > di un valore k si rifiuta l’ipotesi nulla a favore dell’alternativa Specificando l’alternativa è possibile fissare l’errore di I°tipo α Specificando l’alternativa è possibile fissare l’errore di I°tipo α Se è vera H0, Se è vera H20, H 0 : µ = µ0 H 0 : µ ≠ µ0 α/2 ~ σ N µ0 , n ( ) α = P (rifiutare H 0 | H 0 è vera) = P X − µ 0 > k | H 0 = α/2 zα/2 X X − µ0 k k = P > | H0 = P Z > | H0 σ n σ n σ n z1-α/2 k k PZ < − eZ > =α σ n σ n Per la simmetria della Variabile Per la simmetria Variabile Casuale Normale della si ottiene Casuale Normale si ottiene k= σ n ⋅ z1−α 2 Si rifiuta H0 se z > z1−α Si rifiuta H0 se Test d’ipotesi sulla media Se X ~ ( N µ, σ 2 H 0 : µ = µ0 H 0 : µ > µ0 ) 2 dove z = x − µ0 n σ Caso σ2 nota α = P (rifiutare H 0 | H 0 è vera) = P ( X − µ0 > k | H 0 ) = X − µ0 k k k = P > | H0 = P Z > | H0 = P Z > σ n σ n σ n σ n α z1-α Si rifiuta H0 se z > z1−α Si rifiuta H0 se H 0 : µ = µ0 H 0 : µ < µ0 dove z = α = P (rifiutare H 0 | H 0 è vera) = P ( X − µ0 < k | H 0 ) = X − µ0 k k k = P < | H0 = P Z < | H0 = P Z < σ n σ n σ n σ n α zα x − µ0 n σ z < zα Si rifiuta H0 se Si rifiuta H0 se dove z = x − µ0 σ n 3 Test d’ipotesi sulla media Se X ~ ( N µ, σ 2 ) Caso σ2 ignota 1 n varianza campionaria ⇒ s = ( xi − x ) ( n − 1) ∑ i =1 2 2 H 0 : µ = µ0 H 0 : µ ≠ µ0 Si rifiuta H0 se t > t1−α Si rifiuta H0 se H 0 : µ = µ0 H 0 : µ > µ0 Si rifiuta H0 se t > t1−α Si rifiuta H0 se dove t = x − µ0 H 0 : µ = µ0 H 0 : µ < µ0 t < tα Si rifiuta H0 se Si rifiuta H0 se dove t = x − µ0 Test d’ipotesi sulla proporzione Se è vera H0, (per n>30) Se è vera H0, (per n>30) Se X pˆ − p0 p0 (1 − p0 ) n H 0 : p = p0 H 0 : p ≠ p0 H 0 : p = p0 H 0 : p > p0 H 0 : p = p0 H 0 : p < p0 ~ B er ( p ) allora E ( X ≈ N (0,1) ) X = pˆ = dove t = 2 = p eV (X )= x − µ0 s s n n s n p (1 − p ) n 1 n n° di successi Xi = ∑ n i =1 n Si rifiuta H0 se z > z1−α Si rifiuta H0 se 2 Si rifiuta H0 se z > z1−α Si rifiuta H0 se Si rifiuta H0 se z < zα Si rifiuta H0 se dove z = dove z = dove z = pˆ − p0 p0 (1 − p0 ) n pˆ − p0 p0 (1 − p0 ) n pˆ − p0 p0 (1 − p0 ) n 4 Test d’ipotesi per il confronto tra medie t= x1 − x2 1 1 + s n1 n2 s= ( n1 − 1) s12 + ( n2 −1) s22 n1 + n2 − 2 x1 e s12 media e varianza campionaria di un campione di numersità n1 x2 e s22 media e varianza campionaria di un campione di numersità n2 H 0 : µ1 = µ 2 H 0 : µ1 ≠ µ 2 g Si rifiuta H0 se t > t 1−α Si rifiuta H0 se H 0 : µ1 = µ 2 H 0 : µ1 > µ 2 Si rifiuta H0 se t > t g1−α Si rifiuta H0 se H 0 : µ1 = µ 2 H 0 : µ1 < µ 2 Test d’ipotesi per il confronto tra proporzioni 2 g = n1 + n2 − 2 g Si rifiuta H0 se t < t α Si rifiuta H0 se z= pˆ1 − pˆ 2 1 1 pˆ (1 − pˆ ) + n1 n2 g = n1 + n2 − 2 g = n1 + n2 − 2 pˆ = x1 + x2 n1 + n2 pˆ1 proporzione di favorevoli in un campione di numersità n1 pˆ 2 proporzione di favorevoli in un campione di numersità n2 H 0 : p1 = p2 H 0 : p1 ≠ p2 Si rifiuta H0 se z > z1−α Si rifiuta H0 se H 0 : p1 = p2 H 0 : p1 > p2 Si rifiuta H0 se z > z1−α Si rifiuta H0 se H 0 : p1 = p2 H 0 : p1 < p2 Si rifiuta H0 se z < zα Si rifiuta H0 se 2 5 Test d’ipotesi per verificare l’indipendenza X e Y sono fenomeni statistici rilevati congiuntamente h: numero di modalità di X k: numero di modalità di Y H 0: X e Y sono stocasticamente indipendenti H 0: X e Y sono associate o connesse H 0 : χ 2 = 0 2 H 0 : χ > 0 h k χ = ∑∑ 2 (n ij i =1 j =1 2 g Si rifiuta H0 se χ > χ 1−α Si rifiuta H0 se − nij* ) 2 nij* dove g = ( h − 1) ⋅ ( k − 1) P-value Tutti i software statistici non forniscono i livelli di significatività del test ma solo il valore del p-value Il p-value è il massimo livello di α che avremmo potuto fissare che ci avrebbe permesso di rifiutare l’ipotesi nulla alla luce dei dati campionari p = P(Z > z) α ≤ p Si accetta H0 α > p Si rifiuta H0 6