...

Lezione 09 - Brigantaggio.net

by user

on
Category: Documents
11

views

Report

Comments

Transcript

Lezione 09 - Brigantaggio.net
Verifica d’Ipotesi
Se invece che chiederci quale è il valore di una media in una popolazione (stima
Se invece
che chiederci
quale è il avessimo
valore di un’idea
una media
in unache
popolazione
puntuale
e intervallo
di confidenza)
su quello
potrebbe (stima
essere
puntuale
e
intervallo
di
confidenza)
avessimo
un’idea
su
quello
che
potrebbe
il valore incognito di una media? Come potremmo verificare se la nostra
idea é essere
vera
il valore incognito di una media? Come
potremmo verificare se la nostra idea é vera
o falsa?
o falsa?
Un’IPOTESI STATISTICA
è un assunto circa un parametro
della funzione di distribuzione di una variabile casuale
Il saggio di un’ipotesi statistica (ipotesi nulla H0)
si basa sulla dimostrazione per contraddizione
Si parte da un assunto (Ipotesi Nulla) si fanno delle argomentazioni logiche
Si parte da un
Nulla) si fanno
delle
argomentazioni
logiche
(applicazione
di assunto
un test),(Ipotesi
se le argomentazioni
non
confermano
l’assunto
di
(applicazione
di
un
test),
se
le
argomentazioni
non
confermano
l’assunto
di
partenza (risultato poco probabile), allora si contraddice (Rifiuto dell’Ipotesi
partenza (risultato poco probabile),
allora
si
contraddice
(Rifiuto
dell’Ipotesi
Nulla)
Nulla)
1
Procedimento:
- Definizione di un’ipotesi nulla e di un’alternativa
(unilaterale o bilaterale)
- Individuazione della statistica test e calcolo del valore
numerico della stessa sui dati del campione
- Riferimento della statistica test a una distribuzione
nota quando l’ipotesi nulla è vera
- Determinazione della probabilità di verificarsi (livello
soglia)
- Confronto del valore empirico verso quello teorico e
conclusioni
Alla fine della procedura un test conduce sempre a due sole alternative: o si rifiuta
l’ipotesi nulla H0, oppure si accetta (non si rifiuta)
Se si rifiuta l’ipotesi nulla quando è falsa e se non si rifiuta quando è vera, non si
Se
si rifiuta l’ipotesi
nulla
quando che
è falsa
e se non si
rifiuta
quando
è vera,
non si
commettono
errori. Dal
momento
le decisioni
sono
prese
sulla base
di un
commettono
errori.
Dal
momento
che
le
decisioni
sono
prese
sulla
base
di
campione può accadere di commettere errori: rifiutare l’ipotesi nulla quandoun
è
campione
puòtipo),
accadere
di commettere
errori:
nulla
vera (I°
non rifiutare
l’ipotesi
nulla rifiutare
quando èl’ipotesi
falsa (II°
tipo)quando è
vera (I° tipo), non rifiutare l’ipotesi nulla quando è falsa (II° tipo)
Come ogni volta che si ha a che fare con l’incertezza, si definiscono
delle probabilità di commettere l’errore di I° e di II° tipo, a e b
Non rifiuto H0
Rifiuto H0
H0 vera
Nessun errore
confidenza=1-α
Errore di I° tipo (α)
H0 falsa
Errore di II° tipo (b)
Nessun errore
Potenza=1-β
α = P ( rifiu ta re H 0 | H 0 è v e ra ) ; 1 - α = P ( n o n rifiu tare H 0 | H 0 è ve ra)
β = P ( n o n rifiu tare H 0 | H 0 è fa lsa ); 1 - β = P ( rifiu tare H 0 | H 0 è fa lsa )
2
Test d’ipotesi
sulla media
Se X
~
(
N µ, σ 2
)
Caso σ2 nota
H 0 : µ = µ0
Dato un campione estratto si calcola la statistica media campionaria e ci si chiede se la distanza
un campione
si calcola
campionaria
ci siachiede
la distanza
x − µ 0Dato
è troppo
elevata,estratto
se la distanza
è >la
distatistica
un valoremedia
k si rifiuta
l’ipotesi enulla
favorese
dell’alternativa
è troppo elevata, se la distanza è > di un valore k si rifiuta l’ipotesi nulla a favore dell’alternativa
Specificando l’alternativa è possibile fissare l’errore di I°tipo α
Specificando l’alternativa è possibile fissare l’errore di I°tipo α
Se è vera H0,
Se è vera H20,
 H 0 : µ = µ0

 H 0 : µ ≠ µ0
α/2
~

σ
N  µ0 ,

n

(



)
α = P (rifiutare H 0 | H 0 è vera) = P X − µ 0 > k | H 0 =
α/2
zα/2
X
 X − µ0



k
k
= P
>
| H0  = P  Z >
| H0 
 σ n

σ n
σ n




z1-α/2

k
k 
PZ < −
eZ >
 =α
σ n
σ n

Per la simmetria della Variabile
Per la simmetria
Variabile
Casuale
Normale della
si ottiene
Casuale Normale si ottiene
k=
σ
n
⋅ z1−α
2
Si rifiuta H0 se z > z1−α
Si rifiuta H0 se
Test d’ipotesi
sulla media
Se X
~
(
N µ, σ 2
 H 0 : µ = µ0

 H 0 : µ > µ0
)
2
dove z =
x − µ0
n
σ
Caso σ2 nota
α = P (rifiutare H 0 | H 0 è vera) = P ( X − µ0 > k | H 0 ) =
 X − µ0




k
k
k 
= P
>
| H0  = P  Z >
| H0  = P  Z >

σ n
σ n
σ n σ n




α
z1-α
Si rifiuta H0 se z > z1−α
Si rifiuta H0 se
 H 0 : µ = µ0

 H 0 : µ < µ0
dove z =
α = P (rifiutare H 0 | H 0 è vera) = P ( X − µ0 < k | H 0 ) =
 X − µ0




k
k
k 
= P
<
| H0  = P  Z <
| H0  = P  Z <

σ n
σ n
σ n σ n




α
zα
x − µ0
n
σ
z < zα
Si rifiuta H0 se
Si rifiuta H0 se
dove z =
x − µ0
σ
n
3
Test d’ipotesi
sulla media
Se X
~
(
N µ, σ 2
)
Caso σ2 ignota
1 n
varianza campionaria ⇒ s =
( xi − x )
( n − 1) ∑
i =1
2
2
 H 0 : µ = µ0

 H 0 : µ ≠ µ0
Si rifiuta H0 se t > t1−α
Si rifiuta H0 se
 H 0 : µ = µ0

 H 0 : µ > µ0
Si rifiuta H0 se t > t1−α
Si rifiuta H0 se
dove t =
x − µ0
 H 0 : µ = µ0

 H 0 : µ < µ0
t < tα
Si rifiuta H0 se
Si rifiuta H0 se
dove t =
x − µ0
Test d’ipotesi
sulla proporzione
Se è vera H0, (per n>30)
Se è vera H0, (per n>30)
Se X
pˆ − p0
p0 (1 − p0 )
n
 H 0 : p = p0

 H 0 : p ≠ p0
 H 0 : p = p0

 H 0 : p > p0
 H 0 : p = p0

 H 0 : p < p0
~
B er ( p ) allora E ( X
≈ N (0,1)
)
X = pˆ =
dove t =
2
= p eV
(X )=
x − µ0
s
s
n
n
s
n
p (1 − p )
n
1 n
n° di successi
Xi =
∑
n i =1
n
Si rifiuta H0 se z > z1−α
Si rifiuta H0 se
2
Si rifiuta H0 se z > z1−α
Si rifiuta H0 se
Si rifiuta H0 se z < zα
Si rifiuta H0 se
dove z =
dove z =
dove z =
pˆ − p0
p0 (1 − p0 )
n
pˆ − p0
p0 (1 − p0 )
n
pˆ − p0
p0 (1 − p0 )
n
4
Test d’ipotesi
per il confronto tra medie
t=
x1 − x2
1 1
+
s
n1 n2
s=
( n1 − 1) s12 + ( n2 −1) s22
n1 + n2 − 2
x1 e s12 media e varianza campionaria di un campione di numersità n1
x2 e s22 media e varianza campionaria di un campione di numersità n2
 H 0 : µ1 = µ 2

 H 0 : µ1 ≠ µ 2
g
Si rifiuta H0 se t > t 1−α
Si rifiuta H0 se
 H 0 : µ1 = µ 2

 H 0 : µ1 > µ 2
Si rifiuta H0 se t > t g1−α
Si rifiuta H0 se
 H 0 : µ1 = µ 2

 H 0 : µ1 < µ 2
Test d’ipotesi
per il confronto tra proporzioni
2
g = n1 + n2 − 2
g
Si rifiuta H0 se t < t α
Si rifiuta H0 se
z=
pˆ1 − pˆ 2
1 1
pˆ (1 − pˆ )  + 
 n1 n2 
g = n1 + n2 − 2
g = n1 + n2 − 2
pˆ =
x1 + x2
n1 + n2
pˆ1 proporzione di favorevoli in un campione di numersità n1
pˆ 2 proporzione di favorevoli in un campione di numersità n2
 H 0 : p1 = p2

 H 0 : p1 ≠ p2
Si rifiuta H0 se z > z1−α
Si rifiuta H0 se
 H 0 : p1 = p2

 H 0 : p1 > p2
Si rifiuta H0 se z > z1−α
Si rifiuta H0 se
 H 0 : p1 = p2

 H 0 : p1 < p2
Si rifiuta H0 se z < zα
Si rifiuta H0 se
2
5
Test d’ipotesi
per verificare l’indipendenza
X e Y sono fenomeni statistici rilevati congiuntamente
h: numero di modalità di X
k: numero di modalità di Y
H 0: X e Y sono stocasticamente indipendenti
H 0: X e Y sono associate o connesse
 H 0 : χ 2 = 0

2
 H 0 : χ > 0
h
k
χ = ∑∑
2
(n
ij
i =1 j =1
2
g
Si rifiuta H0 se χ > χ 1−α
Si rifiuta H0 se
− nij*
)
2
nij*
dove g = ( h − 1) ⋅ ( k − 1)
P-value
Tutti i software statistici non forniscono i livelli di significatività del test ma
solo il valore del p-value
Il p-value è il massimo livello di α che avremmo
potuto fissare che ci avrebbe permesso di rifiutare
l’ipotesi nulla alla luce dei dati campionari
p = P(Z > z)
α ≤ p Si accetta H0
α > p Si rifiuta H0
6
Fly UP