...

ANOVA fattoriale - Dipartimento di Psicologia

by user

on
Category: Documents
26

views

Report

Comments

Transcript

ANOVA fattoriale - Dipartimento di Psicologia
Analisi della Varianza - II
M
Q
ANOVA tra i soggetti
Cristina Zogmaister
Milano-Bicocca
1
Lez: XXIX
Analisi della Varianza
(ANOVA, Analysis of Variance)
Obiettivo
Confrontare due o più gruppi per stabilire se differiscono significativamente nella media di una
(ANOVA, ANCOVA) o più variabili (MANOVA)
Tipi
- ANOVA a una via - Una sola V.I., una sola V.D.
ANOVA fattoriale - Più di una V.I., una sola V.D.
ANCOVA (Analysis of Covariance; Analisi della Covarianza) - Presenza di Covariate
(variabili di cui si desidera controllare statisticamente l’effetto sulla V.D.)
MANOVA (Multivariate Analysis of Variance; ANOVA multivariata) - Più di una V.D.
ANOVA tra i soggetti (between subjects), entro i soggetti (within subjects), ANOVA mista
2
Lezione: XXVIII
ANOVA a una via tra i soggetti - Esempio
Studio sui consumi
-
-
Obiettivo: studiare il livello di soddisfazione degli acquirenti di 4 tipi di
automobili di media cilindrata (per semplicità indichiamo il marchio), a un
anno dall’acquisto.
Intervista a 20 acquirenti per ogni marchio, calcolo di un indicatore di
soddisfazione
H0: μ1 = μ2 = μ3 = μ4
xij = μ + αi + εij
Fattore MODELLO D’AUTOMOBILE
xij = X + (X𝑖 − X) + (X𝑖𝑗 − X𝑖 )
DEVIANZA (= SOMMA DEI
QUADRATI, SQ) = 𝑖 𝑥𝑖 − 𝑋 2
SQTOT
SQTRA
SQENTRO
3
Lezione: XXVIII
ANOVA a una via – la VARIANZA
Possiamo stimare la varianza (MQ = media dei quadrati)
SQTOT
-
Varianza totale:
MQTOT =
-
Varianza entro:
MQENTRO =
-
Varianza tra:
MQTRA =
(N −1)
SQENTRO
SQTRA
(N − k)
(k −1)
N = numerosità complessiva; k = numero di livelli
Il rapporto F
𝑴𝑸𝑻𝑹𝑨
𝑭=
𝑴𝑸𝑬𝑵𝑻𝑹𝑶
F è il rapporto tra
la varianza stimata a partire dalla variabilità tra le condizioni e
la varianza stimata a partire dalla variabilità entro le condizioni.
Se è vera H0 allora questo rapporto dovrebbe approssimarsi a 1.
Segue la distribuzione F di Fisher.
4
Lezione: XXVIII
ANOVA – Torniamo al nostro esempio
H0: μ1 = μ2 = μ3 = μ4
Ipotesi alternativa:
almeno una delle medie,
nella popolazione, è
diversa dalle altre
SQ
MQ
F=
𝑀𝑄𝑇𝑅𝐴
446.42
=
=16.549
𝑀𝑄𝐸𝑁𝑇𝑅𝑂
26.976
5
Lezione: XXVIII
ANOVA – Ampiezza dell’effetto
Eta quadrato: la proporzione di variabilità
osservata attribuibile al fattore
η2 =
𝑆𝑄𝐸𝐹𝐹𝐸𝑇𝑇𝑂
𝑆𝑄𝑇𝑂𝑇𝐴𝐿𝐸
=
1339.261
3389.454
= .395
6
Lezione: XXVIII
ANOVA - assunzioni
Distribuzione normale della V.D. entro le condizioni
Omoschedasticità (= varianza uguale in ogni condizione)
- La violazione di queste assunzioni provoca problemi soprattutto se il disegno non è
bilanciato (ossia se il numero di soggetti varia molto da cella a cella)
- Il problema è che il livello nominale di significatività è distorto
Indipendenza degli errori: il punteggio di un soggetto non deve essere correlato con quello di
altri soggetti.
Violazione Esempio 1 : voglio valutare l’effetto di due diverse modalità di insegnamento della
statistica. Prendo due classi preesistenti, a una insegno nel modo A, all’altra nel modo B.
Non va bene perché gli appartenenti a uno stesso gruppo possono essere in partenza più
simili tra loro e l’errore non è indipendente
Violazione Esempio 2: un soggetto contribuisce più di un valore (es. un soggetto è misurato
nella condizione A e anche nella condizione B).
Conseguenze della violazione: Il livello nominale di significatività è distorto.
L’effetto dei fattori è additivo
Esempio di effetto potenzialmente non additivo: uno spot provoca un incremento nei consumi
del 10% rispetto al consumo di base (ossia, un incremento di 5 in chi già consumava 50, un
incremento di 2 in chi consumava 20).
Soluzione: trasformare la variabile per avere un effetto additivo.
7
Lezione: XXIX
ANOVA a una via – interpretazione
Possiamo rigettare H0: μ1 = μ2 = μ3 = μ4 :
- la probabilità di osservare le differenze che abbiamo osservato tra le medie dei 4
campioni è molto bassa, se provengono tutti da una stessa popolazione.
- Il fattore marca ha un effetto statisticamente significativo sul grado di
soddisfazione dei clienti. Il livello di soddisfazione è influenzato dalla marca
acquistata.
Possiamo allora affermare che tutte le medie differiscono significativamente tra
loro?
No: sappiamo che almeno una differisce significativamente dalle altre.
8
Lezione: XXIX
ANOVA a una via – interpretazione
Possiamo fare 6 t-test e vedere quali differenze tra le marche sono staticamente
significative?
Sì, ma dobbiamo considerare che i 6 t-test non sono indipendenti.
Perciò fare 6 t-test porterebbe a un aumento del livello reale di probabilità d’errore nel
rigettare H0
Dobbiamo apportare una
correzione per tenere conto
di questo rischio:
Confronti post hoc
9
Lezione: XXIX
ANOVA – confronti post hoc
post hoc = dopo il fatto (non abbiamo ipotesi a priori) – confronto tra diversi livelli di
un fattore, effettuato dopo un’analisi iniziale dei dati.
nei confronti post hoc generalmente ogni media viene confrontata con tutte le altre.
aumentando il nr. di confronti, aumenta la probabilità che almeno uno risulti
significativo per caso
dobbiamo apportare delle correzioni alla significatività di ogni singolo test.
Anche se ci limitassimo a
confrontare, per esempio,
la condizione Audi e la
condizione Peugeot perché
sono le più estreme,
avremmo implicitamente
fatto anche tutti gli altri 5
confronti
DISUGUAGLIANZA DI BONFERRONI:
Dati c confronti post hoc,
probabilità che almeno uno sia significativo per caso ≤ c * αc
dove αc è il valore che adotto per decidere se il singolo confronto è significativo.
Scelgo il valore αc = α / c
Esempio: se il nr di confronti totale è 6 e voglio che il valore complessivo α = .05,
per ciascun confronto giudico la differenza come significativa solo se p < (.05 /6), ossia
se p < .0083.
= criterio di Bonferroni
10
Lezione: XXIX
ANOVA – confronti post hoc
SPSS offre anche altre possibilità
Esempi:
- Scheffè – confronti tra tutti i gruppi
- Dunnett – quando uno dei gruppi assume il ruolo di ‘controllo’ [tutti
gli altri gruppi vengono confrontati con il gruppo di controllo
11
Lezione: XXIX
12
Lezione: XXIX
ANOVA – confronti post hoc
Nota: i valori di p riportati da SPSS nel caso dei confronti post hoc contengono già
la correzione per il numero di confronti effettuati.
Tenendo conto del che sono stati fatti 6 confronti a coppie, la probabilità di
osservare una differenza di 4.54 o superiore tra il grado di soddisfazione nelle due
condizioni se le due medie nella popolazione non differiscono è uguale a .043.
Se avessimo effettuato un t-test senza la correzione di Bonferroni:
13
Lezione: XXIX
ANOVA a una via – riportare i risultati
Il livello di soddisfazione dei clienti, a un anno dall’acquisto, è significativamente
diverso a seconda del modello acquistato, F (3,76) = 16.55, p < .001, η2 =.39.
Le principali statistiche descrittive (medie e deviazioni standard) relative all’indice
di soddisfazione, a seconda della condizione sperimentale, sono riportate nella
tabella 1.
I risultati dei test post hoc (eseguiti apportando la correzione di Bonferroni) sono
riportati nella tabella 2. Essi evidenziano una differenza significativa tra le
valutazioni medie della marca Peugeot e quelle delle altre marche. Anche la
differenza tra l’indice medio di soddisfazione degli acquirenti Audi e degli
acquirenti BMW è significativa. Nessun’altra differenza si è rivelata significativa ai
test post hoc.
14’
Lezione: XXIX
Contrasti pianificati
Il ricercatore ha ipotesi a priori circa le differenze tra le medie.
→ si decide in anticipo quali medie verranno confrontate.
Esempio: programma di formazione.
Ipotizzo che se, durante il corso, viene fornito un feedback sulla prestazione, questo influenzi
l’efficacia del corso.
Ipotizzo che l’effetto del feedback sia diverso se è orale o scritto.
3 condizioni:
A: condizione di controllo (nessun feedback)
B: condizione feedback orale
C: condizione feedback scritto
Devo fare 2 confronti:
Tra A e (B + C) → per verificare l’effetto del feedback
Tra B e C → per testare il modo in cui viene fornito provoca differenze
Non è necessario effettuare prima l’ANOVA omnibus (è possibile testare subito le
differenze d’interesse)
15
Lezione: XXIX
Contrasti pianificati - II
1) Stabilire le ipotesi da testare
Nel nostro caso:
a) La media del gruppo A non è diversa dalla media complessiva dei gruppi B e C
b) La media del grupppo B non è diversa dalla media del gruppo C
2) Assegnare dei coefficienti dei contrasti
= tradurre le ipotesi in contrasti l  a1 1  a2  2    at  t
t
che soddisfano il requisito
 ai
0
i 1
Nel nostro caso:
a) μA non è diversa da μB+C
allora 2 * μA = μB + μC → 2 * μA – 1* μB – 1* μC = 0
e il primo contrasto è l 1  2   ( 1)   ( 1) 
A
B
C
b) se μB non è diversa da μC
allora μB = μC → 1 * μB – 1* μC = 0
e il secondo contrasto è l 2  0 *  A  1*  B  ( 1) *  C
16
Lezione: XXIX
Contrasti pianificati - II
3) Verificare che i contrasti siano ortogonali
l 1  2  A  ( 1)  B  ( 1)  C
l 2  0 *  A  1*  B  ( 1) *  C
t
 ai
0
i 1
Contrasti ortogonali: forniscono informazioni indipendenti (cioè i risultati del primo
non consentono di ottenere indicazioni sul secondo, e vice versa).
Dati k livelli di un fattore, possiamo ottenere al massimo (k-1) contrasti ortogonali.
Come si testa l’ortogonalità: la somma dei prodotti dei coefficienti relativi a due contrasti
t
è uguale a zero.
l1 * l 2  a1b1  a2 b2    at bt 
l1 * l 2
a
i 1
i
bi  0
17
 2 * 0  ( 1) *1  ( 1) * ( 1)  0  ( 1)  1  0
Importanza dell’ortogonalità tra tutti i (k-1) contrasti
Se i (k-1) contrasti sono tutti ortogonali tra loro, allora la somma delle
loro devianza ( SQl) corrisponde alla devianza osservata tra i gruppi
( SQTRA)
In altre parole: la variabilità dell’effetto può essere ripartita tra i (k-1)
contrasti lineari che forniscono così (k-1) elementi di informazione
indipendenti sulle medie.
18
Lezione: XXIX
Esempio di contrasti non-ortogonali
Confronto condizione di controllo con condizione feedback orale
Confronto condizione di controllo con condizione feedback scritto
l 3  ( 1)  A  ( 1)  B
l 4  1*  A  ( 1) *  C
Entrambi i contrasti sono formalmente corretti,
ma non sono ortogonali tra loro.
19
Lezione: XXIX
Contrasti pianificati - esempio
Esempio: programma di formazione.
Ipotizzo che se, durante il corso, do un feedback sulla prestazione, questo abbia effetti
sull’efficacia del corso.
Ipotizzo che gli effetti sull’efficacia siano influenzati conoscere il modo in cui viene valutata
la prestazione.
3 condizioni:
A: condizione di controllo (nessun feedback)
B: condizione feedback orale
C: condizione feedback scritto
l1  2 A  (1)  B  (1) C
l 2  0 *  A  1*  B  (1) * C
20
Lezione: XXIX
Contrasti pianificati – esempio
Con i post-hoc avrei ottenuto risultati diversi
3 condizioni:
A: condizione di controllo (nessun feedback)
B: condizione feedback orale
C: condizione feedback scritto
Se avessi effettuato un’ANOVA con test post hoc, avrei concluso che non ci sono differenze
significative tra le due condizioni feedback orale e feedback scritto.
I contrasti pianificati mostrano che la differenza tra queste due condizioni è significativa.
→ Se ho chiare ipotesi a priori, i contrasti pianificati sono più potenti (preferibili).
21
Lezione: XXIX
ANOVA fattoriale tra i soggetti (between subjects)
ANOVA fattoriale = ci sono due o più variabili indipendenti (fattori)
Esempio: soddisfazione degli acquirenti di 4 modelli di automobili
di media cilindrata, di sesso femminile e maschile
tra i soggetti: ogni
soggetto viene
assegnato a una
sola cella
(condizione)
22 XXIX
Lezione:
ANOVA fattoriale tra i soggetti (between subjects)
ANOVA fattoriale = ci sono due o più variabili indipendenti (fattori)
Esempio: soddisfazione degli acquirenti di 4 modelli di automobili
di media cilindrata, di sesso femminile e maschile
tra i soggetti: ogni
soggetto viene
assegnato a una
sola cella
(condizione)
23 XXIX
Lezione:
ANOVA fattoriale - vantaggi
Vantaggi dei disegni fattoriali
Consentono lo studio dell’interazione
Aumentano la potenza del test (cioè la probabilità di rilevare un
effetto, se l’effetto è presente) perché consentono di ridurre la varianza
d’errore (cfr. slides successive)
24
Lezione: XXIX
ANOVA fattoriale – effetti principali e interazioni
Effetto principale: effetto medio di un fattore
sulla V.D., senza considerare i livelli degli
altri fattori.
C’è un effetto del tipo di
modello sul grado di soddisfazione.
Non c’è un effetto significativo del
sesso dell’acquirente
Interazione: L’effetto di un fattore sulla V.D.
è diverso ai diversi livelli dell’altro fattore
L’effetto del tipo di modello è
influenzato dal sesso dell’acquirente
25
Lezione: XXIX
ANOVA fattoriale – le ipotesi
Effetti principali
Gli effetti principali fanno riferimento alle medie marginali
H0: μaudi = μbmw = μpeugeot = μcitroen
H0: μdonne = μuomini
Interazioni
fanno riferimento alle differenze tra le medie nelle diverse
combinazioni sperimentali
H0: (μdonne - μuomini)audi = (μdonne - μuomini)bmw = (μdonne - μuomini)peugeot =
(μdonne - μuomini)citroen
26
Lezione: XXIX
ANOVA fattoriale – interpretazione dei risultati
Non c’è un effetto principale del sesso: non possiamo rifiutare l’ipotesi nulla che il
sesso non incida sul livello medio di soddisfazione, F(1,72) = 1,14, p = .29.
C’è un effetto principale del modello: in generale l’indice di soddisfazione è
influenzato dal modello acquistato, F(3,72) = 19.52, p < .001, η2p = .45.
L’effetto del modello è qualificato da un’interazione significativa, F(3,72) = 5.50,
p = .002, η2p = .19
- Quando c’è un’interazione significativa, bisogna sempre interpretare gli
effetti principali alla luce di tale interazione.
27
Lezione: XXIX
ANOVA fattoriale e interazione
Se l’interazione è significativa
gli effetti principali vanno interpretati discutendo anche le interazioni.
L’effetto principale di un fattore potrebbe verificarsi solo su un livello dell’altro
fattore:
28
Lezione: XXIX
ANOVA fattoriale e interazione – gli effetti semplici
Come interpretiamo l’interazione significativa?
Scomponiamo il disegno e analizziamo gli effetti semplici.
- Effetti semplici: effetti di un fattore sulla V.D., separatamente per i
diversi valori dell’altro fattore.
- Analizziamo l’effetto del fattore ‘Modello’ separatamente per i
diversi livelli del fattore ‘Sesso’.
29
Lezione: XXIX
ANOVA fattoriale e interazione – gli effetti semplici
30
Lezione: XXIX
Nel caso delle donne,
tutti i confronti a coppie
sono significativi, tranne
quello tra audi e
citroen.
Nel caso degli uomini,
solo il confronto tra
Peugeot e le altre
marche è significativo.
31
Lezione: XXIX
ANOVA fattoriale - interpretazione
Se l’interazione non è significativa
Vanno analizzati e discussi gli effetti principali (con i contrasti pianificati o con i confronti
post hoc, a seconda della presenza o meno di ipotesi a priori).
Esempio: in un negozio d’abbigliamento si vuole testare l’effetto del tipo di servizio dato
al cliente (a. cliente autonomo nel cercarsi i capi e provarli, b. viene fornita assistenza
solo se richiesta, c. i commessi ‘servono’ il cliente) sulla spesa media effettuata.
Viene considerato anche il sesso
dell’acquirente.
32
Lezione: XXIX
ANOVA fattoriale - interpretazione
Le donne, mediamente, hanno speso più degli uomini. L’ANOVA fattoriale tra i
soggetti rivela che l’effetto principale del sesso è significativo, F (1, 54) = 64,65, p
<.001, ηp2.=.54. Anche l’effetto principale del tipo di servizio è significativo, F (2,
54) = 23.089, p <.001, ηp2.=.46. L’interazione invece non si è rivelata
statisticamente significativa, F (2, 54) = 2.11, p =.13.
L’effetto principale del tipo di servizio è stato ulteriormente indagato attraverso dei
confronti multipli post hoc (correzione di Bonferroni).
33
Lezione: XXIX
ANOVA fattoriale - interpretazione
I test post hoc hanno evidenziato che tutte e tre le medie di acquisto sono
significativamente diverse tra loro, tutti i p < .02.
34
Lezione: XXIX
ANOVA fattoriale – la scomposizione della varianza
Il modello teorico dell’ANOVA a una via tra i soggetti:
xij = μ + αi + εij
Nell’ANOVA fattoriale:
xij = μ + αi + βj + φij + εijk
dove
- αi = μi - μ
rappresenta l’effetto del livello i del fattore A
- βj = μj - μ
rappresenta l’effetto del livello j del fattore B
- φij = μij - μ – (αi + βj ) rappresenta l’effetto dell’interazione: quella
parte dello scostamento della media della cella ij dalla media
generale che non dipende né dal fattore A, né dal fattore B.
- εijk rappresenta l’errore
35
Lezione: XXIX
ANOVA fattoriale – la scomposizione della varianza
Nell’ANOVA fattoriale
xij = μ + αi + βj + φij + εijk
per esaminare empiricamente il modello consideriamo le stime
campionarie dei suoi parametri:
xij = X + (X𝐴𝑖 − X) + (X𝐵𝑗 − X) + (X𝐴𝑖𝐵𝑗 + X − X𝐴𝑖 − X𝐵𝑗) + (X𝑖𝑗 − X𝑖𝑗)
SQTOT
SQENTRO
g.l.: N - 1
SQTRA
g.l.: N – a*b
SQA
g.l.: a – 1
SQB
g.l.: b – 1
SQA * B
g.l.: (a–1)*(b–1)
36
Lezione: XXIX
ANOVA fattoriale – la scomposizione della varianza
SQTOT
SQENTRO
g.l.: N - 1
SQTRA
g.l.: N – a*b
SQA
g.l.: a – 1
SQB
g.l.: b – 1
SQA * B
g.l.: (a–1)*(b–1)
MQ = SQ / g.l.
FA = MQA / MQENTRO
FB = MQB / MQENTRO
FA*B = MQA*B / MQENTRO
Vantaggio dell’ANOVA fattoriale:
SQENTRO e MQENTRO
sono tipicamente più piccole che nell’ANOVA a
una via perché alcune fonti di variabilità non
sono più d’errore.
Questo aumenta la potenza del test.
37
Lezione: XXIX
ANOVA fattoriale – perché aumenta la potenza del test
La devianza d’errore diminuisce
Perché l’altro fattore e
l’interazione spiegano parte
della variabilità.
Anche i g.l. dell’errore
diminuiscono, ma [se l’altro
fattore ha degli effetti sulla
V.D.] questa diminuzione è più
che compensato dalla
diminuzione della devianza.
L’effetto del fattore A emerge
ancora più chiaramente.
38
Lezione: XXIX
Fly UP