Comments
Transcript
ANOVA fattoriale - Dipartimento di Psicologia
Analisi della Varianza - II M Q ANOVA tra i soggetti Cristina Zogmaister Milano-Bicocca 1 Lez: XXIX Analisi della Varianza (ANOVA, Analysis of Variance) Obiettivo Confrontare due o più gruppi per stabilire se differiscono significativamente nella media di una (ANOVA, ANCOVA) o più variabili (MANOVA) Tipi - ANOVA a una via - Una sola V.I., una sola V.D. ANOVA fattoriale - Più di una V.I., una sola V.D. ANCOVA (Analysis of Covariance; Analisi della Covarianza) - Presenza di Covariate (variabili di cui si desidera controllare statisticamente l’effetto sulla V.D.) MANOVA (Multivariate Analysis of Variance; ANOVA multivariata) - Più di una V.D. ANOVA tra i soggetti (between subjects), entro i soggetti (within subjects), ANOVA mista 2 Lezione: XXVIII ANOVA a una via tra i soggetti - Esempio Studio sui consumi - - Obiettivo: studiare il livello di soddisfazione degli acquirenti di 4 tipi di automobili di media cilindrata (per semplicità indichiamo il marchio), a un anno dall’acquisto. Intervista a 20 acquirenti per ogni marchio, calcolo di un indicatore di soddisfazione H0: μ1 = μ2 = μ3 = μ4 xij = μ + αi + εij Fattore MODELLO D’AUTOMOBILE xij = X + (X𝑖 − X) + (X𝑖𝑗 − X𝑖 ) DEVIANZA (= SOMMA DEI QUADRATI, SQ) = 𝑖 𝑥𝑖 − 𝑋 2 SQTOT SQTRA SQENTRO 3 Lezione: XXVIII ANOVA a una via – la VARIANZA Possiamo stimare la varianza (MQ = media dei quadrati) SQTOT - Varianza totale: MQTOT = - Varianza entro: MQENTRO = - Varianza tra: MQTRA = (N −1) SQENTRO SQTRA (N − k) (k −1) N = numerosità complessiva; k = numero di livelli Il rapporto F 𝑴𝑸𝑻𝑹𝑨 𝑭= 𝑴𝑸𝑬𝑵𝑻𝑹𝑶 F è il rapporto tra la varianza stimata a partire dalla variabilità tra le condizioni e la varianza stimata a partire dalla variabilità entro le condizioni. Se è vera H0 allora questo rapporto dovrebbe approssimarsi a 1. Segue la distribuzione F di Fisher. 4 Lezione: XXVIII ANOVA – Torniamo al nostro esempio H0: μ1 = μ2 = μ3 = μ4 Ipotesi alternativa: almeno una delle medie, nella popolazione, è diversa dalle altre SQ MQ F= 𝑀𝑄𝑇𝑅𝐴 446.42 = =16.549 𝑀𝑄𝐸𝑁𝑇𝑅𝑂 26.976 5 Lezione: XXVIII ANOVA – Ampiezza dell’effetto Eta quadrato: la proporzione di variabilità osservata attribuibile al fattore η2 = 𝑆𝑄𝐸𝐹𝐹𝐸𝑇𝑇𝑂 𝑆𝑄𝑇𝑂𝑇𝐴𝐿𝐸 = 1339.261 3389.454 = .395 6 Lezione: XXVIII ANOVA - assunzioni Distribuzione normale della V.D. entro le condizioni Omoschedasticità (= varianza uguale in ogni condizione) - La violazione di queste assunzioni provoca problemi soprattutto se il disegno non è bilanciato (ossia se il numero di soggetti varia molto da cella a cella) - Il problema è che il livello nominale di significatività è distorto Indipendenza degli errori: il punteggio di un soggetto non deve essere correlato con quello di altri soggetti. Violazione Esempio 1 : voglio valutare l’effetto di due diverse modalità di insegnamento della statistica. Prendo due classi preesistenti, a una insegno nel modo A, all’altra nel modo B. Non va bene perché gli appartenenti a uno stesso gruppo possono essere in partenza più simili tra loro e l’errore non è indipendente Violazione Esempio 2: un soggetto contribuisce più di un valore (es. un soggetto è misurato nella condizione A e anche nella condizione B). Conseguenze della violazione: Il livello nominale di significatività è distorto. L’effetto dei fattori è additivo Esempio di effetto potenzialmente non additivo: uno spot provoca un incremento nei consumi del 10% rispetto al consumo di base (ossia, un incremento di 5 in chi già consumava 50, un incremento di 2 in chi consumava 20). Soluzione: trasformare la variabile per avere un effetto additivo. 7 Lezione: XXIX ANOVA a una via – interpretazione Possiamo rigettare H0: μ1 = μ2 = μ3 = μ4 : - la probabilità di osservare le differenze che abbiamo osservato tra le medie dei 4 campioni è molto bassa, se provengono tutti da una stessa popolazione. - Il fattore marca ha un effetto statisticamente significativo sul grado di soddisfazione dei clienti. Il livello di soddisfazione è influenzato dalla marca acquistata. Possiamo allora affermare che tutte le medie differiscono significativamente tra loro? No: sappiamo che almeno una differisce significativamente dalle altre. 8 Lezione: XXIX ANOVA a una via – interpretazione Possiamo fare 6 t-test e vedere quali differenze tra le marche sono staticamente significative? Sì, ma dobbiamo considerare che i 6 t-test non sono indipendenti. Perciò fare 6 t-test porterebbe a un aumento del livello reale di probabilità d’errore nel rigettare H0 Dobbiamo apportare una correzione per tenere conto di questo rischio: Confronti post hoc 9 Lezione: XXIX ANOVA – confronti post hoc post hoc = dopo il fatto (non abbiamo ipotesi a priori) – confronto tra diversi livelli di un fattore, effettuato dopo un’analisi iniziale dei dati. nei confronti post hoc generalmente ogni media viene confrontata con tutte le altre. aumentando il nr. di confronti, aumenta la probabilità che almeno uno risulti significativo per caso dobbiamo apportare delle correzioni alla significatività di ogni singolo test. Anche se ci limitassimo a confrontare, per esempio, la condizione Audi e la condizione Peugeot perché sono le più estreme, avremmo implicitamente fatto anche tutti gli altri 5 confronti DISUGUAGLIANZA DI BONFERRONI: Dati c confronti post hoc, probabilità che almeno uno sia significativo per caso ≤ c * αc dove αc è il valore che adotto per decidere se il singolo confronto è significativo. Scelgo il valore αc = α / c Esempio: se il nr di confronti totale è 6 e voglio che il valore complessivo α = .05, per ciascun confronto giudico la differenza come significativa solo se p < (.05 /6), ossia se p < .0083. = criterio di Bonferroni 10 Lezione: XXIX ANOVA – confronti post hoc SPSS offre anche altre possibilità Esempi: - Scheffè – confronti tra tutti i gruppi - Dunnett – quando uno dei gruppi assume il ruolo di ‘controllo’ [tutti gli altri gruppi vengono confrontati con il gruppo di controllo 11 Lezione: XXIX 12 Lezione: XXIX ANOVA – confronti post hoc Nota: i valori di p riportati da SPSS nel caso dei confronti post hoc contengono già la correzione per il numero di confronti effettuati. Tenendo conto del che sono stati fatti 6 confronti a coppie, la probabilità di osservare una differenza di 4.54 o superiore tra il grado di soddisfazione nelle due condizioni se le due medie nella popolazione non differiscono è uguale a .043. Se avessimo effettuato un t-test senza la correzione di Bonferroni: 13 Lezione: XXIX ANOVA a una via – riportare i risultati Il livello di soddisfazione dei clienti, a un anno dall’acquisto, è significativamente diverso a seconda del modello acquistato, F (3,76) = 16.55, p < .001, η2 =.39. Le principali statistiche descrittive (medie e deviazioni standard) relative all’indice di soddisfazione, a seconda della condizione sperimentale, sono riportate nella tabella 1. I risultati dei test post hoc (eseguiti apportando la correzione di Bonferroni) sono riportati nella tabella 2. Essi evidenziano una differenza significativa tra le valutazioni medie della marca Peugeot e quelle delle altre marche. Anche la differenza tra l’indice medio di soddisfazione degli acquirenti Audi e degli acquirenti BMW è significativa. Nessun’altra differenza si è rivelata significativa ai test post hoc. 14’ Lezione: XXIX Contrasti pianificati Il ricercatore ha ipotesi a priori circa le differenze tra le medie. → si decide in anticipo quali medie verranno confrontate. Esempio: programma di formazione. Ipotizzo che se, durante il corso, viene fornito un feedback sulla prestazione, questo influenzi l’efficacia del corso. Ipotizzo che l’effetto del feedback sia diverso se è orale o scritto. 3 condizioni: A: condizione di controllo (nessun feedback) B: condizione feedback orale C: condizione feedback scritto Devo fare 2 confronti: Tra A e (B + C) → per verificare l’effetto del feedback Tra B e C → per testare il modo in cui viene fornito provoca differenze Non è necessario effettuare prima l’ANOVA omnibus (è possibile testare subito le differenze d’interesse) 15 Lezione: XXIX Contrasti pianificati - II 1) Stabilire le ipotesi da testare Nel nostro caso: a) La media del gruppo A non è diversa dalla media complessiva dei gruppi B e C b) La media del grupppo B non è diversa dalla media del gruppo C 2) Assegnare dei coefficienti dei contrasti = tradurre le ipotesi in contrasti l a1 1 a2 2 at t t che soddisfano il requisito ai 0 i 1 Nel nostro caso: a) μA non è diversa da μB+C allora 2 * μA = μB + μC → 2 * μA – 1* μB – 1* μC = 0 e il primo contrasto è l 1 2 ( 1) ( 1) A B C b) se μB non è diversa da μC allora μB = μC → 1 * μB – 1* μC = 0 e il secondo contrasto è l 2 0 * A 1* B ( 1) * C 16 Lezione: XXIX Contrasti pianificati - II 3) Verificare che i contrasti siano ortogonali l 1 2 A ( 1) B ( 1) C l 2 0 * A 1* B ( 1) * C t ai 0 i 1 Contrasti ortogonali: forniscono informazioni indipendenti (cioè i risultati del primo non consentono di ottenere indicazioni sul secondo, e vice versa). Dati k livelli di un fattore, possiamo ottenere al massimo (k-1) contrasti ortogonali. Come si testa l’ortogonalità: la somma dei prodotti dei coefficienti relativi a due contrasti t è uguale a zero. l1 * l 2 a1b1 a2 b2 at bt l1 * l 2 a i 1 i bi 0 17 2 * 0 ( 1) *1 ( 1) * ( 1) 0 ( 1) 1 0 Importanza dell’ortogonalità tra tutti i (k-1) contrasti Se i (k-1) contrasti sono tutti ortogonali tra loro, allora la somma delle loro devianza ( SQl) corrisponde alla devianza osservata tra i gruppi ( SQTRA) In altre parole: la variabilità dell’effetto può essere ripartita tra i (k-1) contrasti lineari che forniscono così (k-1) elementi di informazione indipendenti sulle medie. 18 Lezione: XXIX Esempio di contrasti non-ortogonali Confronto condizione di controllo con condizione feedback orale Confronto condizione di controllo con condizione feedback scritto l 3 ( 1) A ( 1) B l 4 1* A ( 1) * C Entrambi i contrasti sono formalmente corretti, ma non sono ortogonali tra loro. 19 Lezione: XXIX Contrasti pianificati - esempio Esempio: programma di formazione. Ipotizzo che se, durante il corso, do un feedback sulla prestazione, questo abbia effetti sull’efficacia del corso. Ipotizzo che gli effetti sull’efficacia siano influenzati conoscere il modo in cui viene valutata la prestazione. 3 condizioni: A: condizione di controllo (nessun feedback) B: condizione feedback orale C: condizione feedback scritto l1 2 A (1) B (1) C l 2 0 * A 1* B (1) * C 20 Lezione: XXIX Contrasti pianificati – esempio Con i post-hoc avrei ottenuto risultati diversi 3 condizioni: A: condizione di controllo (nessun feedback) B: condizione feedback orale C: condizione feedback scritto Se avessi effettuato un’ANOVA con test post hoc, avrei concluso che non ci sono differenze significative tra le due condizioni feedback orale e feedback scritto. I contrasti pianificati mostrano che la differenza tra queste due condizioni è significativa. → Se ho chiare ipotesi a priori, i contrasti pianificati sono più potenti (preferibili). 21 Lezione: XXIX ANOVA fattoriale tra i soggetti (between subjects) ANOVA fattoriale = ci sono due o più variabili indipendenti (fattori) Esempio: soddisfazione degli acquirenti di 4 modelli di automobili di media cilindrata, di sesso femminile e maschile tra i soggetti: ogni soggetto viene assegnato a una sola cella (condizione) 22 XXIX Lezione: ANOVA fattoriale tra i soggetti (between subjects) ANOVA fattoriale = ci sono due o più variabili indipendenti (fattori) Esempio: soddisfazione degli acquirenti di 4 modelli di automobili di media cilindrata, di sesso femminile e maschile tra i soggetti: ogni soggetto viene assegnato a una sola cella (condizione) 23 XXIX Lezione: ANOVA fattoriale - vantaggi Vantaggi dei disegni fattoriali Consentono lo studio dell’interazione Aumentano la potenza del test (cioè la probabilità di rilevare un effetto, se l’effetto è presente) perché consentono di ridurre la varianza d’errore (cfr. slides successive) 24 Lezione: XXIX ANOVA fattoriale – effetti principali e interazioni Effetto principale: effetto medio di un fattore sulla V.D., senza considerare i livelli degli altri fattori. C’è un effetto del tipo di modello sul grado di soddisfazione. Non c’è un effetto significativo del sesso dell’acquirente Interazione: L’effetto di un fattore sulla V.D. è diverso ai diversi livelli dell’altro fattore L’effetto del tipo di modello è influenzato dal sesso dell’acquirente 25 Lezione: XXIX ANOVA fattoriale – le ipotesi Effetti principali Gli effetti principali fanno riferimento alle medie marginali H0: μaudi = μbmw = μpeugeot = μcitroen H0: μdonne = μuomini Interazioni fanno riferimento alle differenze tra le medie nelle diverse combinazioni sperimentali H0: (μdonne - μuomini)audi = (μdonne - μuomini)bmw = (μdonne - μuomini)peugeot = (μdonne - μuomini)citroen 26 Lezione: XXIX ANOVA fattoriale – interpretazione dei risultati Non c’è un effetto principale del sesso: non possiamo rifiutare l’ipotesi nulla che il sesso non incida sul livello medio di soddisfazione, F(1,72) = 1,14, p = .29. C’è un effetto principale del modello: in generale l’indice di soddisfazione è influenzato dal modello acquistato, F(3,72) = 19.52, p < .001, η2p = .45. L’effetto del modello è qualificato da un’interazione significativa, F(3,72) = 5.50, p = .002, η2p = .19 - Quando c’è un’interazione significativa, bisogna sempre interpretare gli effetti principali alla luce di tale interazione. 27 Lezione: XXIX ANOVA fattoriale e interazione Se l’interazione è significativa gli effetti principali vanno interpretati discutendo anche le interazioni. L’effetto principale di un fattore potrebbe verificarsi solo su un livello dell’altro fattore: 28 Lezione: XXIX ANOVA fattoriale e interazione – gli effetti semplici Come interpretiamo l’interazione significativa? Scomponiamo il disegno e analizziamo gli effetti semplici. - Effetti semplici: effetti di un fattore sulla V.D., separatamente per i diversi valori dell’altro fattore. - Analizziamo l’effetto del fattore ‘Modello’ separatamente per i diversi livelli del fattore ‘Sesso’. 29 Lezione: XXIX ANOVA fattoriale e interazione – gli effetti semplici 30 Lezione: XXIX Nel caso delle donne, tutti i confronti a coppie sono significativi, tranne quello tra audi e citroen. Nel caso degli uomini, solo il confronto tra Peugeot e le altre marche è significativo. 31 Lezione: XXIX ANOVA fattoriale - interpretazione Se l’interazione non è significativa Vanno analizzati e discussi gli effetti principali (con i contrasti pianificati o con i confronti post hoc, a seconda della presenza o meno di ipotesi a priori). Esempio: in un negozio d’abbigliamento si vuole testare l’effetto del tipo di servizio dato al cliente (a. cliente autonomo nel cercarsi i capi e provarli, b. viene fornita assistenza solo se richiesta, c. i commessi ‘servono’ il cliente) sulla spesa media effettuata. Viene considerato anche il sesso dell’acquirente. 32 Lezione: XXIX ANOVA fattoriale - interpretazione Le donne, mediamente, hanno speso più degli uomini. L’ANOVA fattoriale tra i soggetti rivela che l’effetto principale del sesso è significativo, F (1, 54) = 64,65, p <.001, ηp2.=.54. Anche l’effetto principale del tipo di servizio è significativo, F (2, 54) = 23.089, p <.001, ηp2.=.46. L’interazione invece non si è rivelata statisticamente significativa, F (2, 54) = 2.11, p =.13. L’effetto principale del tipo di servizio è stato ulteriormente indagato attraverso dei confronti multipli post hoc (correzione di Bonferroni). 33 Lezione: XXIX ANOVA fattoriale - interpretazione I test post hoc hanno evidenziato che tutte e tre le medie di acquisto sono significativamente diverse tra loro, tutti i p < .02. 34 Lezione: XXIX ANOVA fattoriale – la scomposizione della varianza Il modello teorico dell’ANOVA a una via tra i soggetti: xij = μ + αi + εij Nell’ANOVA fattoriale: xij = μ + αi + βj + φij + εijk dove - αi = μi - μ rappresenta l’effetto del livello i del fattore A - βj = μj - μ rappresenta l’effetto del livello j del fattore B - φij = μij - μ – (αi + βj ) rappresenta l’effetto dell’interazione: quella parte dello scostamento della media della cella ij dalla media generale che non dipende né dal fattore A, né dal fattore B. - εijk rappresenta l’errore 35 Lezione: XXIX ANOVA fattoriale – la scomposizione della varianza Nell’ANOVA fattoriale xij = μ + αi + βj + φij + εijk per esaminare empiricamente il modello consideriamo le stime campionarie dei suoi parametri: xij = X + (X𝐴𝑖 − X) + (X𝐵𝑗 − X) + (X𝐴𝑖𝐵𝑗 + X − X𝐴𝑖 − X𝐵𝑗) + (X𝑖𝑗 − X𝑖𝑗) SQTOT SQENTRO g.l.: N - 1 SQTRA g.l.: N – a*b SQA g.l.: a – 1 SQB g.l.: b – 1 SQA * B g.l.: (a–1)*(b–1) 36 Lezione: XXIX ANOVA fattoriale – la scomposizione della varianza SQTOT SQENTRO g.l.: N - 1 SQTRA g.l.: N – a*b SQA g.l.: a – 1 SQB g.l.: b – 1 SQA * B g.l.: (a–1)*(b–1) MQ = SQ / g.l. FA = MQA / MQENTRO FB = MQB / MQENTRO FA*B = MQA*B / MQENTRO Vantaggio dell’ANOVA fattoriale: SQENTRO e MQENTRO sono tipicamente più piccole che nell’ANOVA a una via perché alcune fonti di variabilità non sono più d’errore. Questo aumenta la potenza del test. 37 Lezione: XXIX ANOVA fattoriale – perché aumenta la potenza del test La devianza d’errore diminuisce Perché l’altro fattore e l’interazione spiegano parte della variabilità. Anche i g.l. dell’errore diminuiscono, ma [se l’altro fattore ha degli effetti sulla V.D.] questa diminuzione è più che compensato dalla diminuzione della devianza. L’effetto del fattore A emerge ancora più chiaramente. 38 Lezione: XXIX