Comments
Transcript
Analisi fattoriale - Portale di Psicometria
Analisi fattoriale • L’analisi fattoriale viene effettuata per studiare, riassumere e semplificare le relazioni in un insieme di variabili • Ciò permette di individuare uno o più fattori o dimensioni latenti (ad esempio un tratto di personalità, un atteggiamento) che si suppone abbiano dato origine alle similarità tra le variabili osservate. Il punto di partenza dell’analisi fattoriale è rappresentato da una matrice che contiene le correlazioni tra le variabili osservate (R). Il punto di arrivo è formato da una matrice che contiene una misura della relazione tra le variabili osservate e i fattori latenti (A matrice di saturazione). Il modello teorico L’analisi fattoriale esamina la varianza che le variabili hanno in comune (varianza comune) L’ipotesi di base è che la correlazione tra le variabili sia determinata da dimensioni non osservabili (fattori) che in qualche modo sono causa o determinano i punteggi osservati nella variabili osservate Quando si usa… Costruzione e validazione di strumenti di misura (Ad es. gli indicatori empirici sono coerenti con la definizione del costrutto e con i criteri generativi del test?) Ridurre una grande quantità di variabili osservate in un numero più gestibile di componenti Verifica della struttura teorica di un’ insieme di misure (Un atteggiamento consta di separate componenti cognitive, emotive e comportamentali?). Terminologia Fattore = variabile (costrutto) che non è direttamente osservabile ma deve essere inferito attraverso variabili osservate. Factor Loading (saturazione) = è il coefficiente di correlazione che mostra l’importanza (peso) di ogni variabile nel definire un fattore Eigenvalue (autovalore)= rappresenta la quota di varianza delle variabili spiegata dal fattore Soluzione fattoriale = è il set di fattori e di relazioni tra variabili e fattori che rappresenta la soluzione al problema fattoriale L’analisi fattoriale si articola in alcuni passi: 1. 2. 3. 4. 5. 6. 7. Valutazione dell’adeguatezza delle variabili Valutazione della fattorializzabilità della matrice Scelta del metodo di estrazione dei fattori Scelta del numero di fattori Scelta del metodo di rotazione dei fattori Interpretazione della soluzione Validazione della soluzione Soluzione iniziale: produce in output i valori delle comunalità, gli autovalori e la proporzione di varianza spiegata Comunalità h2 • La comunalità esprime la proporzione della varianza di ogni variabile riprodotta da un certo numero di componenti. Essendo una proporzione, essa varia tra zero e uno. Quindi ci dice quanta varianza perdiamo di ciascuna variabile, tenendo conto delle componenti che abbiamo deciso di utilizzare. • Le comunalità indicano la parte di varianza spiegata di ogni indicatore, considerando il modello fattoriale stimato • Vanno tendenzialmente tenuti in considerazione item o variabili che abbiano un valore di comunalità di almeno .500 INVERSA: Matrice inversa di R RIPRODOTTA: Matrice R riprodotta dalla soluzione fattoriale e matrice dei residui COEFFICIENTI: Coefficienti di correlazione della matrice R SIGNIFICATIVITA’: Livelli di significatività dei coefficienti di R DETERMINANTE: Esamina la fattorializzabilità della matrice delle correlazioni. Se è uguale a 0 esiste almeno una variabile che è combinazione lineare perfetta delle altre, non ammette inversa e l’analisi fattoriale non può essere effettuata TEST di sfericità di Bartlett: esamina l’ipotesi nulla che R=I. Se il test è significativo si può effettuare l’analisi fattoriale. TEST KMO (Kaiser-MeyerOlkin): confronta la grandezza delle correlazioni osservate rispetto alle correlazioni parziali. Se la somma delle ultime è più piccola rispetto alle prime il KMO è vicino a 1 e la matrice può essere fattorializzata. Valori: >0.90 eccellenti 80-90 buoni 70-80 accettabili 60-70 mediocri FINESTRA ESTRAZIONI Minimi quadrati non ponderati e Minimi quadrati generalizzati: In questo metodo vengono minimizzate le correlazioni residue, cioè quella parte delle correlazioni che non è spiegata dai fattori. Non è necessaria una stima della comunalità, ma bisogna fornire il numero di fattori da estrarre. Componenti Principali (ACP) è utile per approssimare una soluzione di analisi fattoriale. Non distingue tra varianza comune e varianza unica: tutti i fattori sono fattori comuni che assorbiscono tutta la varianza e le saturazioni risultano gonfiate. Massima verosimiglianza: Stima le saturazioni della popolazione che hanno la massima verosimiglianza (massima probabilità) nel produrre la matrice delle correlazioni campionarie Determina tramite una campione di variabili i fattori comuni che hanno correlazione massima con i fattori comuni nell’universo delle variabili Fattorializzazione asse principale (o Analisi dei fattori principali AFP): è un metodo simile all’APC, ma si differenzia da questa perché utilizza una matrice ridotta e analizza soltanto la varianza che e attribuibile ai fattori comuni, eliminando la varianza unica delle variabili. Matrice delle correlazioni Soluzione fattoriale non ruotata Grafico decrescente autovalori (Scree Plot) Numero di fattori da estrarre Estrai fattori con autovalori maggiori di 1 Kaiser’s rule mineigen greater than 1 criterion (K1) A questo punto dobbiamo scegliere che tipo di rotazione effettuare! Lo scopo del processo di rotazione è quello di rendere la soluzione fattoriale più interpretabile facendo assumere ai fattori una nuova posizione nello spazio fattoriale. La dimensionalità non cambia (se abbiamo estratto m fattori rimarranno m fattori, ma cambia , cambierà la varianza spiegata da ogni singolo fattore che risulterà più omogenea. Ci sono due tipi di rotazioni: ORTOGONALI: I fattori vengono ruotati lasciando inalterato il vincolo dell’ortogonalità (i fattori continuano a NON essere correlati) OBLIQUE: I fattori possono essere correlati Assente: Non effettua alcuna rotazione Rotazione ortogonale Varimax: cerca di semplificare (=ridurre) il numero delle variabili che generano la matrice di correlazione, semplifica l’interpretazione del fattore Rotazione ortogonale Quatrimax:cerca di semplificare il numero delle righe (=osservazioni), semplifica l’interpretazione delle variabili Rotazione ortogonale Equamax: bilancia i criteri dei metodi Varimax e Quatrimax Rotazione obliqua Oblimin: cerca di adattare i fattori agli item e li correla. Rotazione obliqua Promax: E’ un metodo più diretto che cerca la rotazione che meglio si adatta a rappresentare i fattori con un singolo item e lo fa direttamente. E’ definita dal parametro Kappa, che di defoult è pari a 4. Valori maggiori o inferiori a 4 rendono la rotazione più o meno obliqua Finestra Opzioni ESCLUSIONE LISTWISE: Usa solo i casi che hanno valori validi in tutte le variabili ESCLUSIONE PAIRWISE: I casi che hanno valori validi sono calcolati attraverso una matrice di correlazione SOSTITUISCI CON LA MEDIA: Sostituisce il valore mancante di ogni variabile con la media della variabile del campione Esempio… • • Vogliamo conoscere la struttura fattoriale di una scala composta da 10 item su scala Likert a 4 passi, per la misura della depressione la depressione. In accordo con Beck (1979) sono stati costruiti gli item considerando che la depressione coinvolge alterazioni cognitivo-affettive e somatiche. Gli item misurano i seguenti sintomi: 1. Tristezza 2. Fallimento 3. Sfiducia 4. Pensiero suicidario 5. Autosvalutazione 6. Energia 7. Cambiamento di appetito 8. Cambiamento nel sonno 9. Mancanza di concentrazione 10. Affaticamento 1. FATTORIALIZZABILITA’ DELLA MATRICE Il KMO è pari a .86 quindi rientra nella fascia dei valori buoni e il Test di Specificità di Bartlett è significativo! La matrice è fattorializzabile KMO and Bartlett's Test Kaiser-Mey er-Olkin Measure of Sampling Adequacy . Bartlett's Test of Sphericity Approx. Chi-Square df Sig. .865 1508.331 45 .000 2. MATRICE DI CORRELAZIONE TRA LE VARIABILI Correlation Matrixa Correlation Sig. (1-tailed) item1 item2 item3 item4 item5 item6 item7 item8 item9 item10 item1 item2 item3 item4 item5 item6 item7 item8 item9 item10 item1 1.000 .383 .438 .413 .425 .344 .260 .328 .353 .300 .000 .000 .000 .000 .000 .000 .000 .000 .000 item2 .383 1.000 .415 .304 .511 .264 .238 .317 .324 .200 .000 .000 .000 .000 .000 .000 .000 .000 .000 item3 .438 .415 1.000 .328 .514 .273 .240 .230 .369 .193 .000 .000 .000 .000 .000 .000 .000 .000 .000 item4 .413 .304 .328 1.000 .290 .163 .142 .219 .205 .130 .000 .000 .000 .000 .000 .001 .000 .000 .001 item5 .425 .511 .514 .290 1.000 .372 .240 .297 .368 .248 .000 .000 .000 .000 .000 .000 .000 .000 .000 item6 .344 .264 .273 .163 .372 1.000 .377 .383 .540 .595 .000 .000 .000 .000 .000 .000 .000 .000 .000 item7 .260 .238 .240 .142 .240 .377 1.000 .378 .370 .347 .000 .000 .000 .001 .000 .000 .000 .000 .000 item8 .328 .317 .230 .219 .297 .383 .378 1.000 .394 .314 .000 .000 .000 .000 .000 .000 .000 .000 .000 item9 .353 .324 .369 .205 .368 .540 .370 .394 1.000 .422 .000 .000 .000 .000 .000 .000 .000 .000 item10 .300 .200 .193 .130 .248 .595 .347 .314 .422 1.000 .000 .000 .000 .001 .000 .000 .000 .000 .000 .000 a. Determinant = .055 Tutti gli item sono fortemente correlati tra loro, ma i primi cinque lo sono maggiormente tra loro rispetto agli altri cinque. Infatti ciascun gruppo è relativo ai due processi distintivi coinvolti nella depressione. La sezione al di sotto riporta la significatività delle correlazioni. Come possiamo vedere sono tutte significative METODO DI ESTRAZIONE E NUMERO DEI FATTORI DA ESTRARRE Utilizzo il metodo degli assi principali Possiamo effettuare una scelta anche sulla base dello Scree Plot Ci sono diversi metodi per decidere quanti fattori estrarre. In questo caso utilizzo il criterio degli Autovalori maggiori di 1, (Kaiser’s rule mineigen greater than 1 criterion) dove è necessario estrarre i fattori che presentano un autovalore > 1 ! SCELTA DEL METODO DI ROTAZIONE Utilizzo una rotazione Promax Total Variance Explained Factor 1 2 3 4 5 6 7 8 9 10 Total 3.989 1.351 .806 .776 .648 .582 .549 .490 .449 .360 Initial Eigenv alues % of Variance Cumulative % 39.893 39.893 13.510 53.403 8.055 61.458 7.764 69.223 6.477 75.699 5.816 81.516 5.494 87.010 4.901 91.911 4.494 96.405 3.595 100.000 Rotation Extraction Sums of Squared Loadings Total % of Variance Cumulative % Sums Totalof 3.436 34.358 34.358 Squared 2.892a Loadings .809 8.087 42.445 2.909 Extraction Method: Principal Axis Factoring. a. When f actors are correlated, sums of squared loadings cannot be added to obtain a total v ariance. I primi due autovalori sono maggiori di 1, quindi è necessario estrarre 2 fattori! Il primo fattore spiega il 39.89% della varianza Il secondo fattore spiega il 13.51% della varianza Il grafico degli autovalori indica la presenza di un primo fattore preponderante, di un secondo fattore importante e sostanziale appiattimento della curva a partire dal terzo fattore, la soluzione a due fattori sembra supportata. Comunalità e Matrice fattoriale non ruotata della soluzione in fattori principali Factor Matrixa Communalities item1 item2 item3 item4 item5 item6 item7 item8 item9 item10 Initial .364 .340 .368 .215 .421 .492 .245 .281 .400 .387 Extract ion .429 .417 .463 .249 .498 .650 .279 .304 .466 .489 Extract ion Method: Principal Ax is Fact oring. item 6 item 9 item 5 item 1 item 3 item 2 item 10 item 8 item 7 item 4 Factor 1 .691 .659 .648 .623 .594 .577 .564 .541 .495 .416 2 -. 416 -. 179 .278 .202 .332 .290 -. 413 -. 103 -. 185 .275 Extraction Met hod: Princ ipal Axis Fac toring. a. 2 f actors extracted. 9 iterations required. In tabella troviamo i valori delle comunalità iniziali e finali , e della soluzione fattoriale non ruotata. Questa soluzione iniziale consente di calcolare empiricamente le comunalità: le comunalità empiriche vengono sostituite alle stime iniziali e il processo di estrazione dei fattori viene ripetuto. Il processo si interrompe quando i valori empirici delle comunalità divengono sufficientemente stabili (ovvero il valore delle comunalità ottenuto nella interazione precedente non cambia in maniera apprezzabile in quella successiva) Comunalità e Matrice fattoriale non ruotata della soluzione in fattori principali Factor Matrixa Communalities item1 item2 item3 item4 item5 item6 item7 item8 item9 item10 Initial .364 .340 .368 .215 .421 .492 .245 .281 .400 .387 Extract ion .429 .417 .463 .249 .498 .650 .279 .304 .466 .489 Extract ion Method: Principal Ax is Fact oring. item 6 item 9 item 5 item 1 item 3 item 2 item 10 item 8 item 7 item 4 Factor 1 .691 .659 .648 .623 .594 .577 .564 .541 .495 .416 2 -. 416 -. 179 .278 .202 .332 .290 -. 413 -. 103 -. 185 .275 Extraction Met hod: Princ ipal Axis Fac toring. a. 2 f actors extracted. 9 iterations required. N.B. Durante questo processo il numero dei fattori deve rimanere costante. I valori finali delle comunalità possono essere ricavati dalla soluzione stessa elevando al quadrato le saturazioni di ogni variabile in ogni fattore comune e sommando tali quadrati. Es. La comunalità finale dell’item 1 (.429)si ottiene elevando al quadrato e sommando le saturazioni dell’item 1 nel primo fattore (.6232) e nel secondo fattore (.2022)! Matrice della struttura Str uctu r e Matr ix item 6 item 10 item 9 item 8 item 7 item 5 item 3 item 1 item 2 item 4 F actor 1 .804 .690 .668 .529 .525 .451 .378 .463 .382 .245 2 .431 .320 .509 .438 .359 .704 .680 .648 .646 .495 Factor Correlation Matrix Factor 1 2 2 .593 1.000 Extraction Method: Principal Axis Factoring. Rotation Method: Promax with Kaiser Normalization. Extraction Met hod: Princ ipal Axis Fac toring. Rot ation Met hod: Prom ax wit h Kaiser Normalizat ion. Questa è una matrice delle correlazioni tra variabili osservate e fattori. 1 1.000 .593 Correlazione tra i fattori obliqui. I fattori correlano tra loro Matrice dei modelli Pattern Matrixa Factor item6 item10 item9 item7 item8 item3 item5 item2 item1 item4 1 .846 .772 .565 .481 .416 -.038 .051 -.001 .123 -.074 2 -.070 -.138 .174 .075 .192 .702 .674 .647 .575 .540 Extraction Method: Principal Axis Factoring. Rotation Method: Promax with Kaiser Normalization. a. Rotation converged in 3 iterations. La matrice dei modelli, invece, è la matrice dei coefficienti di impatto dei fattori sulle variabili osservate. E’ questa la matrice che vado ad interpretare poiché è quella fattorialmente semplice! Considerando che saturazioni fattoriali >.30 sono significative, la soluzione ruotata mostra come sul primo fattore saturano gli item relativi alla componente somatica della depressione (item, 6,7,8,9 e 10). Sul secondo fattore saturano gli item relativi alla componente cognitivoaffettiva della depressione (item 1,2,3,4 e 5). Grafico fattoriale nello spazio fattoriale ruotato Il pattern fattoriale può essere rappresentato graficamente. Gli assi fattoriali sono rappresentati come ortogonali anche se la soluzione è obliqua. Da questa rappresentazione però si evince chiaramente la struttura semplice raggiunta tramite la soluzione obliqua: gli item che saturano sul fattore 1 e 2 si trovano in corrispondenza degli assi dei due rispettivi fattori. CONCLUSIONI In linea con le nostre ipotesi l’esame fattoriale esplorativo della scala, ha evidenziato come questa presenti una struttura bi-fattoriale. Possiamo considerare, quindi, che la misura della depressione per questo strumento, include una fattore che chiameremo somatico ed un altro che chiameremo cognitivo-affettivo.