...

Analisi fattoriale - Portale di Psicometria

by user

on
Category: Documents
232

views

Report

Comments

Transcript

Analisi fattoriale - Portale di Psicometria
Analisi fattoriale
• L’analisi fattoriale viene effettuata per studiare, riassumere e
semplificare le relazioni in un insieme di variabili
• Ciò permette di individuare uno o più fattori o dimensioni
latenti (ad esempio un tratto di personalità, un
atteggiamento) che si suppone abbiano dato origine alle
similarità tra le variabili osservate.
Il punto di partenza dell’analisi fattoriale è rappresentato da una matrice che
contiene le correlazioni tra le variabili osservate (R).
Il punto di arrivo è formato da una matrice che contiene una misura della
relazione tra le variabili osservate e i fattori latenti (A matrice di saturazione).
Il modello teorico
L’analisi fattoriale esamina la varianza che le variabili
hanno in comune (varianza comune)
L’ipotesi di base è che la correlazione tra le variabili
sia determinata da dimensioni non osservabili
(fattori) che in qualche modo sono causa o
determinano i punteggi osservati nella variabili
osservate
Quando si usa…
Costruzione e validazione di strumenti di
misura (Ad es. gli indicatori empirici sono
coerenti con la definizione del costrutto e con i
criteri generativi del test?)
Ridurre una grande quantità di
variabili osservate in un numero
più gestibile di
componenti
Verifica della struttura teorica di un’ insieme di
misure (Un atteggiamento consta di separate
componenti cognitive, emotive e
comportamentali?).
Terminologia
Fattore = variabile (costrutto) che non è direttamente osservabile ma
deve essere inferito attraverso variabili osservate.
Factor Loading (saturazione) = è il coefficiente di correlazione che mostra
l’importanza (peso) di ogni variabile nel definire un fattore
Eigenvalue (autovalore)= rappresenta la quota di varianza delle variabili
spiegata dal fattore
Soluzione fattoriale = è il set di fattori e di relazioni tra variabili e fattori
che rappresenta la soluzione al problema fattoriale
L’analisi fattoriale si articola in alcuni
passi:
1.
2.
3.
4.
5.
6.
7.
Valutazione dell’adeguatezza delle variabili
Valutazione della fattorializzabilità della matrice
Scelta del metodo di estrazione dei fattori
Scelta del numero di fattori
Scelta del metodo di rotazione dei fattori
Interpretazione della soluzione
Validazione della soluzione
Soluzione iniziale:
produce in output i
valori delle comunalità,
gli autovalori e la
proporzione di
varianza spiegata
Comunalità h2
• La comunalità esprime la proporzione della varianza di ogni variabile
riprodotta da un certo numero di componenti. Essendo una
proporzione, essa varia tra zero e uno. Quindi ci dice quanta varianza
perdiamo di ciascuna variabile, tenendo conto delle componenti che
abbiamo deciso di utilizzare.
• Le comunalità indicano la parte di varianza spiegata di ogni
indicatore, considerando il modello fattoriale stimato
• Vanno tendenzialmente tenuti in considerazione item o variabili che
abbiano un valore di comunalità di almeno .500
INVERSA: Matrice inversa di R
RIPRODOTTA:
Matrice R
riprodotta dalla
soluzione
fattoriale e
matrice dei
residui
COEFFICIENTI: Coefficienti di correlazione della matrice R
SIGNIFICATIVITA’: Livelli di significatività dei coefficienti di R
DETERMINANTE: Esamina la fattorializzabilità della matrice
delle correlazioni. Se è uguale a 0 esiste almeno una variabile
che è combinazione lineare perfetta delle altre, non ammette
inversa e l’analisi fattoriale non può essere effettuata
TEST di sfericità di Bartlett:
esamina l’ipotesi nulla che
R=I. Se il test è significativo
si può effettuare l’analisi
fattoriale.
TEST KMO (Kaiser-MeyerOlkin): confronta la
grandezza delle
correlazioni osservate
rispetto alle correlazioni
parziali. Se la somma delle
ultime è più piccola
rispetto alle prime il KMO
è vicino a 1 e la matrice
può essere fattorializzata.
Valori:
>0.90 eccellenti
80-90 buoni
70-80 accettabili
60-70 mediocri
FINESTRA ESTRAZIONI
Minimi quadrati non ponderati e Minimi quadrati
generalizzati: In questo metodo vengono
minimizzate le correlazioni residue, cioè quella
parte delle correlazioni che non è spiegata dai
fattori. Non è necessaria una stima della
comunalità, ma bisogna fornire il numero di fattori
da estrarre.
Componenti Principali
(ACP) è utile per
approssimare una
soluzione di analisi
fattoriale. Non distingue
tra varianza comune e
varianza unica: tutti i
fattori sono fattori
comuni che assorbiscono
tutta la varianza e le
saturazioni risultano
gonfiate.
Massima verosimiglianza: Stima le
saturazioni della popolazione che
hanno la massima verosimiglianza
(massima probabilità) nel produrre
la matrice delle correlazioni
campionarie
Determina tramite una
campione di variabili i
fattori comuni che hanno
correlazione massima con
i fattori comuni
nell’universo delle
variabili
Fattorializzazione asse principale (o Analisi dei fattori principali
AFP): è un metodo simile all’APC, ma si differenzia da questa
perché utilizza una matrice ridotta e analizza soltanto la varianza
che e attribuibile ai fattori comuni, eliminando la varianza unica
delle variabili.
Matrice delle correlazioni
Soluzione fattoriale non ruotata
Grafico decrescente autovalori
(Scree Plot)
Numero di fattori da estrarre
Estrai fattori con autovalori maggiori di 1
Kaiser’s rule mineigen greater than 1 criterion (K1)
A questo punto dobbiamo scegliere che tipo di rotazione effettuare!
Lo scopo del processo di rotazione è quello di rendere la soluzione fattoriale più
interpretabile facendo assumere ai fattori una nuova posizione nello spazio fattoriale.
La dimensionalità non cambia (se abbiamo estratto m fattori rimarranno m fattori, ma
cambia , cambierà la varianza spiegata da ogni singolo fattore che risulterà più
omogenea.
Ci sono due tipi di rotazioni:
ORTOGONALI: I fattori vengono ruotati
lasciando inalterato il vincolo
dell’ortogonalità (i fattori continuano a
NON essere correlati)
OBLIQUE: I fattori possono essere
correlati
Assente: Non effettua alcuna rotazione
Rotazione ortogonale Varimax: cerca di
semplificare (=ridurre) il numero delle
variabili che generano la matrice di
correlazione, semplifica l’interpretazione del
fattore
Rotazione ortogonale Quatrimax:cerca di
semplificare il numero delle righe
(=osservazioni), semplifica l’interpretazione
delle variabili
Rotazione ortogonale Equamax:
bilancia i criteri dei metodi Varimax e
Quatrimax
Rotazione obliqua Oblimin: cerca di
adattare i fattori agli item e li correla.
Rotazione obliqua Promax: E’ un metodo
più diretto che cerca la rotazione che
meglio si adatta a rappresentare i fattori
con un singolo item e lo fa direttamente.
E’ definita dal parametro Kappa, che di
defoult è pari a 4. Valori maggiori o
inferiori a 4 rendono la rotazione più o
meno obliqua
Finestra Opzioni
ESCLUSIONE LISTWISE: Usa solo i casi che
hanno valori validi in tutte le variabili
ESCLUSIONE PAIRWISE: I casi che hanno
valori validi sono calcolati attraverso una
matrice di correlazione
SOSTITUISCI CON LA MEDIA: Sostituisce il
valore mancante di ogni variabile con la
media della variabile del campione
Esempio…
•
•
Vogliamo conoscere la struttura fattoriale di una scala composta da 10 item su
scala Likert a 4 passi, per la misura della depressione la depressione.
In accordo con Beck (1979) sono stati costruiti gli item considerando che la
depressione coinvolge alterazioni cognitivo-affettive e somatiche.
Gli item misurano i seguenti sintomi:
1. Tristezza
2. Fallimento
3. Sfiducia
4. Pensiero suicidario
5. Autosvalutazione
6. Energia
7. Cambiamento di appetito
8. Cambiamento nel sonno
9. Mancanza di concentrazione
10. Affaticamento
1. FATTORIALIZZABILITA’ DELLA MATRICE
Il KMO è pari a .86 quindi rientra nella fascia dei valori buoni
e il Test di Specificità di Bartlett è significativo!
La matrice è fattorializzabile
KMO and Bartlett's Test
Kaiser-Mey er-Olkin Measure of Sampling
Adequacy .
Bartlett's Test of
Sphericity
Approx. Chi-Square
df
Sig.
.865
1508.331
45
.000
2. MATRICE DI CORRELAZIONE TRA LE VARIABILI
Correlation Matrixa
Correlation
Sig. (1-tailed)
item1
item2
item3
item4
item5
item6
item7
item8
item9
item10
item1
item2
item3
item4
item5
item6
item7
item8
item9
item10
item1
1.000
.383
.438
.413
.425
.344
.260
.328
.353
.300
.000
.000
.000
.000
.000
.000
.000
.000
.000
item2
.383
1.000
.415
.304
.511
.264
.238
.317
.324
.200
.000
.000
.000
.000
.000
.000
.000
.000
.000
item3
.438
.415
1.000
.328
.514
.273
.240
.230
.369
.193
.000
.000
.000
.000
.000
.000
.000
.000
.000
item4
.413
.304
.328
1.000
.290
.163
.142
.219
.205
.130
.000
.000
.000
.000
.000
.001
.000
.000
.001
item5
.425
.511
.514
.290
1.000
.372
.240
.297
.368
.248
.000
.000
.000
.000
.000
.000
.000
.000
.000
item6
.344
.264
.273
.163
.372
1.000
.377
.383
.540
.595
.000
.000
.000
.000
.000
.000
.000
.000
.000
item7
.260
.238
.240
.142
.240
.377
1.000
.378
.370
.347
.000
.000
.000
.001
.000
.000
.000
.000
.000
item8
.328
.317
.230
.219
.297
.383
.378
1.000
.394
.314
.000
.000
.000
.000
.000
.000
.000
.000
.000
item9
.353
.324
.369
.205
.368
.540
.370
.394
1.000
.422
.000
.000
.000
.000
.000
.000
.000
.000
item10
.300
.200
.193
.130
.248
.595
.347
.314
.422
1.000
.000
.000
.000
.001
.000
.000
.000
.000
.000
.000
a. Determinant = .055
Tutti gli item sono fortemente correlati tra loro, ma i primi cinque lo sono
maggiormente tra loro rispetto agli altri cinque. Infatti ciascun gruppo è relativo ai
due processi distintivi coinvolti nella depressione.
La sezione al di sotto riporta la significatività delle correlazioni. Come possiamo
vedere sono tutte significative
METODO DI ESTRAZIONE E NUMERO DEI FATTORI DA ESTRARRE
Utilizzo il metodo degli assi
principali
Possiamo effettuare una
scelta anche sulla base
dello Scree Plot
Ci sono diversi metodi per decidere quanti fattori estrarre.
In questo caso utilizzo il criterio degli Autovalori maggiori di 1, (Kaiser’s rule
mineigen greater than 1 criterion) dove è necessario estrarre i fattori che
presentano un autovalore > 1 !
SCELTA DEL METODO DI ROTAZIONE
Utilizzo una rotazione Promax
Total Variance Explained
Factor
1
2
3
4
5
6
7
8
9
10
Total
3.989
1.351
.806
.776
.648
.582
.549
.490
.449
.360
Initial Eigenv alues
% of Variance Cumulative %
39.893
39.893
13.510
53.403
8.055
61.458
7.764
69.223
6.477
75.699
5.816
81.516
5.494
87.010
4.901
91.911
4.494
96.405
3.595
100.000
Rotation
Extraction Sums of Squared Loadings
Total
% of Variance Cumulative % Sums
Totalof
3.436
34.358
34.358 Squared
2.892a
Loadings
.809
8.087
42.445
2.909
Extraction Method: Principal Axis Factoring.
a. When f actors are correlated, sums of squared loadings cannot be added to obtain a total v ariance.
I primi due autovalori sono maggiori di 1, quindi è necessario estrarre 2 fattori!
Il primo fattore spiega il 39.89% della varianza
Il secondo fattore spiega il 13.51% della varianza
Il grafico degli autovalori indica la presenza di un primo fattore preponderante, di
un secondo fattore importante e sostanziale appiattimento della curva a partire
dal terzo fattore, la soluzione a due fattori sembra supportata.
Comunalità e Matrice fattoriale non ruotata della soluzione in fattori principali
Factor Matrixa
Communalities
item1
item2
item3
item4
item5
item6
item7
item8
item9
item10
Initial
.364
.340
.368
.215
.421
.492
.245
.281
.400
.387
Extract ion
.429
.417
.463
.249
.498
.650
.279
.304
.466
.489
Extract ion Method: Principal Ax is Fact oring.
item 6
item 9
item 5
item 1
item 3
item 2
item 10
item 8
item 7
item 4
Factor
1
.691
.659
.648
.623
.594
.577
.564
.541
.495
.416
2
-. 416
-. 179
.278
.202
.332
.290
-. 413
-. 103
-. 185
.275
Extraction Met hod: Princ ipal Axis Fac toring.
a. 2 f actors extracted. 9 iterations required.
In tabella troviamo i valori delle comunalità iniziali e finali , e della soluzione fattoriale
non ruotata. Questa soluzione iniziale consente di calcolare empiricamente le
comunalità: le comunalità empiriche vengono sostituite alle stime iniziali e il processo di
estrazione dei fattori viene ripetuto. Il processo si interrompe quando i valori empirici
delle comunalità divengono sufficientemente stabili (ovvero il valore delle comunalità
ottenuto nella interazione precedente non cambia in maniera apprezzabile in quella
successiva)
Comunalità e Matrice fattoriale non ruotata della soluzione in fattori principali
Factor Matrixa
Communalities
item1
item2
item3
item4
item5
item6
item7
item8
item9
item10
Initial
.364
.340
.368
.215
.421
.492
.245
.281
.400
.387
Extract ion
.429
.417
.463
.249
.498
.650
.279
.304
.466
.489
Extract ion Method: Principal Ax is Fact oring.
item 6
item 9
item 5
item 1
item 3
item 2
item 10
item 8
item 7
item 4
Factor
1
.691
.659
.648
.623
.594
.577
.564
.541
.495
.416
2
-. 416
-. 179
.278
.202
.332
.290
-. 413
-. 103
-. 185
.275
Extraction Met hod: Princ ipal Axis Fac toring.
a. 2 f actors extracted. 9 iterations required.
N.B. Durante questo processo il numero dei fattori deve rimanere costante.
I valori finali delle comunalità possono essere ricavati dalla soluzione stessa elevando al
quadrato le saturazioni di ogni variabile in ogni fattore comune e sommando tali
quadrati.
Es. La comunalità finale dell’item 1 (.429)si ottiene elevando al quadrato e sommando le
saturazioni dell’item 1 nel primo fattore (.6232) e nel secondo fattore (.2022)!
Matrice della struttura
Str uctu r e Matr ix
item 6
item 10
item 9
item 8
item 7
item 5
item 3
item 1
item 2
item 4
F actor
1
.804
.690
.668
.529
.525
.451
.378
.463
.382
.245
2
.431
.320
.509
.438
.359
.704
.680
.648
.646
.495
Factor Correlation Matrix
Factor
1
2
2
.593
1.000
Extraction Method: Principal Axis Factoring.
Rotation Method: Promax with Kaiser Normalization.
Extraction Met hod: Princ ipal Axis Fac toring.
Rot ation Met hod: Prom ax wit h Kaiser Normalizat ion.
Questa è una matrice delle
correlazioni tra variabili osservate e
fattori.
1
1.000
.593
Correlazione tra i fattori obliqui.
I fattori correlano tra loro
Matrice dei modelli
Pattern Matrixa
Factor
item6
item10
item9
item7
item8
item3
item5
item2
item1
item4
1
.846
.772
.565
.481
.416
-.038
.051
-.001
.123
-.074
2
-.070
-.138
.174
.075
.192
.702
.674
.647
.575
.540
Extraction Method: Principal Axis Factoring.
Rotation Method: Promax with Kaiser Normalization.
a. Rotation converged in 3 iterations.
La matrice dei modelli, invece, è la matrice dei
coefficienti di impatto dei fattori sulle variabili
osservate.
E’ questa la matrice che vado ad interpretare
poiché è quella fattorialmente semplice!
Considerando che saturazioni fattoriali
>.30 sono significative, la soluzione
ruotata mostra come sul primo fattore
saturano gli item relativi
alla
componente
somatica
della
depressione (item, 6,7,8,9 e 10).
Sul secondo fattore saturano gli item
relativi alla componente cognitivoaffettiva della depressione (item
1,2,3,4 e 5).
Grafico fattoriale nello spazio fattoriale ruotato
Il pattern fattoriale può essere rappresentato graficamente. Gli assi fattoriali sono
rappresentati come ortogonali anche se la soluzione è obliqua. Da questa rappresentazione
però si evince chiaramente la struttura semplice raggiunta tramite la soluzione obliqua: gli
item che saturano sul fattore 1 e 2 si trovano in corrispondenza degli assi dei due rispettivi
fattori.
CONCLUSIONI
In linea con le nostre ipotesi l’esame fattoriale esplorativo della scala, ha evidenziato
come questa presenti una struttura bi-fattoriale. Possiamo considerare, quindi, che la
misura della depressione per questo strumento, include una fattore che chiameremo
somatico ed un altro che chiameremo cognitivo-affettivo.
Fly UP