Comments
Transcript
Scale per la misurazione degli atteggiamenti
Scale per la misurazione degli atteggiamenti Scale Single Item: a volte si preferisce utilizzare una singola domanda al posto di una batteria di domande (e quindi una scala) per rilevare un atteggiamento. E’ appunto questo il caso delle scale definite Single-Item. Scale Multi Item:Le scale multi-item risultano generalmente superiori alle scale sigle-item per tre principali motivi (Nunnally, 78): - I concetti che vengono rilevati sono generalmente abbastanza complessi, tali da rendere improbabile la copertura del loro significato con un solo indicatore. - Una sola domanda manca di precisione, in quanto riesce a discriminare le unità statistiche in soli due gruppi. - Le domande singole sono più soggette ad errori accidentali, avendo anche un maggiore effetto sull’analisi dei risultati. Riassumendo: le domande singole sono meno valide, meno precise, meno attendibili. Scale per la misurazione degli atteggiamenti Scale Single Item: - Scale Semanticamente autonome - Scale a Parziale autonomia semantica - Scale Auto-Ancoranti Scale Multi Item: - Scala di Likert - Scala del Differenziale Semantico - Scala Stapel - Scala di Guttman - Scala di Thurstone - Scala di Rasch Scale Single Item: Semanticamente autonoma Sono scale dove le domande presentano delle alternative di risposta, che anche se ordinabili, sono poste in modo che la risposta possa essere data senza mettersi in relazione con le altre categorie di risposta. L’autonomia semantica fa si che l’intervistato scelga per il loro contenuto, indipendentemente dalla posizione nei confronti delle altre. Un esempio può essere la domanda relativa al titolo di studio, dove per rispondere non bisogna conoscere l’alternativa di risposta. Es.: Qual è il tuo titolo di studio? a) Nessun titolo b) Licenza elementare c) Licenza media inferiore d) Licenza media superiore e) Laurea Scale Single Item: Parziale autonomia semantica Sono scale rappresentate da categorie di risposta ordinate con affermazioni del tipo: “assolutamente contrario”, “contrario”, “d’accordo”, “assolutamente d’accordo”, in cui il significato delle categorie di risposta è solo parzialmente autonomo dalle altre. In questo tipo di scale, come nella precedente, non si può affermare che esiste equidistanza tra le modalità di risposta, anche se, visto che le risposte non hanno totale autonomia semantica, è probabile che nell’intervistato scatti un meccanismo di comparazione quantitativa. Es.: Ti piace mangiare in mensa? a) Per niente b) Poco c) Abbastanza d) Molto Scale Single Item: Auto-Ancoranti Le scale auto ancoranti hanno la caratteristica di essere presentate con due categorie estreme dotate di significato, mentre tra di esse si colloca un continuum, rappresentato da caselle, da cifre, da un segmento, dove l’intervistato colloca la sua risposta. Il criterio di auto valutazione della distanza tra le modalità, in queste scale, ha maggiore probabilità di verificarsi. Es.: Come giudica il servizio della mensa? Pessimo Ottimo Scale Multi Item: Likert La tecnica fu ideata nel 1932 dallo psicologo americano Rensis Likert con lo scopo di elaborare un nuovo strumento, più semplice rispetto ad altri, per la misurazione di opinioni e atteggiamenti. Sotto la categoria della “scala di Likert”vanno collocate una varietà di scale, conosciute in letteratura come scale additive o meglio “summate drating scales”. Le scale di Likert sono le più semplici ed intuitive presentate in letteratura: date una serie di affermazioni, si chiede all’intervistato se e in che misura è d’accordo. Es.: Si deve cambiare governo. Assolutamente in disaccordo Disaccordo Indifferente D’accordo Assolutamente d’accordo Scale Multi Item: Differenziale Semantico La tecnica è stata sviluppata da Charles Osgood (1952) e si caratterizza per l’uso di aggettivi bipolari. Lo strumento è stato sviluppato con lo scopo di rilevare il significato che assumono i concetti che sono sottoposti a valutazione degli individui, rispondendo alla domanda: Che cosa significa per te? Es.: Come giudica i servizi ospedalieri? Buoni Cattivi -3 -2 -1 0 1 2 3 Di valore Senza valore -3 -2 -1 0 1 2 3 Ricchi Poveri -3 -2 -1 0 1 2 3 Scale Multi Item: Differenziale Semantico Una descrizione sintetica dell’oggetto sottoposto a valutazione può essere fatta mediante: Analisi aggregata: i punteggi individuali sono sommati per ottenere un punteggio complessivo, che costituisce la misura dell’attitudine calcolata per ogni individuo. Analisi del profilo: è una rappresentazione grafica e si ottiene congiungendo con una linea il punteggio, medio o mediano, assegnato da tutti i rispondenti, o da un certo gruppo, a ciascuno degli item. L’analisi del profilo viene utilizzata per identificare i punti deboli e forti dell’oggetto o costrutto che viene misurato. Scale Multi Item: Stapel Le scale Stapel: Sono scale unipolari, non verbali, nel senso che le frasi descrittive e gli aggettivi sono presentati separatamente; inoltre i punti sulla scala sono identificati da numeri e il numero di posizioni lungo la scala è pari (manca la modalità neutrale). In pratica più l’aggettivo è adatto all’oggetto, più il numero si avvicinerà a 4, più l’oggetto non è identificabile con l’aggettivo, più la valutazione tenderà a 1. Risulta di più facile gestione in alcuni tipi di intervista ed in particolare in quella telefonica. Es.: Il vitto della mensa è: Gustoso: 1 2 3 4 Scale Multi Item: Guttman La scala proposta da Guttman ha come obiettivo quello di ottenere una serie di item ordinati secondo l’estremità dell’atteggiamento che esprimono. Es.: Consiglieresti il tuo medico curante a: 1) Tuo figlio, 2) Tuo marito/moglie; 3) Un amico; 4) Un conoscente In questo modo, la risposta positiva ad un item implica risposta positiva agli item successivi, oppure, viceversa, la risposta negativa implica risposte negative agli item successivi. Da ciò la definizione di questa scala come scalogramma o scala cumulativa. Questo approccio risolve il problema dell’unidimensionalità della scala, infatti garantisce la creazione di scale ordinate. Scale Multi Item: Guttman Formulazione delle domande: Si formula un numero di item “monotoni”(unidirezionali) con risposta dicotomica; Classificazione degli item: Gli item vengono proposti o utilizzati direttamente sul gruppo degli osservati; Se la scala proposta è effettivamente monotona ed unidimensionale si dovrebbe produrre una scala ordinale “perfetta e dare origine ad uno “scalogramma”assolutamente privo di errori. Naturalmente lo scalogramma riportato di seguito è “ideale”. Item 1 Item 2 Item 3 Item 4 Score Sogg. 1 + + + + 4 Sogg. 2 + + + - 3 Sogg. 3 + + - - 2 Sogg. 4 + - - - 1 Sogg. 5 - - - - 0 Scale Multi Item: Guttman Item 1 Item 2 Item 3 Item 4 Score Sogg. 1 + + + + 4 Sogg. 2 + + + - 3 Sogg. 3 + -* - +* 2 Sogg. 4 -* +* - - 1 Sogg. 5 - - - - 0 Errori 1 2 0 1 Cr = 1- n. errori n. totale risposte Individuazione degli errori e attribuzione degli “score”: data la tabella “reale” e confrontandola con lo scalogramma ideale, si osserva che ci sono delle sequenze errate (soggetti 3 e 4). Quindi vengono riportati gli errori nell’ultima riga e si decide se sono in numero sufficientemente piccolo per garantire la riproducibilità della scala. Selezione degli item e applicazione della scala: sulla base dello “scalogramma” viene calcolato il coefficienti di “riproducibilità”, che misura il grado di scostamento della scala osservata dalla scala ideale, individuando gli “item”che hanno determinato un maggior numero di errori. Eliminandoli si riducono intervalli di scala, ma essa può essere resa più valida ed affidabile. Scale Multi Item: Thurstone Ogni item di una batteria è valutato da un gruppo di esperti, i quali distribuiscono gli item su una scala a 11 punti. Si tenta di ottenere una scala in cui siano presenti affermazioni che coprono tutto l’arco dell’atteggiamento, dalle affermazioni più favorevoli alle meno favorevoli. 1 2a 7 3 8b 4 9 5c 10 6 11 -People with AIDS are like my parents (f) -Because AIDS is preventable, we should focus our resources on prevention instead of curing (e) -People with AIDS deserve what they got. (a) -Aids affects us all (m) -People with AIDS should be treated just like everybody else. (n) -AIDS will never happen to me. (c) -It's easy to get AIDS (g) -AIDS doesn't have a preference, anyone can get it (h) -AIDS is a disease that anyone can get if they are not careful (l) -If you have AIDS, you can still lead a normal life (i) -AIDS is good because it helps control the population. (b) -I can't get AIDS if I'm in a monogamous relationship. (d) Scale Multi Item: Thurstone Il punteggio dei soggetti è dato dall’item più estremo cui hanno aderito, o dalla media degli item cui hanno aderito. Si differenzia dalla scala di Guttman in quanto considera l’atteggiamento come continuo e distribuito normalmente. Come per la scala Guttman, ogni item misura una particolare porzione del costrutto. Svantaggi pratici: non sono i soggetti che fanno la scala, ma i “giudici esperti”: si deve avere un campione ampio (2 o 3 per item) e attendibile di giudici esperti. Bisogna coprire tutto l’arco dell’atteggiamento con punteggi da 1 a 11. È difficile trovare un gruppo di giudici che raggiunga un buon accordo su una categorizzazione così complessa. Svantaggi teorici: gli atteggiamenti non sembrano conformarsi al modello di Thurstone. Il problema è avere un item valido solo per alcune porzioni del tratto di atteggiamento che si sta studiando. Scale Multi Item: Rasch Il modello di Rasch si fonda su di un approccio di tipo probabilistico, presupponendo un modello di relazione tra la posizione sul continuum e la probabilità di risposta ad un determinato elemento della scala, chiamata traccia. “La traccia è una curva che descrive la probabilità di rispondere affermativamente ad un certo elemento a seconda della posizione dell’individuo sul continuum sottostante”. 1,1 1,0 Proporzione di risposte corrette (punteggi grezzi) 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 βn < δ i -0,1 -4,5 -4,0 βn = δ i -3,5 -3,0 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 βn > δ i 1,0 Unità di misura astratte (logit) 1,5 2,0 2,5 3,0 3,5 4,0 4,5 Scale Multi Item: Rasch Modello che tenta di raggiungere le proprietà di una scala Guttman utilizzando dei parametri probabilistici. Ha alcune proprietà molto interessanti. Si distingue fra un parametro di risposta dovuto al tratto e un parametro dovuto alla difficoltà dell’item (non è l’errore casuale).I parametri del modello sono indipendenti dalla popolazione. I punteggi della scala possono essere ottenuti con qualunque sottoinsieme di item. Il punteggio della scala è indipendente dalla difficoltà degli item. Confronto tra le scale di misura: Scale Single-Item o Multi-Item? Scale Vantaggi Svantaggi Single-Item 1) Sono indispensabili nella rilevazione di variabili categoriche (età, sesso, etc.). 2) La somministrazione è molto veloce 3) Il tempo di codifica dipende solo dal numero degli intervistati 4) E’ preferibile non usarle come rilevatori di costrutto, ma come espressione di sintesi di un atteggiamento. 1) E’ facile commettere errori 2) Una sola domanda difficilmente riesce a cogliere un fenomeno complesso come l’atteggiamento 3) Gli item singoli sono più imprecisi: ad esempio, con una scala di risposta a 5 gradi, i soggetti possono collocarsi solo in 5 gruppi, con 20 item e 5 alternative di risposta per ciascuno, la gamma dei punteggi sommati va da 20 a 100. Multi-Item 1) Fanno si che gli errori casuali di misura si annullino in media 2) E’ possibile prendere in considerazione i molteplici aspetti di proprietà complesse 3) Sono più valide, più precise e più attendibili rispetto alle scale singleitem 1) Richiedono più tempo per la compilazione da parte degli intervistati 2) Il tempo di codifica dipende sia dal numero degli intervistati che dal numero di domande 3) Hanno bisogno di un controllo di validità e di coerenza interno 4) Possono presentare fenomeni di response set o acquiescent response set. Confronto tra le Scale Multi-Item Scale Scala Likert Vantaggi 1) 5) Differenziale semantico Scala di Guttman Scala di Thurstone La scala più comune, del tipo “punteggio scolastico” 2) Codifica immediata 3) E’ possibile sommare i risultati 4) Semplicità di applicazione E’ possibile applicare tecniche di quantificazione dei dati 1) Test di facile somministrazione perché si risponde “di istinto” 2) Tecnica molto flessibile 3) Descrizione sintetica mediante l’utilizzo dei profili 4) Molte proprietà matematiche dovute alle scale autoancoranti 1) Garantisce l’ordinamento tra i vari elementi della scala 2) Consente di mantenere il continuum tra le risposte alle modalità dei vari item 3) Risolve il problema dell’unidimensionalità della scala 2) 1) E’ basata su ipotesi distribuzionali Può essere utilizzata come metodo di quantificazione di dati ti tipo ordinale Svantaggi 2) 4) 1) Non è possibile trovare una coppia di aggettivi che siano in completa opposizione dal punto di vista semantico 2) Sono maggiormente utilizzati per lo studio della personalità 3) Le scale auto-ancoranti richiedono molto tempo per la codifica 4) Elevati costi di analisi 1) Il punteggio finale che si ottiene resta comunque una variabile ordinale 2) Lo scalogramma raramente è perfetto 3) I gruppi di item selezionati si avvicinano alla configurazione dello scalogramma, ma a volte non sono rilevanti per il costrutto 4) Il modello è di tipo deterministico, mentre la realtà potrebbe essere meglio spiegata da un modello probabilistico 5) Non sempre gli item selezionati sono rilevanti per il costrutto teorico che si vuole misurare 6) Non è possibile calcolare una misura di coerenza interna 1) 3) Scala di Rasch 1) Basata su ipotesi probabilistiche Rispecchia un continuum di tipo logistico che garantisce una buona flessibilità nel discriminare diversi atteggiamenti 3) Può essere utilizzata come metodo di quantificazione di dati di tipo ordinale 4) I parametri del modello sono indipendenti dalla popolazione 2) 1) Genera variabili di tipo ordinale Per essere usata come scala quasi cardinale ha bisogno di un pretrattamento 3) Ha problemi di unidimensionalità Si può facilmente verificare il fenomeno di response set 1) Non consente di cogliere l’intensità delle preferenze a causa delle risposte dicotomiche 2) Tecnica costosa I risultati sono spesso condizionati dalla scelta dei giudici Il modello non verifica l’unidimensionalità della scala 2) Si seleziona l’item che soddisfa l’assunzione probabilistica che non necessariamente riflette il costrutto teorico 3) Il modello è complesso Scelta del numero di modalità di risposta Numero di modalità di risposta Vantaggi Svantaggi Scala auto-ancorante 1) La misurazione diventa quasi cardinale 2) Ha un altissimo potere discriminante 3) E’ l’individuo stesso a stabilire l’unità di misura 1) La codifica manuale richiede più tempo 2) Per velocizzare la codifica sono necessari lettori ottici 3) La strumentazione ottica è generalmente costosa Risposta a dieci modalità (1, 2, …, 10) 1) Ricorda il sistema di valutazione scolastico 2) Ha maggiore potere discriminante 1) Si può facilmente verificare il fenomeno di response set 2) La scala è ordinale Risposta a sette modalità (1, 2, …, 7) 1) E’ il primo utilizzo nella scala Likert 2) Avendo maggior numero di modalità rappresenta meglio il continuum di valutazione 1) Si può facilmente verificare il fenomeno di response set 2) Nell’applicazione della scala Likert ha dato risultati meno soddisfacenti rispetto alla scala a 5 modalità 3) La scala è ordinale Risposta a cinque modalità (1, 2, …, 5) 1) Nella scala Likert ha mostrato risultati migliori 2) E’ di facile comprensione, perché il numero delle modalità ricorda il numero delle dita di una mano 3) E’ facile discriminare tra due soli livelli di discordanza e di concordanza 4) Presenta la modalità dell’indifferenza 1) La scala è ordinale; 2) Spesso gli intervistati si posizionano sulla modalità centrale 3) I dati necessitano di un pre-trattamento Risposta con modalità pari (1, 2, 3, 4) 1) Consente al ricercatore di ottenere una risposta schierata 1) Si possono facilmente commettere errori a causa della velocità di compilazione Risposta dicotomica (0, 1) 1) Quando c’è un grosso numero di domande è più veloce da compilare 2) E’ più veloce da codificare 1) Per aumentare il potere discriminante, aumenta anche il numero di domande 2) In fase di codifica si commettono più errori Modalità mancata risposta (“non saprei”) 1) Consente l’espressione di mancata conoscenza del fenomeno 2) Può essere espressione di una cattiva impostazione della domanda 1) Deve essere elaborato come dato distinto dai giudizi espressi