Comments
Description
Transcript
Analisi del contenuto
Marcello Maneri - L’analisi del contenuto L’analisi del contenuto 1. Cos’è l’analisi del contenuto Considereremo come analisi del contenuto "l’insieme di metodi che sono orientati al controllo di determinate ipotesi su fatti di comunicazione (emittenti, messaggi, destinatari e loro relazioni) e che a tale scopo utilizzano procedure di scomposizione analitica e di classificazione, normalmente a destinazione statistica, di testi e di altri insiemi simbolici" (Rositi, 1971). Si tratta dunque di metodi che scompongono i messaggi in elementi più semplici utilizzando sistemi di categorie, generalmente anche se non sempre pensate ad hoc, che si cerca poi di quantificare per consentire inferenze sul significato complessivo del messaggio, sui possibili effetti sul destinatario, sugli interessi, le strategie e i valori dell’emittente. L’analisi del contenuto ha sempre posto l’accento sulla sistematicità della rilevazione, sulla sua obiettività (da intendersi come trasparenza delle procedure), sulla quantificazione. Ha anche tradizionalmente privilegiato le dimensione semantica del testo, di “contenuto” appunto, tanto che Morris la definiva nel 1943 come una “semantica descrittiva”, cui si sarebbe dovuta affiancare una sintattica e una pragmatica descrittiva. Una ricerca basata sull’analisi del contenuto è tipicamente strutturata secondo le seguenti fasi: ¾ Formulazione di un interrogativo, scelta dell’oggetto della ricerca e delle ipotesi ¾ Campionamento ¾ Definizione delle unità di analisi e del sistema di categorie ¾ Test delle categorie, codifica dei testi e controlli di fedeltà ¾ Analisi dei dati ¾ Interpretazione dei risultati 2. Oggetto di ricerca, ipotesi e interrogativi Oggetto di ricerca può essere qualsiasi corpus di messaggi (trasmissioni televisive, libri, articoli di giornale, discorsi politici, pubblicità), prodotto da ogni tipo di emittente (individuo, gruppo informale, organizzazione, istituzione, categoria astratta di persone), rivolto a qualsiasi tipo di ricevente (interlocutore in una relazione interpersonale, controparte o partner in una relazione tra organizzazioni o istituzioni, pubblico nel campo delle comunicazioni di massa). 1 Marcello Maneri - L’analisi del contenuto Alcune delle più diffuse direttrici di ricerca si sono rivolte allo studio di: ¾ Caratteristiche culturali delle comunicazioni di massa ¾ Simboli chiave e strategie persuasive della propaganda politica ¾ Strategie e interessi di organizzazioni, categorie professionali ¾ Valori, atteggiamenti e significati condivisi di gruppi, movimenti, istituzioni, società ¾ Rappresentazioni di fenomeni o categorie di persone da parte di istituzioni educative, mezzi di informazione, prodotti di evasione Le ipotesi e gli interrogativi che guidano l’analisi discenderanno da, e cercheranno di precisare e articolare, l’interrogativo principale della ricerca. Trattandosi di un lavoro strutturato in fasi abbastanza rigide, è bene che il ricercatore abbia già chiari gli elementi da sottoporre ad osservazione. Se obiettivo della ricerca fosse, poniamo, l’individuazione del modello di famiglia proposto nei messaggi pubblicitari, si cercheranno di descrivere i principali modelli rappresentati nei messaggi pubblicitari rispetto a composizione, ruoli, valori, rapporti di potere e di responsabilità, distinguendo tra modelli rappresentati positivamente e negativamente, individuando gli elementi valorizzati come positivi o desiderabili nei due partner e nei figli ei significati associati a questo proposito agli oggetti, ai comportamenti, ai simboli. A questo scopo si formuleranno categorie adeguate a classificare ogni singolo messaggio pubblicitario in relazione alle dimensioni individuate. 3. Campionamento L’universo dei testi necessari a rispondere alle nostre domande sarà in molti casi molto ampio e andrà circoscritto da precise coordinate spazio-temporali. Anche così sarà spesso necessario operare una ulteriore riduzione del materiale da esaminare, procedendo ad un campionamento dello stesso. Si dovranno selezionare innanzitutto le emittenti e, per ognuna di queste, i tipi di testi da analizzare (in entrambi i casi spesso con un campionamento a scelta ragionata). A guidare questa scelta saranno come sempre considerazioni quantitative (quanti materiali vengono in questo modo selezionati e che risorse richiede la loro analisi) e sostantive (quanto si perde in termini di informazione restringendo il campo di analisi, quanto si guadagna in termini di omogeneità ‘formale’ dei materiali e quindi di possibilità di elaborare categorie precise ed adeguate). 2 Marcello Maneri - L’analisi del contenuto Infine, una volta stabilite emittenti e testi da analizzare, sarà in molti casi opportuno selezionarne un sottoinsieme, con una apposita procedura di campionamento. Supponiamo di aver scelto di studiare tutti gli articoli di cronaca (i tipi di testi selezionati) pubblicati da sette testate sufficientemente rappresentative del panorama della stampa quotidiana nazionale nel corso dell’anno 2003 dedicati all’argomento della guerra in Iraq. E’ certo che un tale campione sarebbe costituito da alcune decine di migliaia di casi. Per ridurre il materiale ad una quantità accettabile si dovrà effettuare una ulteriore riduzione, adottando un disegno campionario che potrà essere o meno probabilistico. La scelta dipende anche in questo caso dagli interessi di ricerca di chi conduce l’indagine. A meno di non essere già in possesso di tutto il materiale (ad esempio grazie all’accesso libero ad un archivio elettronico ben indicizzato) raramente si opterà per un campionamento casuale semplice, in quanto richiedendo l’esistenza di una lista della popolazione questa strategia di campionamento obbligherebbe l’équipe di ricerca a raccogliere o perlomeno individuare, con molta fatica, tutto il materiale pertinente per poi analizzarne soltanto una piccola parte. Sarà molto più indicato un disegno campionario a più stadi, in cui si potrebbe scegliere di analizzare l’informazione prima, durante e dopo le operazioni belliche vere e proprie, e all’interno di ognuno di questi tre sottoinsiemi estrarre a campione un certo numero di giornate. In ogni caso si dovrà vigilare sul rischio di perdere materiali importanti per la risposta agli interrogativi che hanno ispirato la ricerca (sapendo però anche effettuare delle necessarie rinunce), sul rischio di produrre un errore sistematico (ad esempio selezionando un articolo ogni sette giorni e finendo così per raccogliere, ad esempio, solo i lunedì, che differiscono dagli altri giorni per il tipo di informazione), sul rischio di introdurre distorsioni (ad esempio vigilando ed eventualmente tenendo conto della estrazione di giornate particolari, segnate da eventi o caratteristiche molto diverse da quelle ricorrenti nelle giornate non estratte). 4. Definizione delle unità di analisi e del sistema di categorie 4.1 Unità di campionamento, di classificazione e di contesto Una volta effettuate le scelte opportune in merito alla riduzione del numero di articoli da esaminare, questi andranno classificati attraverso un sistema di categorie. Nell’ultimo esempio fatto, dove gli articoli classificati diventeranno i casi nella matrice dei dati, le categorie andranno a costituirne invece le variabili. Va introdotta qui una precisazione. Mentre una survey è rivolta a un’unica unità di analisi (gli individui, le famiglie...), nell’analisi del contenuto è opportuno distinguere tra unità di campionamento, di classificazione e di contesto. 3 Marcello Maneri - L’analisi del contenuto Nel nostro esempio le unità di campionamento sono gli articoli di giornale: noi estraiamo un certo numero di articoli, scelti sulla base dei giorni in cui appaiono. In generale le unità di campionamento devono essere il più possibile indipendenti l’una dall’altra (in modo che l’inclusione o l’esclusione di un’unità non abbia implicazioni di sorta sulla scelta delle altre unità) e coerenti al loro interno (in modo che le unità siano logicamente ed empiricamente significative: non avrebbe alcun senso campionare le righe di testo all’interno di un giornale). Le unità di classificazione sono le parti separatamente analizzabili di un’unità di campionamento, quelle cui fanno riferimento le varie categorie al momento della classificazione. La variabile “caratterizzazione del leader dello schieramento avversario”, che prevede i valori “negativa”, “neutra”, “positiva” avrà come unità di classificazione il personaggio. La variabile “appellativi riferiti al leader avversario”, avente come valori tutti i possibili appellativi utilizzati nei testi esaminati per nominare il leader avrà come unità di classificazione le singole parole. La variabile “numero di colonne occupate dal titolo” avrà come unità di classificazione l’intero articolo. Nel primo esempio, l’unità di classificazione è definita a livello di contenuto (personaggi di un film o soggetti in una notizia, temi in un discorso politico, popolazioni in un testo di geografia ecc.), nel secondo al livello delle strutture grammaticali o testuali (la parola, ma potrebbe anche essere la frase, il paragrafo, il titolo ecc.), nel terzo ancora a livello testuale (l’intero articolo), dove ha anche un’evidenza fisica. Le unità di contesto infine circoscrivono il contesto che andrà preso in considerazione per operare le classificazioni. Spesso unità di classificazione e di contesto coincideranno, ma a volte la quantità di materiale simbolico da esaminare sarà necessariamente più ampia di quella prevista dall’unità di classificazione. Nel primo esempio fatto, la caratterizzazione del leader potrà essere desunta dalle sole immagini che lo ritraggono (ad esempio in una notizia di telegiornale), dall’intero ambiente in cui è presentato, oppure ancora dall’insieme del servizio, testo e immagini insieme. In una ricerca sul discorso delle testate economiche in merito al concetto di “flessibilità”, in cui si scelga di classificare le parole in base alla loro valorizzazione positiva, neutra o negativa della flessibilità, l’unità di contesto potrà coincidere con l’unità di classificazione (quindi la parola stessa: “tragedia” darà una valorizzazione negativa, “fenomeno” neutra, “soluzione” positiva), ma potrà essere anche la frase (la frase “la flessibilità non può essere la soluzione” ci porterebbe giustamente a codificare come “negativa” la stessa occorrenza, in cui compare la parola “soluzione”, che sarebbe stata codificata come “positiva” adottando un’unità di contesto più ristretta come la parola), il paragrafo o l’intero articolo. Unità di contesto troppo limitate potrebbero risultare poco significative o distorcenti, come nell’esempio appena fatto, unità troppo ampie poco attendibili (poiché la quantità di informazioni da considerare è molto abbondante e poco trasparenti e controllabili saranno di 4 Marcello Maneri - L’analisi del contenuto conseguenza le scelte effettuate). Se l’unità di campionamento fosse il romanzo, le caratterizzazioni di un personaggio (unità di classificazione) sarebbero poco significative qualora l’unità di contesto fosse la frase, ma anche poco attendibili se fosse l’intero testo. Si sceglierà allora di considerare, per attribuire un valore alla variabile, i singoli paragrafi, o gli episodi. Anche se è possibile adottare svariate unità di classificazione nello stesso studio, sia definite a livello grammaticale (parole, simboli-chiave, frasi, paragrafi, interi testi) sia di contenuto (personaggi, temi, vicende), di norma le ricerche si focalizzano su una sola di queste, anche se si tratta di una scelta niente affatto obbligata. Nella tradizione statunitense abbondano studi incentrati sulla classificazione di parole. Nella tradizione europea, e soprattutto italiana, prevalgono ricerche che classificano unità più ampie, come i personaggi oppure i testi nel loro complesso (in Italia Rositi, 1971, ha chiamato questo tipo di indagine “analisi del contenuto come inchiesta”, per sottolineare la somiglianza con lo strumento del questionario, sottoposto qui a testi invece che a individui). Nel primo caso il ricercatore dispone di dati piuttosto attendibili, ottenibili anche con classificazioni automatizzate che fanno ricorso a dizionari in grado di classificare le parole secondo categorie prestabilite, che tuttavia fanno riferimento a elementi microscopici e decontestualizzati che dovranno per forza essere ricomposti ‘a valle’ in un’unità di senso più ampia, con ovvi rischi di arbitrarietà (per non parlare della adeguatezza problematica delle categorie di classificazione previste dai dizionari eventualmente utilizzati, che possono essere pertinenti per un tipo di ricerca e totalmente insensate per un altro). Nel secondo caso le scelte operate nella classificazione, che deve tenere conto di informazioni complesse e di diversi piani di lettura, possono essere scarsamente attendibili e poco trasparenti - anche se istruzioni rigorose per la codifica dei materiali possono ridimensionare il problema – ma l’inferenza interpretativa richiesta alla fine del processo per ricomporre il senso del testo sarà in compenso molto più ridotta. In altri termini, lavorare sulle parole è rischioso perché i processi di significazione operano su molti piani e limitarsi a quello lessicale può risultare fuorviante, classificare i testi sulla base di unità più ampie può risultare arbitrario, togliendo alla comunità scientifica la possibilità di verificare i passaggi compiuti. Il ricercatore dovrà cercare di muoversi con molta cautela tra questi due pericoli, senza adagiarsi su modelli prestabiliti e cercando di escogitare soluzioni creative, anche combinando unità di classificazione diverse a seconda delle necessità. 4.2 Il sistema di categorie Le categorie ideate per effettuare la rilevazione andranno a costituire le variabili della matrice dei dati (generalmente nominali o ordinali) e sono il vero ‘motore’ della analisi del contenuto. Il 5 Marcello Maneri - L’analisi del contenuto sistema di categorie deve ovviamente essere focalizzato sulle ipotesi della ricerca. In una ricerca sulla propaganda di guerra, partendo dalla considerazione che obiettivi principali di una tale propaganda sono la degradazione simbolica del nemico, la valorizzazione di tutto ciò che rappresenta lo schieramento amico, la difesa delle buone ragioni della guerra, la rassicurazione dei propri cittadini rispetto all’andamento del conflitto, la demoralizzazione dell’avversario, e sapendo che un governo può cercare di far conoscere od occultare, oltre che presentare le cose nella forma più appropriata, si formuleranno categorie pertinenti a identificare le ‘mosse’ portanti di ognuna di queste strategie. Ad esempio categorie che servano a identificare quali eventi vengono raccontati oppure enfatizzati e quali altri sono sottaciuti, oppure a descrivere come sono qualificati, con appellativi, aggettivi, azioni principali, l’avversario e il proprio schieramento, o ancora a individuare le argomentazioni addotte per presentare la guerra come giusta, legittima, inevitabile. Le categorie devono rispondere alle leggi di una buona classificazione (esaustività, esclusività, unicità del fundamentum divisionis) ed essere il più possibile esplicitate. In altri termini, come nel resto della ricerca quantitativa, la loro definizione operativa dovrà lasciare i minimi margini di ambiguità. Per raggiungere questo obiettivo è necessario operare in tre direzioni: ¾ Utilizzare categorie dal significato semplice e non ambiguo, per evitare di obbligare chi effettua la codifica, in genere individui diversi, a dover riempire il ‘vuoto normativo’ con le proprie interpretazioni soggettive, che diminuirebbero la fedeltà della registrazione ¾ Fornire istruzioni procedurali chiare ed esaurienti per i codificatori, le quali dovranno coprire tutte le possibili situazioni in cui essi si possono trovare ¾ Nel caso di unità di classificazione non elementari, elaborare la definizione operativa in modo da delimitare con precisione il campo semantico della categoria in questione. A questo scopo conviene procedere in modo simile a quello già indicato da Lazarsfeld (1958): a) Fornire una definizione concettuale della proprietà esaminata; b) Scomporre analiticamente il concetto nelle varie dimensioni che lo compongono; c) Elencare possibili indicatori delle varie dimensioni, accludendo esempi chiave tratti dal corpus di testi studiato o da uno analogo Un esempio aiuterà a chiarire questi passaggi. In una ricerca sulla rappresentazione dei migranti nella stampa quotidiana italiana (Maneri, 1995) sono state utilizzate diverse scale di differenziale semantico per identificare le principali connotazioni simboliche dell’immigrazione come viene raccontata dai mezzi di informazione. Per ogni articolo, andava identificato il protagonista della notizia considerato come straniero (che poteva anche essere, oltre a un individuo, un gruppo, un’associazione o un raggruppamento astratto) e si doveva valutare se nella messa in forma del 6 Marcello Maneri - L’analisi del contenuto discorso, e non dunque come semplice conseguenza del fatto raccontato, venisse veicolata una certa rappresentazione simbolica attraverso commenti, allusioni, incisi, presupposizioni, aggettivi, appellativi, categorizzazioni, generalizzazioni, stereotipi, miti e attraverso l'enfatizzazione o l'occultamento di particolari. Queste categorie erano operativizzate come coppie di opposti, quali “violento/pacifico”, “sporco/pulito”, cui corrispondevano punteggi che potevano andare da 1 - per uno dei due poli - a 5 - per il polo opposto. La procedura richiedeva che se si fossero individuati dispositivi che orientavano la rappresentazione verso un estremo (ad esempio “violento”), si sarebbe dovuto assegnare il punteggio corrispondente (1). I punteggi estremi - 1 e 5 – erano riservati ai casi in cui era più esplicita la valenza del messaggio veicolato dal giornalista – i punteggi intermedi - 2 e 4 – andavano utilizzati nel caso di una lieve propensione verso uno dei due poli. In entrambi i casi il codificatore doveva essere in grado di indicare quale dispositivo testuale lo aveva convinto della scelta effettuata. Nel caso in cui il testo non avesse fornito elementi di sorta su una determinata dimensione, andava scelto il codice “0”. Se si fossero invece individuati elementi contraddittori, che finivano per bilanciarsi sulla dimensione in questione, si sarebbe assegnato il codice 3. Oltre a queste istruzioni, che indicavano al codificatore come comportarsi in tutte le possibili evenienze, il campo semantico dei concetti utilizzati era precisato con una definizione accompagnata da esempi riportata nella scheda di codifica. Tre di queste variabili erano ad esempio orientate a registrare il grado in cui fosse eventualmente sottolineata una differenza in termini di classe, natura o cultura rispetto alla popolazione autoctona. La definizione operativa riportata nella scheda di codifica per la prima di queste variabili è riportata in Figura 1. Figura 1. Esempio di definizione operativa Differenza in termini di classe |_|Non pertinente 0 Uguale |_||_||_||_||_| Diverso 1 2 3 4 5 “Diverso” se viene sottolineata una differenza dovuta a condizioni di vita, a privazioni di ordine materiale, per mancanza di risorse, povertà ecc. che è vista come causa di una situazione o comportamento (p. es. "delinquenti per fame" o "la rissa è scoppiata a causa del sovraffollamento") o come caratteristica della situazione in sé (p. es. "le periferie abitate da balordi e disperati di colore" ecc.). “Uguale” se viene sottolineata una somiglianza o negata una differenza (“Si allontanano dal campo su automobili di grossa cilindrata”, “a giudicare dai vestiti non si direbbero poveri cristi”. Data la stretta dipendenza delle categorie impiegate dalle ipotesi della ricerca, normalmente nell’analisi del contenuto, in particolare nella tradizione europea, si utilizzano categorie pensate ad 7 Marcello Maneri - L’analisi del contenuto hoc, che possono essere dedotte da considerazioni teoriche (è il caso della distinzione sopra citata tra simbolizzazioni della differenza in termini di classe, di natura o di cultura) e derivate da una conoscenza pregressa dei materiali da analizzare. In alcune aree di ricerca ‘classiche’, l’esigenza di accumulare e confrontare risultati ha tuttavia prodotto una spinta verso l’automazione delle procedure e l’adozione di categorie standard (è il caso della Evaluative Assertion Analysis di Osgood, per l’analisi degli atteggiamenti, o del Lasswell Value Dictionary, per l’analisi della comunicazione politica). Il sistema di categorie è generalmente stabilito prima dell’analisi, anche se è possibile modificare alcune variabili in corso d’opera ri-codificando poi tutti i testi precedentemente classificati con la versione non ancora modificata. E’ anche possibile però, quando si lavori sulle parole, limitarsi a riportare liste individuate sulla base di qualche criterio (ad esempio tutti gli appellativi utilizzati per nominare il leader dello schieramento nemico nell’esempio della ricerca sulla propaganda di guerra) che saranno poi classificate con categorie elaborate induttivamente, che emergono dal materiale stesso per l’appartenenza a comuni aree semantiche oppure per via delle reciproche associazioni tra le parole stesse. Holsti (1968), riprendendo un precedente lavoro di Berelson (1952), ha proposto una lista di tipi di categorie (che traduciamo liberamente in Figura 2) che può costituire una base utile per l’ideazione di categorie ad hoc. Figura 2. Tipi di categorie • Soggetto, tema: di cosa tratta? • Direzione: come è trattato il tema? • Norme: qual è la base utilizzata per classificazioni e valutazioni? • Valori: quali atteggiamenti, obiettivi e desideri sono presentati? • Mezzi: quali mezzi sono usati per raggiungere gli obiettivi? • Caratteristiche: quali caratteristiche sono usate nella descrizione delle persone? • Attori: chi inizia particolari azioni e chi le compie? • Autorità: nel nome di cosa vengono fatte delle affermazioni? • Origine: da dove sorge l’atto comunicativo? • Scopo: a chi è diretto? • Luogo: dove ha luogo l’azione? • Conflitti: qual è la causa dei conflitti? Chi sono i partecipanti? Quanto è forte il conflitto? • Esito: la risoluzione del conflitto è felice, tragica o incerta? • Tempo: quando ha luogo l’azione? • Forma o tipo di comunicazione: quale canale comunicativo è usato? • Forma delle affermazioni: quali forme grammaticali e sintattiche possono essere individuate? 8 Marcello Maneri - L’analisi del contenuto • Metodi: quali metodi retorici o di propaganda sono impiegati? 5. Test delle categorie, codifica dei testi e controlli di fedeltà Prima di cominciare le operazioni di codifica, sarà opportuno procedere a un test del sistema di categorie, codificando un piccolo campione dei testi da esaminare in modo da individuare eventuali problemi di ambiguità, di carenza di esaustività o mancanza di pertinenza delle definizioni operative, che possono riguardare le istruzioni di codifica, la definizione dei concetti e delle dimensioni in cui si articolano. E’ opportuno che questo test venga fatto dai codificatori, in modo da individuare eventuali divergenze nella codifica dei medesimi item che segnaleranno problemi di ambiguità o scarsa esplicitazione delle regole di codifica. Le revisioni operate sulle categorie problematiche dovrebbero essere nuovamente sottoposte a test, in modo da valutarne nuovamente la fedeltà. Una volta addestrati i codificatori potranno cominciare le operazioni di registrazione, al termine delle quali si dovrà valutare la fedeltà dei dati. Nell’analisi del contenuto essa stima il grado in cui i dati risultanti dalle codifiche siano il riflesso dello stato dei testi rispetto alle categorie impiegate oppure il risultato di fattori di disturbo intervenuti nella rilevazione, delle caratteristiche peculiari dei singoli codificatori, delle distorsioni procurate da procedure mal definite. Anche se la precedente fase di test del sistema di categorie avesse fornito alla fine risultati soddisfacenti, è possibile che i dati siano nondimeno poco attendibili, per problemi di stanchezza dei codificatori, per cambiamenti sottili intervenuti nel tempo in relazione all’interpretazione di determinate istruzioni di codifica, per errori che non potevano emergere nel sub-campione usato per il test. Anche nel caso di codifiche automatiche effettuate dal computer è sempre bene verificare che situazioni non previste non abbiano portato ad errori di classificazione. Nel caso più tipico, essendo i codificatori il fattore variabile generalmente più influente, si faranno codificare gli stessi testi a individui differenti confrontando poi i risultati. Naturalmente i controlli di fedeltà si effettueranno su un sub-campione di testi, che dovrà rappresentare le più diverse condizioni di scelta comportate dalla ricerca. Sarebbe eccessivo, per gli scopi che si prefigge questo manuale, entrare nel merito delle varie misure di fedeltà (si veda Krippendorff, 1980). Basti dire che, piuttosto che una misura sintetica della fedeltà dei dati di una ricerca, è utile disporre di un valore che stimi la fedeltà per ciascuna variabile. Il ricercatore escluderà dall’analisi le variabili giudicate meno affidabili secondo uno standard definito a priori (standard che sarà tanto più restrittivo quanto più alta sarà la validità che si pretende dai risultati della ricerca, anche in 9 Marcello Maneri - L’analisi del contenuto relazione al costo comportato da eventuali conclusioni errate) e ne tratterà altre, dalla fedeltà solo leggermente più alta, con cautela. 6. Analisi Una volta effettuati gli opportuni controlli di fedeltà, e fatta una preliminare pulizia dei dati, questi sono pronti per essere analizzati. Per certi versi le procedure impiegabili nell’analisi del contenuto non sono diverse da tutti gli altri tipi di analisi dei dati: si tratta pur sempre di esaminare una matrice di dati che incrocia casi e variabili con tecniche che possono andare dalla semplice distribuzione di frequenze alle più complesse procedure di analisi multivariata. Di fatto però alcune tecniche sono molto più utilizzate di altre, e con opportuni software è anche possibile lavorare direttamente sulle parole, con procedure ideate appositamente per l’analisi dei testi. Distingueremo quindi tra dati codificati – di tipo numerico - e dati naturali – di tipo lessicale. 6.1 Distribuzioni di frequenza e tavole di contingenza (dati codificati) Il risultato principale di molte ricerche basate sull’analisi del contenuto è costituito da considerazioni come: “il tema più toccato nella campagna elettorale dal partito A è stato quello del risanamento del deficit pubblico, mentre il partito B ha privilegiato la riduzione della disoccupazione”; “il numero di ore di trasmissione caratterizzate dalla presenza di episodi violenti è aumentato del 30% nell’ultimo decennio di trasmissioni di fiction televisiva”; “nelle soap opera americane i lavoratori bianchi appaiono quasi sempre in ruoli tecnici o direttivi, quelli di colore in posizioni non qualificate”. Si tratta di semplici incroci tra variabili. Le distribuzioni di frequenza e gli incroci possono essere effettuate sia nel caso di categorie che lavorano su unità di classificazione individuate a livello di contenuto (i personaggi, i temi, gli episodi di fiction, come negli esempi visti finora) che su categorie che classificano parole o frasi. In questo ultimo caso si assume che le frequenze maggiori di certe categorie (e quindi di parole, o di frasi, riconducibili ad esse) indichino una maggiore attenzione per i temi o i significati rappresentati da quelle categorie. Il numero di parole riconducibili alla categoria “economico” presenti nel programma elettorale di un partito può essere considerato un indicatore dell’insistenza relativa di quel partito sui temi economici, rispetto ad altri temi, rispetto agli altri partiti o ancora in confronto con i programmi delle elezioni precedenti. Le categorie con cui classificare le parole, o le frasi, o ancora i temi, possono essere scelte prima della codifica degli articoli, derivando da un approccio teorico particolare e/o essendo inserite in un dizionario accluso a un programma di analisi dei testi, 10 Marcello Maneri - L’analisi del contenuto che attribuisce automaticamente le parole incontrate ad una delle categorie esistenti. Possono però anche derivare, secondo un approccio più induttivo, dal materiale empirico già raccolto, soprattutto quando questo non è troppo abbondante. Nell’indagine sulla rappresentazione dell’immigrazione sulla stampa quotidiana precedentemente citata ad esempio, erano stati registrati tutti gli appellativi, gli aggettivi qualificativi e le espressioni figurate utilizzati per i soggetti considerati negli articoli come stranieri. In un secondo momento, avendo individuato un sotto-genere dominante nelle pagine di cronaca locale legato a una particolare lettura del tema del “degrado urbano”, i cui abbondanti elementi descrittivi sembravano essere ripresi in tutto il discorso mediatico sull’immigrazione, aggettivi, appellativi e tropi impiegati in questo sotto-genere sono stati classificati in sette categorie che emergevano dal materiale stesso, escludendo i nomi propri e i termini di definizione generale di provenienza (“immigrati”, “tunisini” ecc.). I contorni dell’immagine dell’immigrazione che si stagliava attraverso questo discorso emergente erano dati dai temi della “criminalità” (ladri, spacciatori...), della “violenza” (feroci, aggressivi...), dell’”indigenza” (baraccopoli, disperati...), della “clandestinità” (clandestini, irregolari...), che qualificavano l’immigrazione come un fenomeno che sta all’intersezione tra la marginalità e la devianza, accompagnati da un vocabolario “esotico” (tribù, casbah...), che definiva i soggetti in questione come altri e allo stesso tempo dava un tono di colore agli articoli, e da un registro “bellico” (invasione, assediati...) e “sanitario” (bonifica, risanato...) che dava l’impronta del rapporto con l’”altro” raffigurato in queste notizie (Maneri, 1995). 6.2 Distribuzioni di frequenza, KWIC, concordanze (dati naturali) Distribuzioni di frequenza e incroci possono essere effettuati anche direttamente sul materiale testuale disponibile in formato elettronico. Frequenze di parole sono esaminate in tutte le ricerche che usano questa unità di classificazione e consentono, una volta ordinate alfabeticamente, di individuare facilmente eventuali errori di imputazione. L’assunto che sta alla base dell’analisi di una lista di parole è sempre quello che le parole usate più frequentemente (una volta accorpate le varie declinazioni e coniugazioni della stessa radice, come in “stato”, “statale”, “statali”, “statalista”) riflettono i significati più salienti nel discorso dell’enunciatore. Bisogna fare però molta attenzione alle parole dai multipli significati: un conto è dire “lo stato italiano”, un altro “lo stato dei lavori”. Le due accezioni individuate (“corpo politico” e “situazione”), hanno significati completamente diversi e vanno trattate come parole distinte, il che richiede un lavoro molto oneroso a meno di non utilizzare software che dispongono di dizionari in grado di decodificare, attraverso il contesto d’uso di una parola, le sue diverse accezioni. Questo genere di analisi limita quasi necessariamente l’attenzione al livello semantico, finendo spesso per produrre considerazioni di 11 Marcello Maneri - L’analisi del contenuto mero carattere tematico (si parla di questo e non di quello) anche se si presterebbe in realtà molto bene anche per analizzare rappresentazioni, caratterizzazioni, prospettive. Un utile strumento per chiarire i modi d’uso di singole parole e per andare al di là della mera analisi tematica è la procedura KWIC (Key Word In Context), prevista da molti programmi di analisi dei testi, che consente di visualizzare tutte le occorrenze di una determinata parola riportando per ogni occorrenza un certo numero di parole che precedono e seguono quella parola nel testo. Figura 3. KWIC della parola “stato” Berlusconi Se lo stato dandoci tra l'altro dei servizi che non ci piacciono per la lor Se lo stato invece ci chiede fino a un terzo di ciò che ciascuno di noi gu alla schiena si dice fuori le prove adesso dopo che un uomo è stato messo in galera, io credo che le prove devono venire fuori p sto non è qualcosa che può essere definito accettabile in uno stato democratico, in uno stato di diritto. na miriade di tasse, imposte, tributi, più di qualunque altro stato dell'occidente delle aliquote assolutamente elevate, delle pr che gli Italiani possano accettare di lavorare più tempo per lo stato che per sé e per la propria famiglia. ersi due opposti programmi, quello della sinistra sempre più e quindi sempre più tasse per sostenere la spesa pubblica, i stato un futuro di benessere nella libertà. E questo e il modello di stato che noi mettiamo al primo punto nel nostro manifesto elett nostro entusiasmo, l'entusiasmo della gente che crede in uno stato liberale, che vuole liberarsi dalle nomenclature, dalle buroc avere la possibilità di lavorare senza essere oppressa da uno stato invadente, vuole avere la possibilità di guardare al futuro c Noi propugniamo un certo modello di società e di stato , il modello dello Stato liberale che è antitetico al modello c Fini? Di quale Europa fanno parte loro? Quali sono i capi di stato con cui Fini discute delle strategie della Conferenza? Chi lo rvizi li fa meglio a costi inferiori e con maggiore qualità dello stato , facendo sì che lo stato si occupi meglio dei suoi compiti fon D’Alema A me Fede sta simpatico, sono stato Tutto ciò che viene dopo il Dini Ministro del tesoro è anche socio onorario del Fede fans club, soltanto è un uomo stato per me francamente ed assolutamente inaspettato, è stata Esempio di che cosa vuol dire tenere in disordine i conti dello stato . Nei pochi mesi del governo Berlusconi abbiamo avuto un o delle imposte, avere un rapporto diverso fra il cittadino e lo stato ma abbiamo detto che per due anni il peso fiscale globale n mamente importante e estremamente utile per i rapporti fra stato e cittadino non può naturalmente tradursi in una forte rid rticolare che è dovuto ad un uomo che ha servito con onore lo stato . Per ora mi limito a dire che Di Pietro è stato assolto dalle Bossi que la Lega può trovare la sua collocazione all'interno di uno stato federale, il problema non è la secessione della Lega, per sé la secessione la potrebbe far venire una crisi economica dello e il Parlamento di Roma sono Roma Polo e Roma Ulivo che stato e di una virgola il modo di funzionare e l'organizzazione dello stato. federalismo, per avere il cambiamento e il superamento dello stato centralista, cosa impossibile nell'attuale Parlamento con u Nella Figura 3 sono riportate alcune occorrenze della parola “stato” riprese dai discorsi di alcuni dei principali leader politici trasmessi dai telegiornali e dai radiogiornali nazionali nell’ultimo mese 12 Marcello Maneri - L’analisi del contenuto della campagna elettorale del 19961. Sono presenti in questa lista due significati completamente diversi, il “corpo politico” e il participio passato del verbo essere, ma soprattutto rappresentazioni diverse dello stato: per Berlusconi si tratta principalmente di un corpo oppressivo e parassitario che sottrae risorse ai cittadini e va alleggerito (lo “stato liberale”), per Bossi di un ente accentratore, da superarsi attraverso la riforma federalista, mentre per D’Alema di una entità verso la quale bisogna osservare rispetto, in un rapporto che può anche essere modificato. Una lista del genere può essere molto utile per un’analisi delle concordanze tra una parola e tutte le altre. Osservando quali parole si associano più frequentemente alla parola “stato” si può chiarirne il significato in uso, esplicitarne la valorizzazione positiva o negativa, individuarne le connotazioni e le associazioni tematiche. Questa analisi può essere sistematizzata calcolando dei sotto-dizionari delle parole che, ad esempio, appaiono tra le sette immediatamente precedenti e successive alla parola indagata ed è molto utile nello studio di simboli chiave. 6.3 Analisi delle contingenze, analisi delle corrispondenze lessicali Mentre gli incroci presentati finora si limitavano ad attribuire categorie di contenuto, o elementi lessicali, alle varie modalità di una variabile extra-testuale (il leader politico, la testata, il periodo) un metodo per esplorare più a fondo i testi consiste nell’analizzare il modo in cui i vari elementi testuali – categorie di contenuto oppure parole – si combinano tra loro, evidenziando così la struttura delle associazioni semantiche e dunque, sempre a un livello puramente semantico, il significato. Quando si lavora con categorie di codifica, si possono ad esempio ricercare ed eventualmente contare tutti i paragrafi, o i discorsi, in cui appare la categoria “economico” insieme alla categoria “conflitto”, oppure, lavorando direttamente sul lessico, esaminare e quantificare le unità di contesto in cui le parole “stato” e “tasse” appaiono insieme. Un approccio derivante da una tradizione diversa, quella dell’analyse des données francese, cerca di analizzare il modo in cui l’intero dizionario si distribuisce tra i vari testi che compongono il corpus in esame. La procedura esamina le differenze tra le varie parole nell’associarsi ai testi e tra i vari testi nell’includere le parole. E’ necessario, da parte del ricercatore, un lungo lavoro preparatorio, che consiste nell’accorpamento di sinonimi e nella scrematura dei termini meno significativi, aventi frequenza totale più bassa o che si associano in modo casuale e non strutturato ai testi. Alla fine di questo lavoro preparatorio le parole vengono proiettate su un piano definito da due assi fattoriali in cui parole che si distribuiscono tra i testi in modo molto diverso tra loro e contemporaneamente testi che includono parole molto diverse tenderanno a trovarsi agli estremi opposti degli assi. In altri termini la procedura lavora sulla struttura delle opposizioni: le parole che non appaiono negli stessi 1 L’analisi di questi testi si trova in Maneri e Schoenberg, 1997. 13 Marcello Maneri - L’analisi del contenuto testi, e i testi in cui compaiono lessici diversi, si trovano ai lati opposti del grafico. In questo modo è possibile rappresentare graficamente un quadro sintetico della struttura semantica generale, che mette in luce le principali differenze tra i testi presi in esame. Vediamo, con un esempio, questa tecnica più da vicino. Figura 4. Analisi delle corrispondenze lessicali della titolazione su “Piazza Verdi” .950 -----------------------------------------------------------------------------------------------------------------------.918 | | tamburi | .886 | | | .853 | | | .821 | | polizia | .789 | protesta | .757 | | | .725 | | | .692 | scettici | bisogna | .660 | pulizia | | .628 | anarchici abitanti | .596 | esasperati | | .564 | operazione | tribù | .531 | | | .499 | proposta | REPUBBLICA | .467 | | | .435 | bivacchi | problema | .403 | disperati | .370 | | | .338 | più/no più/sì | | .306 | negozianti | | .274 | forzedell'ordine assediati | | .242 | | gente | .209 | | controlli | .177 | | | .145 | | clochard solidarietà | .113 | | volontariato | .081 | interventi | | .048 | commercianti degrado | | .016 ---------------------------------------------------------+--------------------------piano-----------Piazza Grande----- | -.016 | | rischio | -.048 | anti-degrado | vandali | -.081 | paura città negozi | street-worker | -.113 | | | -.145 | | | -.177 | | | -.209 | | | -.242 | abbandonati sicurezza VIP | -.274 | denunce protestano | barboni | -.306 | emergenza | | -.338 | blitz | sindacato | -.370 | | Bottino MATTINA | -.403 | | | -.435 | CARLINO | associazioni -.467 | | Comune | -.499 | zona | | -.531 | | | -.564 | | | -.596 | | | -.628 delinquenti residenti | | -.660 | | | -.692 | anti-bivacco | | -.725 | | | -.757 | rivitalizzare combattere | sosta selvaggia | -.789 | teppisti | | -.821 | | senzatetto | -.853 | | | -.886 | | | -.918 | | | -.950 ------------------------------------------------------------------------------------------------------------------------1.205 -.723 -.241 .241 .723 1.205 14 Marcello Maneri, L’analisi del contenuto Nella Figura 4 è riportata un’analisi dei 161 articoli apparsi nelle tre edizioni bolognesi dei quotidiani “L’Unità” - che nell’edizione locale si chiamava “Mattina” -, “La Repubblica”, “Il Resto del Carlino” a proposito di quello che fu chiamato il "caso" Piazza Verdi2. A partire da alcuni atti vandalici perpetrati nel mese di agosto, ma soprattutto nel novembre del '96, Piazza Verdi era divenuta a Bologna una sorta di laboratorio del conflitto tra diverse visioni circa l'uso del territorio del centro storico e la politica del contrasto a quello che veniva chiamato il “degrado”. Gli articoli furono suddivisi per l’analisi a seconda della testata di pubblicazione, cosicché nel grafico si può osservare il modo in cui le tre testate hanno rappresentato la questione. Le parole che si trovano in una zona del piano fattoriale sono quelle non o raramente utilizzate dalle testate collocate nella parte opposta. Di conseguenza la prossimità di certe parole a una testata si può interpretare come una relativa preferenza accordata loro dalla testata stessa. Repubblica identifica chiaramente un problema di degrado, fatto di tamburi e bivacchi. Per questa situazione gli abitanti, o la gente, sono esasperati, protestano; i negozianti sono assediati e chiedono pulizia, ma rimanendo scettici. Gli altri attori presenti sulla scena (si parla sempre di esclusività, quindi di attori poco menzionati dagli altri giornali) sono la polizia da una parte e le tribù di disperati e gli anarchici dall'altra. Vengono dunque chiaramente identificati (e stigmatizzati) gli agenti del degrado e le sue vittime. Compaiono poi gli inviti a non fare più le cose come prima (che abbiamo siglato, nella fase di ricodifica del lessico, come più/no) o le richieste di maggiori interventi (più/sì), in un'area già prossima a quella del Carlino. Il discorso di questa ultima testata è per molti versi simile a quello di Repubblica. Viene rappresentato un problema di sicurezza, un'emergenza, dovuta a delinquenti e teppisti, contro cui i residenti della zona - che come i commercianti e i loro negozi, sono abbandonati - protestano. Bisogna rivitalizzare la città invasa dalla paura. Come si vede lo schema coincide, anche se il Carlino usa toni più forti e un immaginario più noir. Con Mattina entrano in scena i soggetti politici e sociali alla ricerca di una soluzione (ad esempio il piano) per quella che viene definita come una situazione a rischio. L'idea della solidarietà unirebbe soggetti che hanno polemizzato anche aspramente: le associazioni, tra cui Piazza Grande, il volontariato, gli street-worker , il sindacato, la sovrintendente Bottino, il Comune. Gli agenti del “degrado” sono anche le sue vittime: oltre ai vandali, appaiono infatti i clochard, dalla connotazione inoffensiva, i barboni o senza tetto. Mattina propone una visione dei problemi della città diversa da quella delle altre due testate: non viene rappresentata una contrapposizione tra “noi” vittime e “loro” colpevoli, ma una situazione a rischio, fatta di contrasti sociali (i VIP che vengono 2 L’analisi completa si trova in Maneri e Pavarini, 1997. , (Analisi del contenuto2.rtf), bat: 48952, 18/05/2004 4.52 , ver. 3 15 Marcello Maneri, L’analisi del contenuto ad assistere alla Prima del Teatro Comunale e i barboni) e di problemi non solo riconducibili alla marginalità sociale, come quello battezzato sosta selvaggia. 3 Questa tecnica di analisi si presta molto bene a una presentazione sintetica, per via geometrica, dei discorsi e delle loro differenze. Se il campo semantico affrontato è troppo ampio, finisce però per riprodurre, in modo efficace ma tutto sommato scontato, la semplice composizione tematica dei discorsi, che il ricercatore, e spesso persino il lettore, conosce già, almeno approssimativamente, oppure costringe a una selezione delle parole da sottoporre ad analisi in fin dei conti arbitraria. La focalizzazione su un argomento specifico permette invece di far emergere differenziazioni più sottili, anche se limitate al livello lessicale, che andrebbero però sempre controllate con altri metodi. Questa tecnica infatti, isolando solo alcuni elementi del discorso e trattando i testi come sacchi di parole, senza alcuna considerazione per la loro vicinanza – né ovviamente per le loro relazioni pragmatiche e sintattiche - non garantisce da interpretazioni distorte, e dovrebbe essere sempre utilizzata come uno strumento ausiliario. 7. Validità dei dati e interpretazione dei risultati Un’analisi come quella appena illustrata comporta un’elevata quantità di lavoro, perché la preparazione del dizionario richiede continui controlli sul significato d’uso dei singoli termini, propedeutici ai loro accorpamenti sinonimici. Questo movimento continuo in avanti e indietro tra il testo ‘naturale’ e i dati che si vanno organizzando è fondamentale per la loro validità. La consapevolezza delle conseguenze dei propri interventi è determinante per la validità semantica - o di contenuto - dei dati, cioè per la loro capacità di rappresentare i significati rilevanti per il contesto in questione. Quando si opera con categorie il problema si presenta in modo simile. Categorie inappropriate, con definizioni operative che lasciano margini di ambiguità e confusione, portano a dati che distorcono necessariamente la semantica del testo originale, senza che il ricercatore possa 3 Le vicinanze e le lontananze delle testate dalle varie parole non vanno però interpretate in senso assoluto, in quanto quella in oggetto è una sintesi non priva di distorsioni. L’interpretazione del grafico si deve basare innanzitutto sull’esame della collocazione delle parole e delle testate rispetto al significato dei due assi fattoriali. Mentre l'asse verticale non appare organizzare l'insieme dei vocaboli secondo una dimensione semantica coerente, l'asse orizzontale (il primo estratto dall’algoritmo, che spiega il 65 % della varianza) polarizza le parole dividendo il grafico in due parti contrapposte: la parte sinistra, soprattutto verso il suo estremo, dove trovano posto i termini che segnalano con nettezza l'illegalità, la sua denuncia e il suo contrasto; e la parte destra, dove non ha posto l'etichettamento della devianza mentre appaiono i soggetti dell’associazionismo e del volontariato e le parole che richiamano un intervento sociale non repressivo. Si tratta per certi versi di una sorta di riedizione della vecchia polarità repressione-prevenzione. Vista in questa ottica la posizione di Repubblica, che dopotutto si colloca – anche se di poco – nella metà a destra del grafico, indica che questo giornale non ignora quel vocabolario. E del resto una parte delle parole prima attribuite a Mattina si trovano, nel grafico, a metà strada tra questa e Repubblica (clochard, solidarietà, volontariato). Il discorso di quest'ultima non è quindi così univoco come era apparso. , (Analisi del contenuto2.rtf), bat: 48952, 18/05/2004 4.52 , ver. 3 16 Marcello Maneri, L’analisi del contenuto essere consapevole della portata e della direzione della distorsione (sempre che sia possibile parlare di un significato ‘oggettivo’ del testo, si veda oltre). Il movimento tra testo e dati è fondamentale anche per un secondo tipo di validità, la validità per criterio, che riguarda non più i dati ma i risultati stessi dell’analisi. In questo caso la validità dei risultati ottenuti è valutata in riferimento ad un criterio esterno, che può essere dato dalla conoscenza del materiale (i risultati sono in contraddizione con quanto emerge da una lettura attenta dei testi?), o dall’impiego di altri metodi, ad esempio di analisi qualitativa (i risultati ottenuti con i due metodi sono congruenti?). Non si deve pensare che il ricercatore ignori queste relazioni fino al sacro momento del controllo della validità: in realtà tutte le ipotesi e le interpretazioni che emergono durante l’analisi vengono da subito raffinate e validate con un ritorno ai testi. Un altro tipo di validità che rimane importante anche nell’analisi del contenuto è la validità di costrutto, dove si fa riferimento come si è detto, per la valutazione dei risultati come delle categorie, alla corrispondenza con modelli e teorie affermate, così come anche a semplici conoscenze sul contesto da cui i dati provengono. Va comunque sottolineato che il concetto di validità, ancora legato a una concezione positivistica della scienza, rischia spesso di implicare il fatto che esista un vero significato del discorso oggetto di analisi, rispetto al quale si valuta la corrispondenza dei dati e dei risultati, e quindi la loro qualità. Nell’analisi del contenuto, con la sua enfasi sulla fedeltà dei dati, spesso si assume implicitamente o esplicitamente che, dal momento che più analisti forniscono gli stessi risultati, l’analisi è obiettiva, confondendo fedeltà con obiettività. Il fatto desiderabile che i dati abbiano un’alta fedeltà non ha alcun valore rispetto all’obiettività dell’analisi, che si rivela una chimera nel momento in cui si consideri che ogni interpretazione è soggettiva. Nel corso dei decenni si è registrata una decisa convergenza tra varie discipline verso una concezione negoziata del significato, visto come il frutto di un’interazione tra il discorso e l’audience, o lettore, o ricevente. Il significato è ciò che ogni lettore attribuisce al testo, e dal momento che dello stesso testo vengono date letture diverse, non può esistere un significato oggettivo. Questo argomento verrà sviluppato a proposito dell’analisi del discorso. Per ora basti dire che lo sforzo deve essere semmai quello di rendere intersoggettivamente verificabile la soggettività, di consentire a chi non ha svolto l’analisi di considerarla in tutti i suoi passaggi, grazie alla trasparenza delle sue procedure. , (Analisi del contenuto2.rtf), bat: 48952, 18/05/2004 4.52 , ver. 3 17 Marcello Maneri, L’analisi del contenuto Riferimenti bibliografici BERELSON B. (1952), Content Analysis in Communication Research, Hafner, New York. HOLSTI O. R. (1968), Content Analysis, in G. Lindzey, E. Aronson (eds) The Handbook of Social Psychology, vol. 2, Research Methods, Addisno-Wesley, Reading. KRACAUER S. (1952), The Challenge of Qualitative Content Analysis, Public Opinion Quarterly, 16, pp. 631-642. KRIPPENDORFF K. (1980), Content Analysis. An Introduction to its Methodology, Sage, London (trad. it. Analisi del contenuto. Introduzione metodologica, Eri, Torino, 1983). MANERI M. (1995), Stampa quotidiana e senso comune nella costruzione sociale dell’immigrato, Trento, tesi di dottorato. MANERI M., PAVARINI M. (1997), Profili di città: Bologna, in La sicurezza in Emilia-Romagna. Terzo rapporto annuale 1997. Prima parte: la sicurezza nelle città, Quaderni di Cittàsicure, settembre 1997, 11a. MANERI M., SCHOENBERG S. (1997), Non solo temi. Un’analisi lessicale dei discorsi elettorali, in M. Livolsi, U. Volli (a cura di) Il televoto, Franco Angeli, Milano. OSGOOD C. E. (1959), The Representation Model and Relevant Research Methods, in I. De Sola Pool (ed.) Trends in Content Analysis, University of Illinois Press, Urbana. ROSITI F. (1970), L’analisi del contenuto come interpretazione. Eri, Torino. , (Analisi del contenuto2.rtf), bat: 48952, 18/05/2004 4.52 , ver. 3 18