...

Analisi delle Corrispondenze semplici

by user

on
Category: Documents
30

views

Report

Comments

Transcript

Analisi delle Corrispondenze semplici
Analisi delle
Corrispondenze
semplici
A. Iodice
Analisi delle Corrispondenze semplici
Definizione a
matrice dei
dati
Strumenti quantitativi per l’economia e la finanza I
Misura di
connessione
Alfonso Iodice D’Enza
[email protected]
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Università degli studi di Cassino e del Lazio Meridionale
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
1 / 65
Outline
Analisi delle
Corrispondenze
semplici
A. Iodice
1
Definizione a matrice dei dati
2
Misura di connessione
Definizione a
matrice dei
dati
3
Indipendenza
Misura di
connessione
4
Indici di connessione
5
Trasformazioni sulla tabella a doppia entrata
6
Interpretazioni geometriche
7
Formalizzazione del problema
8
Esempio di applicazione con R
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
2 / 65
Analisi Delle Corrispondenze
Analisi delle
Corrispondenze
semplici
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Analisi multidimensionale di dati qualitativi
L’Analisi delle Corrispondenze rappresenta uno strumento per
lo studio delle relazioni tra due caratteri statistici qualitativi.
La sua generalizzazione al caso di più variabili qualitative si
definisce Analisi delle Corrispondenze Multiple.
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
La matrice dei dati
L’Analisi delle Corrispondenze si applica a coppie di variabili
qualitative:i risultati dell’osservazione dei caratteri su un
collettivo di n unità vengono riportati in una tabella a doppia
entrata.
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
3 / 65
Tabella a doppia entrata
Analisi delle
Corrispondenze
semplici
Si considerino due caratteri qualitativi A e B aventi
rispettivamente k e q modalità osservate su n unità statistiche.
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
4 / 65
Tabella a doppia entrata
Analisi delle
Corrispondenze
semplici
Si considerino due caratteri qualitativi A e B aventi
rispettivamente k e q modalità osservate su n unità statistiche.
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
4 / 65
Tabella a doppia entrata
Analisi delle
Corrispondenze
semplici
Si considerino due caratteri qualitativi A e B aventi
rispettivamente k e q modalità osservate su n unità statistiche.
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
4 / 65
Tabella a doppia entrata
Analisi delle
Corrispondenze
semplici
Si considerino due caratteri qualitativi A e B aventi
rispettivamente k e q modalità osservate su n unità statistiche.
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
4 / 65
Tabella a doppia entrata
Analisi delle
Corrispondenze
semplici
Si considerino due caratteri qualitativi A e B aventi
rispettivamente k e q modalità osservate su n unità statistiche.
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
4 / 65
Tabella a doppia entrata
Analisi delle
Corrispondenze
semplici
Si considerino due caratteri qualitativi A e B aventi
rispettivamente k e q modalità osservate su n unità statistiche.
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
4 / 65
Tabella a doppia entrata
Analisi delle
Corrispondenze
semplici
Si considerino due caratteri qualitativi A e B aventi
rispettivamente k e q modalità osservate su n unità statistiche.
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
4 / 65
Tabella a doppia entrata
Analisi delle
Corrispondenze
semplici
Si considerino due caratteri qualitativi A e B aventi
rispettivamente k e q modalità osservate su n unità statistiche.
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
4 / 65
Tabella a doppia entrata
Analisi delle
Corrispondenze
semplici
Si considerino due caratteri qualitativi A e B aventi
rispettivamente k e q modalità osservate su n unità statistiche.
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
4 / 65
Esempio di tabella a doppia entrata
Analisi delle
Corrispondenze
semplici
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Si consideri di aver registrato la meta del viaggio e il mezzo di
trasporto di un collettivo di 592 persone. I risultati sono raccolti nella
seguente tabella
mezzo/destinazione
macchina
aereo
treno
nave
T ot
Italia
68
20
15
5
108
Spagna
119
84
54
29
286
P ortogallo
26
17
14
14
71
F rancia
7
94
10
16
127
T ot
220
215
93
64
592
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
5 / 65
Distribuzioni relative condizionate
Analisi delle
Corrispondenze
semplici
Frequenze condizionate della variabile destinazione rispetto alle modalità della
variabile mezzo
A. Iodice
macchina
aereo
treno
nave
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Italia
0.309
0.093
0.161
0.078
mezzo/destinazione
P ortogallo
0.118
0.079
0.151
0.219
F rancia
0.032
0.437
0.108
0.250
T ot
1
1
1
1
Frequenze condizionate della variabile mezzo rispetto alle modalità della variabile
destinazione
Indici di
connessione
mezzo/destinazione
Trasformazioni
sulla tabella a
doppia entrata
macchina
aereo
treno
nave
T ot
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
Spagna
0.541
0.391
0.581
0.453
A. Iodice
Italia
0.630
0.185
0.139
0.046
1
Spagna
0.416
0.294
0.189
0.101
1
Analisi delle Corrispondenze semplici
P ortogallo
0.366
0.239
0.197
0.197
1
F rancia
0.055
0.740
0.079
0.126
1
Statistica
6 / 65
Indipendenza
Analisi delle
Corrispondenze
semplici
A. Iodice
Definizione a
matrice dei
dati
Indipendenza e distribuzioni condizionate
Le componenti di una variabile doppia (X, Y ) sono indipendenti se le distribuzioni
di frequenze relative condizionate Y |X e X|Y sono costanti.
Formalmente dovrà risultare per Y |X
Misura di
connessione
ni1
ni2
ni3
nih
ni.
=
=
= ... =
∀i = 1 : k
=
n.1
n.2
n.3
n.h
n..
Indipendenza
Indici di
connessione
e per X|Y
nkj
n1j
n2j
n3j
n.j
=
=
= ... =
=
∀j = 1 : h
n1.
n2.
n3.
nk.
n..
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
7 / 65
Indipendenza
Analisi delle
Corrispondenze
semplici
A. Iodice
Definizione a
matrice dei
dati
Si supponga che nel precedente esempio sia stata osservata la
seguente distribuzione doppia.
mezzo/destinazione
Misura di
connessione
macchina
aereo
treno
nave
T ot
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Italia
40
39
17
12
108
Spagna
106
104
45
31
286
P ortogallo
26
26
11
8
71
F rancia
47
46
20
14
127
T ot
220
215
93
64
592
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
8 / 65
Indipendenza
Analisi delle
Corrispondenze
semplici
In questo caso le frequenze condizionate della variabile destinazione rispetto alle
modalità della variabile mezzo
mezzo/destinazione
A. Iodice
macchina
aereo
treno
nave
T ot
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Spagna
0.483
0.483
0.483
0.483
0.483
P ortogallo
0.120
0.120
0.120
0.120
0.120
F rancia
0.215
0.215
0.215
0.215
0.215
T ot
1
1
1
1
1
Mentre le frequenze condizionate della variabile mezzo rispetto alle modalità
della variabile destinazione
mezzo/destinazione
Trasformazioni
sulla tabella a
doppia entrata
macchina
aereo
treno
nave
T ot
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
Italia
0.182
0.182
0.182
0.182
0.182
Italia
0.372
0.363
0.157
0.108
1
Spagna
0.372
0.363
0.157
0.108
1
P ortogallo
0.372
0.363
0.157
0.108
1
F rancia
0.372
0.363
0.157
0.108
1
T ot.
0.372
0.363
0.157
0.108
1
In questo caso le due variabili sono indipendenti
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
9 / 65
Indipendenza
Analisi delle
Corrispondenze
semplici
A. Iodice
Definizione a
matrice dei
dati
Se le componenti di una variabile doppia (X, Y ) sono indipendenti (le
distribuzioni di frequenze relative condizionate Y |X e X|Y sono costanti), allora
vale la seguente relazione
ni. n.j
n̂ij
n.j
→ n̂ij =
=
ni.
n..
n..
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
con i = 1, . . . , k; j = 1, . . . , h
Pertanto, data una distribuzione doppia di frequenze, il legame tra le due
componenti (mutabile) varierà tra una situazione di indipendenza (assenza di
legame) e un qualche grado di connessione
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
10 / 65
Indice quadratico di connessione (X 2 )
Analisi delle
Corrispondenze
semplici
A. Iodice
Definizione a
matrice dei
dati
Gli indici per la misura della connessioni sono basati sulle differenze
tra le frequenze osservate sul collettivo nij e le frequenze teoriche
n̂ij , che si osserverebbero sul collettivo se le mutabili considerate
fossero indipendenti.
Indice quadratico di connessione (X 2 ) è dato dalla seguente relazione
Misura di
connessione
X2 =
Indipendenza
k X
h
X
(nij − n̂ij )2
n̂ij
i=1 j=1
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
in caso di indipendenza, essendo nij = n̂ij , risulta X 2 = 0
il massimo valore dell’indice è dato dalla seguente espressione:
n × min(k − 1, h − 1), con h numero di righe e k numero di
colonne.
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
11 / 65
Indice quadratico di connessione (X 2 )
Analisi delle
Corrispondenze
semplici
Per calcolare l’indice quadratico di connessione che caratterizza le variabili mezzo e destinazione, con
distribuzione congiunta di frequenze
A. Iodice
Definizione a
matrice dei
dati
nij :
Misura di
connessione
Indipendenza
Italia
68
20
15
5
Spagna
119
84
54
29
P ortogallo
26
17
14
14
F rancia
7
94
10
16
T ot.
220
215
93
64
T ot
108
286
71
127
592
si deve calcolare la distribuzione di frequenze che si osserverebbero in caso di indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
mezzo/destinazione
macchina
aereo
treno
nave
n̂ij :
Interpretazioni
geometriche
mezzo/destinazione
macchina
aereo
treno
nave
Italia
40.135
39.223
16.966
11.676
Spagna
106.284
103.868
44.929
30.919
P ortogallo
26.385
25.785
11.154
7.676
F rancia
47.196
46.123
19.951
13.730
T ot.
220
215
93
64
T ot
108
286
71
127
592
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
12 / 65
Indice quadratico di connessione (X 2 )
Analisi delle
Corrispondenze
semplici
A. Iodice
2
nij −n̂ij
n̂ij
Definizione a
matrice dei
dati
Misura di
connessione
:
mezzo/destinazione
macchina
aereo
treno
nave
Italia
19.346
9.421
0.228
3.817
Spagna
1.521
3.800
1.831
0.119
P ortogallo
0.006
2.993
0.726
5.211
F rancia
34.234
49.697
4.963
0.375
L’indice X 2 è dato dunque dalla somma degli elementi in tabella
Indipendenza
Indici di
connessione
X
2
=
k X
h
X
(nij − n̂ij )2
i=1 j=1
Trasformazioni
sulla tabella a
doppia entrata
n̂ij
= 19.346 + 1.521 + 0.006 + 34.234 + 9.421 + 3.800 + 2.993+
+ 49.697 + 0.228 + 1.831 + 0.726 + 4.963 + 3.817 + 0.119 + 5.211 + 0.375 = 138.29
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
13 / 65
Indice ν di Cramer
Analisi delle
Corrispondenze
semplici
A. Iodice
Definizione a
matrice dei
dati
avendo definito n × min(k − 1, h − 1) come valore massimo che X 2 può
assumere, è possibile ottenere una versione normalizzata dell’indice di
connessione. Viene definito indice ν di Cramer.
s
ν=
Misura di
connessione
X2
=
n × min(k − 1, h − 1)
s
Φ2
min(k − 1, h − 1)
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
dove k e h rappresentano il numero di modalità delle componenti della mutabile
2
doppia, mentre Φ2 = Xn , e si può ottenere effettuando il calcolo di X 2 sulle
frequenze relative invece che sulle frequenze assolute. A differenza di X 2 , l’indice
Φ2 non dipende dalla numerosità n.
L’indice è normalizzato, quindi 0 ≤ ν ≤ 1.
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
14 / 65
Indice ν di Cramer
Analisi delle
Corrispondenze
semplici
A. Iodice
Definizione a
matrice dei
dati
Con riferimento ai dati dell’esercizio, si ha che X 2 = 138.29, n = 592, h = 4 e k = 4
s
Misura di
connessione
ν =
X2
n × min(k − 1, h − 1)
s
=
138.29
592 × min(3, 3)
= 0.28
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
15 / 65
Analisi delle Corrispondenze per visualizzare tabelle
di frequenza
Analisi delle
Corrispondenze
semplici
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Un istogramma presenta un insieme di dati in una forma
diversa. Allo stesso modo l’Analisi delle Corrispondenze
trasforma una matrice in una rappresentazione grafica
(. . .). (Greenacre, 1985)
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
16 / 65
Un semplice esempio
Analisi delle
Corrispondenze
semplici
A. Iodice
Si considerino due variabili qualitative
motivo del viaggio
Definizione a
matrice dei
dati
meta del viaggio
Misura di
connessione
Indipendenza
Indici di
connessione
Norway
Canada
Greece
Germany
vacanza
6
1
4
2
vacanza/lavoro
1
3
25
2
lavoro
11
11
0
20
Sum
18
15
29
24
Sum
13
31
42
86
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
17 / 65
Un semplice esempio
Analisi delle
Corrispondenze
semplici
A. Iodice
Definizione a
matrice dei
dati
Distribuzioni condizionate della variabile motivi del viaggio rispetto alle modalità della variabile “meta del
viaggio”: rappresentano il tipo di viaggio in ciascun paese indipendentemente dal totale dei viaggi fatti in
quel paese.
Misura di
connessione
Indipendenza
Indici di
connessione
Norway
Canada
Greece
Germany
vacanza
0.330
0.070
0.140
0.080
vacanza/lavoro
0.060
0.200
0.860
0.080
lavoro
0.610
0.730
0.000
0.830
Sum
1
1
1
1
Sum
0.150
0.360
0.490
1
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
18 / 65
Triangular map
Analisi delle
Corrispondenze
semplici
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
19 / 65
Tabella di frequenze assolute: un esempio
Analisi delle
Corrispondenze
semplici
A. Iodice
Si consideri la tabella di frequenze N che rappresenta le preferenze di 7 tipologie
di consumatori rispetto a 4 differenti prodotti.
Definizione a
matrice dei
dati
tipo A
tipo B
tipo C
tipo D
tipo E
tipo F
tipo G
Sum
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
item.1
69
148
170
159
122
106
40
814
item.2
37
45
65
57
26
21
7
258
item.3
7
14
12
12
6
5
1
57
item.4
5
22
29
28
18
23
14
139
Sum
118
229
276
256
172
155
62
1268
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
20 / 65
Tabella di frequenze relative
Analisi delle
Corrispondenze
semplici
A. Iodice
Per passare dalla tabella di frequenze assolute alla tabella F delle frequenze
relative dividendo gli elementi di N per il totale di tabella n.
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
F=
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
tipo A
tipo B
tipo C
tipo D
tipo E
tipo F
tipo G
Sum
item.1
0.054
0.117
0.134
0.125
0.096
0.084
0.032
0.642
item.2
0.029
0.035
0.051
0.045
0.021
0.017
0.006
0.203
item.3
0.006
0.011
0.009
0.009
0.005
0.004
0.001
0.045
item.4
0.004
0.017
0.023
0.022
0.014
0.018
0.011
0.110
Sum
0.093
0.181
0.218
0.202
0.136
0.122
0.049
1
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
21 / 65
Le tabelle dei profili
Analisi delle
Corrispondenze
semplici
A. Iodice
Dalla tabella di frequenze relative è possibile passare alla tabella dei profili riga e dei profili colonna. In
particolare
Definizione a
matrice dei
dati
profili riga: si ottiengono dividendo ciascun elemento di F per il rispettivo marginale (totale) di riga,
fij
Misura di
connessione
fi.
, i = 1, . . . , k, j = 1, . . . , q
Indipendenza
profili colonna: si ottiengono dividendo ciascun elemento di F per il rispettivo marginale (totale) di
colonna,
fij
, i = 1, . . . , k, j = 1, . . . , q
f.j
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
22 / 65
Tabella dei profili riga
Analisi delle
Corrispondenze
semplici
A. Iodice
La tabella dei profili riga consente, ad esempio, di confrontare le scelte delle
diverse tipologie di consumatori relativamente ai prodotti considerati,
indipendentemente dal numero di prodotti acquistati da ciascuna tipologia di
consumatore.
Il profilo riga medio corrisponde al vettore dei marginali di colonna della
tabella F. Corrisponde alla media dei profili riga ponderati per le rispettive
masse
Definizione a
matrice dei
dati
Le masse dei profili riga sono date dalla colonna dei marginali di riga di F.
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
D−1
r F=
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
tipo A
tipo B
tipo C
tipo D
tipo E
tipo F
tipo G
profilo riga medio
A. Iodice
item.1
0.585
0.646
0.616
0.621
0.709
0.684
0.645
0.642
item.2
0.314
0.197
0.236
0.223
0.151
0.135
0.113
0.203
Analisi delle Corrispondenze semplici
item.3
0.059
0.061
0.043
0.047
0.035
0.032
0.016
0.045
item.4
0.042
0.096
0.105
0.109
0.105
0.148
0.226
0.110
Sum
1
1
1
1
1
1
1
1
Statistica
23 / 65
Tabella dei profili colonna
Analisi delle
Corrispondenze
semplici
La tabella dei profili colonna consente di confrontare le distribuzioni delle vendite
di prodotti tra le diverse tipologie di consumatori , indipendentemente dal numero
delle vendite di complessive di ciascun prodotto.
Il profilo colonna medio corrisponde al vettore dei marginali di diga della
tabella F. Corrisponde alla media dei profili colonna ponderati per le
rispettive masse
A. Iodice
Definizione a
matrice dei
dati
Le masse dei profili colonna sono date dalla riga dei marginali di colonna di
F.
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
FD−1
c =
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
tipo A
tipo B
tipo C
tipo D
tipo E
tipo F
tipo G
sum
A. Iodice
item.1
0.085
0.182
0.209
0.195
0.150
0.130
0.049
1
item.2
0.143
0.174
0.252
0.221
0.101
0.081
0.027
1
item.3
0.123
0.246
0.211
0.211
0.105
0.088
0.018
1
Analisi delle Corrispondenze semplici
item.4
0.036
0.158
0.209
0.201
0.129
0.165
0.101
1
Sum
0.093
0.181
0.218
0.202
0.136
0.122
0.049
1
Statistica
24 / 65
Interpretazione geometrica dei profili
Analisi delle
Corrispondenze
semplici
A. Iodice
Da un punto di vista geometrico un profilo corrisponde ad un vettore in uno spazio multidimensionale.
Tuttavia, i profili sono espressi in termini relativi, ed è quindi necessario ponderare i singoli profili attraverso
le masse per non perdere l’informazione di partenza.
Notazione matriciale
Siano Dr e Dc matrici diagonali i cui elementi sono rispettivamente i marginali di riga e di colonna della
matrice F.
Definizione a
matrice dei
dati
profili riga:
−1
Dr F
Misura di
connessione
profili colonna:
−1
FDc
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
25 / 65
Distanza tra punti profilo
Analisi delle
Corrispondenze
semplici
A. Iodice
In ACP la distanza che caratterizza i punti nello spazio di riferimento è la metrica euclidea. Tuttavia questa
distanza tende a dare eccessiva importanza alle modalità della variabile che presentano le frequenze più
elevate, trascurando le relazioni tra le modalità caratterizzate da frequenze basse.
distanza euclidea tra profili
Si considerino i profili A e B
Definizione a
matrice dei
dati
Misura di
connessione
D−1
r F=
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
item.1
0.585
0.646
0.616
0.621
0.709
0.684
0.645
0.642
item.2
0.314
0.197
0.236
0.223
0.151
0.135
0.113
0.203
item.3
0.059
0.061
0.043
0.047
0.035
0.032
0.016
0.045
item.4
0.042
0.096
0.105
0.109
0.105
0.148
0.226
0.110
Sum
1
1
1
1
1
1
1
1
distanza euclidea:
v
u q uX f
f2j 2
1j
u
d(A, B) = t
−
1.
2.
j=1
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
tipo A
tipo B
tipo C
tipo D
tipo E
tipo F
tipo G
profilo riga medio
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
26 / 65
Distanza tra punti profilo
Analisi delle
Corrispondenze
semplici
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
distanza euclidea tra i profili riga A e B
v
u q uX f
f2j 2
1j
u
d(A, B) =t
−
=
1.
2.
j=1
q
(.585 − .646)2 + (.314 − .197)2 + (.059 − .061)2 + (.042 − .096)2 = .143
Indipendenza
È necessario pertanto un sistema di pesi nel calcolo della distanza per rendere omogeneo il contributo di
ciasuna modalità alla determinazione della distanza tra i profili. Si rende necessario adottare la distanza del
chi-quadrato.
Indici di
connessione
distanza del chi-quadrati tra i profili riga A e B
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
v
u q
uX
u
d(A, B) =t
j=1
s
Formalizzazione
del problema
Esempio di
applicazione
con R
1
f.j
1.
(.585 − .646)2
.642
A. Iodice
f1j
−
+
f2j
2.
2
=
(.314 − .197)2
.203
+
(.059 − .061)2
Analisi delle Corrispondenze semplici
.045
+
(.042 − .096)2
0.110
Statistica
= .316
27 / 65
Matrice da analizzare, scelta della distanza, scelta
dei pesi
Analisi delle
Corrispondenze
semplici
A. Iodice
Definizione a
matrice dei
dati
Una tecnica di analisi multidimensionale, è identificata da tre elementi: matrice di dati,la metrica e pesi
delle unità.
Analisi delle Corrispondenze
Analisi in componenti principali
Misura di
connessione
matrice di dati: tabella individui per
variabili X centrata e standardizzata
Indipendenza
metrica: distanza euclidea tra i punti
nello spazio di rappresentazione
Indici di
connessione
pesi delle unità:tutte le unità hanno peso
1
uguale a n
Trasformazioni
sulla tabella a
doppia entrata
matrice di dati: tabelle dei profili riga
−1
D−1
r F (colonna FDc )
metrica: distanza del chi-quadrato D−1
c
tra i punti profilo riga (D−1
tra i punti
r
profilo colonna)
pesi delle unità: ciascun punto ha un
peso pari alla propria massa: Dr per i
punti riga, Dc per i punti colonna.
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
28 / 65
Formalizzazione del problema: soluzione in Rc
Analisi delle
Corrispondenze
semplici
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Il problema
In CA l’obbiettivo è ricercare un sistema di assi unitari che consenteano di massimizzare le distanze tra le
proiezioni dei profili riga. Gli assi u sono unitari secondo la metrica del chi-quadrato, ovvero uD−1
c u = 1.
Per ciascun asse, le coordinate delle proiezioni dei profili sono date da
−1
−1
ĉ = Dr FDc
u
La funzione obbiettivo consiste nella ricerca degli assi che massimizzino la somma dei quadrati delle
proiezioni. ovvero
Indipendenza
funzione obbiettivo:
Indici di
connessione
T
Trasformazioni
sulla tabella a
doppia entrata
max! ĉ
u
Interpretazioni
geometriche
T
−1
−1
Dr ĉ = (Dr FDc
T
−1
−1
u) Dr (Dr FDc
−1 T −1
−1
−1
Dc F Dr Dr Dr FDc u
T
=u
u) =
−1 T −1
−1
Dc F Dr FDc u
vincolo: uT D−1
c u = 1
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
29 / 65
Formalizzazione del problema: soluzione in Rc
Analisi delle
Corrispondenze
semplici
La soluzione
A. Iodice
Ricorrendo al metodo dei moltiplicatori di Lagrange, si perviene alla seguente formalizzazione
Definizione a
matrice dei
dati
−1
∂u L : Dc
Indipendenza
F
T
−1
T
−1
F Dr FDc
−1
∂u L = 2Dc
Misura di
connessione
Indici di
connessione
−1
T
max!L = u Dc
T
−1
−1
F Dr FDc
T
−1
−1
F Dr FDc
−1
−1
Dr FDc u
−1
T
u − λ(u Dc
−1
u − 2λDc
−1
u = λDc
u − 1)
u=0
u
= λu
La soluzione si ottiene estraendo autovalori e autovettori dalla seguente matrice
Trasformazioni
sulla tabella a
doppia entrata
T
−1
−1
S = F Dr FDc
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
30 / 65
Assi principali, fattori e coordinate
Analisi delle
Corrispondenze
semplici
proiezione sugli assi
A. Iodice
il versore dell’asse principale è
u
Definizione a
matrice dei
dati
La proiezione di un vettore sull’asse di versore u secondo la distanza del chi-quadro si ottiene
moltiplicando il vettore per il fattore principale
Misura di
connessione
−1
Dc
Indipendenza
u
Indici di
connessione
le coordinate principali dei profili riga sono date dal prodotto dalla matrice dei profili e il fattore
principale
−1
−1
×
Dc u
ĉ =
Dr F
| {z }
| {z }
Trasformazioni
sulla tabella a
doppia entrata
matrice profili riga
fattore principale
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
31 / 65
Interpretazione dell’inerzia
Analisi delle
Corrispondenze
semplici
A. Iodice
Definizione a
matrice dei
dati
Interpretazione dell’Inerzia
L’inerzia della nube dei profili riga è data dalla somma ponderata delle distanze al quadrato di ciascun profilo
dal baricentro (profilo riga medio). I pesi della somma pi = fi. sono le masse dei profili.
Inerzia =
Misura di
connessione
h
X
fi. ×
i=1 |{z}
pesi
k
X
1
j=1
f.j
|
fij
fi.
{z
2
− f.j
}
distanza del chi-quadro tra profili e centroide
Indipendenza
Indici di
connessione
=
h X
k
X
(fij − fi. f.j )2
i=1 j=1
fi. f.j
2
=
φ
|{z}
indice di connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
questa relazione mostra che la rappresentazione grafica dei profili riga rappresenta una decomposizione
2
dell’indice quadratico di connessione χ2 (ricordando che φ2 = χn )
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
32 / 65
Scelta delle dimensioni
Analisi delle
Corrispondenze
semplici
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
33 / 65
Formalizzazione del problema: soluzione in Rr
Analisi delle
Corrispondenze
semplici
A. Iodice
Definizione a
matrice dei
dati
Il problema
Analogamente a quanto accade nello spazio Rc , l’analisi nello spazio Rr dei profili colonna si ha che
T
−1 T −1
T
ĉ = FD−1
D−1
c
r v = Dc F Dr v. Dunque si vuole massimizzare ĉ Dc ĉ che rappresenta la
somma ponderata dei quadrati delle proiezioni dei profili colonna nel sottospazio di approssimazione.
Misura di
connessione
funzione obbiettivo:
Indipendenza
T
max! ĉ Dc ĉ =
Indici di
connessione
T
−1 T −1
−1 T −1
Dc F Dr v
Dc Dc F Dr v
T
−1
−1
= v Dr FDc
Trasformazioni
sulla tabella a
doppia entrata
−1
Dc Dc
T
−1
T
−1
−1
F Dr v = v Dr FDc
T
−1
F Dr v
vincolo: vT D−1
r v = 1
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
34 / 65
Formalizzazione del problema: soluzione in Rr
Analisi delle
Corrispondenze
semplici
A. Iodice
La soluzione
Definizione a
matrice dei
dati
Misura di
connessione
Ricorrendo al metodo dei moltiplicatori di Lagrange, si perviene alla seguente formalizzazione
−1
FDc
T
−1
F Dr v = λv
La soluzione si ottiene diagonalizzando la seguente matrice
Indipendenza
S
Indici di
connessione
∗
=
−1
FDc
| {z }
T
−1
F Dr
| {z }
profili colonna profili rigaT
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
35 / 65
Assi principali, fattori e coordinate
Analisi delle
Corrispondenze
semplici
A. Iodice
proiezione sugli assi
Definizione a
matrice dei
dati
asse principale
v
Misura di
connessione
fattore principale
−1
Dr v
Indipendenza
Indici di
connessione
coordinata principale
−1
Dc
Trasformazioni
sulla tabella a
doppia entrata
T
−1
F Dr v
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
36 / 65
Formalizzazione alternativa CA
Analisi delle
Corrispondenze
semplici
A. Iodice
Per ottenere una soluzione della CA è possibile analizzare la tabella dei residui standardizzati.
tabella delle contingenze
Definizione a
matrice dei
dati
La tabella delle frequenze relative (F)
Misura di
connessione
A
B
C
D
E
F
G
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
P1
0.05
0.12
0.13
0.13
0.10
0.08
0.03
P2
0.03
0.04
0.05
0.04
0.02
0.02
0.01
P3
0.01
0.01
0.01
0.01
0.00
0.00
0.00
P4
0.00
0.02
0.02
0.02
0.01
0.02
0.01
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
37 / 65
Formalizzazione alternativa CA
Analisi delle
Corrispondenze
semplici
A. Iodice
Definizione a
matrice dei
dati
vettori dei marginali (totali) di riga
A
B
C
D
E
F
G
Misura di
connessione
Indipendenza
Indici di
connessione
r
0.09
0.18
0.22
0.20
0.14
0.12
0.05
vettore dei marginali (totali) di colonna
P1
P2
P3
P4
c
0.64
0.20
0.04
0.11
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
38 / 65
Formalizzazione alternativa CA
Analisi delle
Corrispondenze
semplici
Per ottenere una soluzione della CA è possibile analizzare la tabella dei residui standardizzati.
A. Iodice
centratura
Definizione a
matrice dei
dati
la centratura della matrice F si ottiene sottraendo a ciascun valore il prodotto dei marginali di riga e di
colonna ad esso corrispondenti, formalmente fij − fi. f.j . Da un punto di vista algebrico questo
corrisponde a
Misura di
connessione
Indipendenza
F − rcT =
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
A
B
C
D
E
F
G
P1
-0.0053
0.0008
-0.0057
-0.0042
0.0091
0.0051
0.0002
P2
0.0102
-0.0013
0.0070
0.0039
-0.0071
-0.0083
-0.0044
P3
0.0013
0.0029
-0.0003
0.0004
-0.0014
-0.0016
-0.0014
P4
-0.0063
-0.0024
-0.0010
-0.0000
-0.0007
0.0047
0.0057
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
39 / 65
Formalizzazione alternativa CA
Analisi delle
Corrispondenze
semplici
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Per ottenere una soluzione della CA è possibile analizzare la tabella dei residui standardizzati.
standardizzazione
dopo aver effettuato la centratura della matrice F si procede alla standardizzazione, formalmente
fij −fi. f.j
q
. Da un punto di vista
fi. f.j
−1/2
−1/2
(F − rcT )Dc
=
S = Dr
algebrico questo corrisponde a
Indipendenza
Indici di
connessione
−1/2
S = Dr
Trasformazioni
sulla tabella a
doppia entrata
−1/2
(F − rcT )Dc
=
A
B
C
D
E
F
G
P1
-0.0218
0.0023
-0.0151
-0.0117
0.0310
0.0183
0.0009
P2
0.0745
-0.0066
0.0331
0.0191
-0.0427
-0.0527
-0.0444
P3
0.0207
0.0324
-0.0032
0.0041
-0.0175
-0.0209
-0.0301
P4
-0.0620
-0.0174
-0.0064
-0.0003
-0.0055
0.0409
0.0776
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
40 / 65
Formalizzazione alternativa CA
Analisi delle
Corrispondenze
semplici
A. Iodice
Definizione a
matrice dei
dati
Ottenuta la tabella S dei residui standardizzati, per ottenere la soluzione si effettua la decomposizione in
valori singolari, (SVD)
decomposizione in valori singolari
Misura di
connessione
Indipendenza
Indici di
connessione
SV D(S) = UDα V
T
dove U e l’autovettore di sinistra e rappresenta lo spazio delle righe, V e l’autovettore di destra e
rappresenta lo spazio delle colonne, Dα è la matrice diagonale dei valori singolari, che sono la radice
quadrata degli autovalori.
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
41 / 65
Relazione tra EVD ed SVD
Analisi delle
Corrispondenze
semplici
A. Iodice
La decomposizione in valori singolari (SVD) è uno dei risultati dell’algebra lineare
più utilizzati in assoluto. La SVD consente di riscrivere una generica matrice X
come prodotto tra matrici UDα VT . Le matrici in questione sono in stretta
relazione con autovalori e autovettori. In particolare, se X = UDα UT
Definizione a
matrice dei
dati
XT X = EV D(XT X) = EV D(VDα UT UDα VT ) = VD2α VT
Misura di
connessione
Indipendenza
XXT = EV D(XXT ) = EV D(UDα VT VDα UT ) = UD2α UT
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
i vettori singolari di destra (V) della matrice X corrispondono agli
autovettori della matrice XT X
Interpretazioni
geometriche
i vettori singolari di sinistra (U) della matrice X corrispondono agli
autovettori della matrice XXT
Formalizzazione
del problema
i valori singolari della matrice X corrispondono alla radice quadrata degli
autovalori non nulli delle matrici XT X e XXT
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
42 / 65
Formalizzazione alternativa CA
Analisi delle
Corrispondenze
semplici
Ottenuta la tabella S dei residui standardizzati, per ottenere la soluzione si effettua la decomposizione in
valori singolari, (SVD)
valori singolari
A. Iodice
Definizione a
matrice dei
dati
Dα =
1
2
3
4
1
0.1611
0.0000
0.0000
0.0000
2
0.0000
0.0617
0.0000
0.0000
3
0.0000
0.0000
0.0324
0.0000
4
0.0000
0.0000
0.0000
0.0000
Misura di
connessione
Indipendenza
vettori singolari
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
1
2
3
4
5
6
7
A. Iodice
1
-0.6267
-0.0937
-0.1815
-0.1059
0.2331
0.4470
0.5478
U
2
0.0888
-0.3761
0.3513
0.2401
-0.6108
-0.0937
0.5364
vettori singolari
3
0.2293
-0.7776
0.2252
-0.0882
0.5227
0.0611
-0.0853
4
-0.1885
0.1390
0.7076
-0.2089
-0.1655
0.5070
-0.3411
1
2
3
4
Analisi delle Corrispondenze semplici
1
0.2067
-0.6946
-0.2839
0.6279
V
2
-0.5036
0.5269
-0.2269
0.6460
3
0.2485
0.1910
-0.9072
-0.2807
Statistica
4
-0.8012
-0.4511
-0.2120
-0.3311
43 / 65
Formalizzazione alternativa CA
Analisi delle
Corrispondenze
semplici
A. Iodice
Definizione a
matrice dei
dati
Calcolo delle coordinate dei profili riga e colonna
coordinate delle righe
Misura di
connessione
coordinate delle colonne
−1/2
standard coords = Dr
Indipendenza
−1/2
principal coords = Dr
U
UDα
−1/2
standard coords = Dc
−1/2
principal coords = Dc
V
VDα
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
44 / 65
Rappresentazione grafica
Analisi delle
Corrispondenze
semplici
Figura : Principal Coords righe, Standard Coords colonne
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
45 / 65
Rappresentazione grafica
Analisi delle
Corrispondenze
semplici
Figura : Standard Coords righe, Principal Coords colonne
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
46 / 65
Rappresentazione grafica
Analisi delle
Corrispondenze
semplici
Figura : Principal Coords righe, Principal Coords colonne
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
47 / 65
Contributi agli assi e qualità della rappresentazione
Analisi delle
Corrispondenze
semplici
A. Iodice
Coseni quadri
Contributi assoluti
profili riga
Definizione a
matrice dei
dati
profili riga
Caα = fi. ψ̂α
Misura di
connessione
Indipendenza
2
ψ̂iα
d2 (i, g)
profili colonna
profili colonna
Indici di
connessione
Criα =
Caα = f.j φ̂α
Trasformazioni
sulla tabella a
doppia entrata
Crαj =
2
ψ̂αj
d2 (j, h)
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
48 / 65
Esempio elaborazione con R: il pacchetto ‘ca’
Analisi delle
Corrispondenze
semplici
Uno strumento molto potente per l’Analisi delle Corrispondenze Semplici e Multiple è il pacchetto ca
sviluppato dal Dott. Oleg Nenadic e dal Prof.Michael Greenacre. Per installare il pacchetto in ambiente R
digitare la seguente sintassi:
install.packages(‘ca’,dep=T)
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
49 / 65
Esempio elaborazione con R: il pacchetto ‘ca’
Analisi delle
Corrispondenze
semplici
Dall’analisi della tabella a doppia entrata si ottiene il seguente output
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
50 / 65
Esempio elaborazione con R: il pacchetto ‘ca’
Analisi delle
Corrispondenze
semplici
Dall’analisi della tabella a doppia entrata si ottiene il seguente output
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
51 / 65
Esempio elaborazione con R: il pacchetto ‘ca’
Analisi delle
Corrispondenze
semplici
Dall’analisi della tabella a doppia entrata si ottiene il seguente output
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
52 / 65
Esempio elaborazione con R: il pacchetto ‘ca’
Analisi delle
Corrispondenze
semplici
Dall’analisi della tabella a doppia entrata si ottiene il seguente output
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
53 / 65
Esempio elaborazione con R: il pacchetto ‘ca’
Analisi delle
Corrispondenze
semplici
Dall’analisi della tabella a doppia entrata si ottiene il seguente output
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
54 / 65
Esempio elaborazione con R: il pacchetto ‘ca’
Analisi delle
Corrispondenze
semplici
Dall’analisi della tabella a doppia entrata si ottiene il seguente output
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
55 / 65
Esempio elaborazione con R: il pacchetto ‘ca’
Analisi delle
Corrispondenze
semplici
Dall’analisi della tabella a doppia entrata si ottiene il seguente output
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
56 / 65
Esempio elaborazione con R: il pacchetto ‘ca’
Analisi delle
Corrispondenze
semplici
Dall’analisi della tabella a doppia entrata si ottiene il seguente output
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
57 / 65
Esempio elaborazione con R: il pacchetto ‘ca’
Analisi delle
Corrispondenze
semplici
Dall’analisi della tabella a doppia entrata si ottiene il seguente output
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
58 / 65
Esempio elaborazione con R: il pacchetto ‘ca’
Analisi delle
Corrispondenze
semplici
Dall’analisi della tabella a doppia entrata si ottiene il seguente output
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
59 / 65
Esempio elaborazione con R: il pacchetto ‘ca’
Analisi delle
Corrispondenze
semplici
Dall’analisi della tabella a doppia entrata si ottiene il seguente output
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
60 / 65
Esempio elaborazione con R: rappresentazioni
grafiche 3D
Analisi delle
Corrispondenze
semplici
Sfruttando il pacchetto rgl si ottengono le rappresentazioni in 3 dimensioni, è possibile cambiare l’angolo di
visualizzazione interattivamente via mouse. La dimensione dei punti è proporzionale alla loro massa; la
trasparenza è inversamente proporzionale al loro contributo assoluto agli assi (minor massa =⇒ maggior
trasparenza)
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
61 / 65
Esempio elaborazione con R: rappresentazioni
grafiche 3D
Analisi delle
Corrispondenze
semplici
Sfruttando il pacchetto rgl si ottengono le rappresentazioni in 3 dimensioni, è possibile cambiare l’angolo di
visualizzazione interattivamente via mouse.
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
62 / 65
Esempio elaborazione con R: rappresentazioni
grafiche 3D
Analisi delle
Corrispondenze
semplici
Sfruttando il pacchetto rgl si ottengono le rappresentazioni in 3 dimensioni, è possibile cambiare l’angolo di
visualizzazione interattivamente via mouse.
Rappresentazione primo e secondo asse
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
63 / 65
Esempio elaborazione con R: rappresentazioni
grafiche 3D
Analisi delle
Corrispondenze
semplici
Sfruttando il pacchetto rgl si ottengono le rappresentazioni in 3 dimensioni, è possibile cambiare l’angolo di
visualizzazione interattivamente via mouse.
Rappresentazione primo e terzo asse
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
64 / 65
Esempio elaborazione con R: rappresentazioni
grafiche 3D
Analisi delle
Corrispondenze
semplici
Sfruttando il pacchetto rgl si ottengono le rappresentazioni in 3 dimensioni, è possibile cambiare l’angolo di
visualizzazione interattivamente via mouse.
Rappresentazione secondo e terzo asse
A. Iodice
Definizione a
matrice dei
dati
Misura di
connessione
Indipendenza
Indici di
connessione
Trasformazioni
sulla tabella a
doppia entrata
Interpretazioni
geometriche
Formalizzazione
del problema
Esempio di
applicazione
con R
A. Iodice
Analisi delle Corrispondenze semplici
Statistica
65 / 65
Fly UP