Comments
Description
Transcript
L`analisi dei gruppi (cluster analysis)
L’analisi dei gruppi (cluster analysis) Stefano Nobile Storia brevissima • Storia brevissima • La cluster analysis nasce nel 1939 per opera di Tyron, che per primo la presentò come una variante dell’analisi fattoriale. • Grazie al lavoro di due biologi – Sokal e Sneath – la cluster analysis riceve un forte impulso negli anni sessanta. • Nello stesso periodo, Ward (1963) elabora la sua tecnica di clustering a partire da un problema di classificazione di posizioni occupazionali. • Ancora negli anni sessanta, Johnson lavora alla cluster, concependola coma una procedura utile per rappresentare la struttura della matrice di similarità fra i casi. Concetti chiave Similarità e distanza Sotto il profilo tecnico, i concetti di similarità e di distanza sono centrali per l'analisi della composizione dei gruppi. Questi due concetti si trovano in relazione inversa: ad una maggiore similarità corrisponde una minore distanza. A rigore, il concetto di distanza può essere impiegato soltanto nel caso di variabili cardinali. Esso viene riferito alla distanza euclidea. d = (X1 – X2)2 + (Y1 – Y2)2 Generalizzando, per uno spazio N-dimensionale, essa diventa: v dij = S (Xik - Xjk)2 k=1 Questa distanza è nota anche come distanza di Manhattan. La distanza tra casi può essere calcolata anche attraverso altre misure, come la distanza di Mahalanobis e la distanza di Minkovski. Occorre distinguere le diverse misure di similarità/distanza in ragione del tipo di variabili impiegate nell’analisi. Per variabili ad intervalli, le distanze sono: •la distanza euclidea •la distanza euclidea al quadrato •la similarità calcolata col coseno •la similarità calcolata col coefficiente di correlazione di Pearson •la distanza di Chebycev •la distanza assoluta (city-Block o Manhattan) •la distanza di Minkowski •la distanza di Minkowski generalizzata (customized) Per variabili categoriali non ordinate, le distanze sono: •la distanza del chi-quadrato •la distanza del phi-quadrato Per variabili dicotomiche, le distanze sono: •la distanza euclidea •la distanza euclidea al quadrato •la distanza di dimensione (size) •la distanza di pattern •la varianza •la forma •la distanza di Lance e Williams Figura 1 - Calcolo della distanza tra due casi rispetto a variabili aventi metrica diversa – valori non standardizzati 3 Nu me ro di figl i 2 30 Età 40 50 60 Figura 2 - Calcolo della distanza tra due casi rispetto a variabili aventi metrica diversa – valori standardizzati ,8 ,6 ,4 Zscore: Numero di figli ,2 0,0 -,2 -,4 -,6 -,8 -,8 -,6 -,4 -,2 0,0 ,2 ,4 ,6 ,8 Zscore: Età Quando diverge la metrica delle variabili che si adottano per la cluster, è necessario standardizzare le variabili, in modo da non introdurre effetti distorsivi indotti dalla stessa differenza di metrica (Figura 1 e Figura 2). Il discorso cambia se si fa invece riferimento a variabili categoriali. In questo caso, non si parlerà più di distanza, ma di dissimilarità. Anche per la dissimilarità esistono vari indici per poter calcolare la somiglianza dei profili relativi a due individui. Partizioni e ricoprimenti • Una partizione è «una suddivisione dell’insieme originario in K sottoinsiemi a due a due disgiunti e tali da esaurire l’insieme originario (ogni oggetto appartiene ad uno ed un solo sottoinsieme)» (Ricolfi, 1992, p.31) • Un ricoprimento, invece, «è una suddivisione dell’insieme originario in K sottoinsiemi che esauriscono l’insieme originario ma possono anche essere più o meno sovrapposti fra loro» (Ricolfi, 1992, p.31) Le tecniche di clustering Le tecniche di Cluster Analysis sono riconducibili a tre grandi famiglie: Cluster analysis Tecniche di Classificazione gerarchica Tecniche basate sulle partizioni ripetute Tecniche di overlapping clustering Le tecniche di classificazione gerarchica La famiglia delle tecniche di classificazione gerarchica si suddivide, a sua volta, in due generi: • Quelle basate sugli algoritmi aggregativi • Quelle basate sugli algoritmi scissori Le tecniche basate sugli algoritmi aggregativi Queste tecniche procedono raggruppando i casi ad uno ad uno, fino ad arrivare ad n-1 aggregazioni. Le tecniche di aggregazione possono essere diverse e cioè: La tecnica del legame singolo (nearest neighbor) consiste nel raggruppare i casi che presentano la minore distanza e successivamente nell'utilizzare come referente della distanza il caso più vicino a quello del nuovo caso da aggregare La tecnica del legame completo (furthest neighbor) riunisce invece i casi che sono più vicini rispetto ai casi più lontani di ciascuno dei gruppi che si sono formati La tecnica del legame medio (waverage linkage) richiede che la distanza tra due gruppi si computi sulla base della media aritmetica delle distanze tra il caso da aggregare e i gruppi che sono già stati formati La tecnica del centroide (centroid clustering) fa riferimento al baricentro del gruppo. La distanza non è più calcolata in base alla media (o alla mediana) del caso da tutti i casi del gruppo, bensì in base al baricentro (centroide) del gruppo. La tecnica di Ward (Ward’s method) non fa altro che aggregare casi in modo tale da ottenere, ad ogni passaggio, il minimo incremento possibile della varianza all'interno di ciascun gruppo. La trasformazione dei valori Per la trasformazione dei valori sono disponibili le seguenti alternative: • Punteggi Z: è la normale procedura di standardizzazione, che genera punteggi standard z, ovvero: z = (x-Media)/Deviazione Standard; • Ampiezza massima di 1: la procedura divide il valore della variabile per il valore massimo, in modo tale che il valore massimo ottenibile sia i ovvero: y = x/Max; • Media di 1: la procedura standardizza i valori in modo che la loro media sia uguale a 1. I valori di una variabile sono divisi per la media della variabile, ovvero: y = x/Media; • Deviazione standard di 1: i valori di una variabile sono divisi per la deviazione standard, ovvero: y = x/Deviazione Standard; • Intervallo da —1 a 1: la procedura trasforma i valori in modo che l’intervallo di variazione sia compreso tra —i e i. I valori di una variabile sono divisi per l’intervallo di variazione della variabile, ovvero: y = x/(Max — Mm); • Intervallo da 0 a 1: sottrae dal valore di una variabile il valore minimo e divide il risultato per l’intervallo, ovvero: y = (x — Min)/(Max — Mm). Cosa accade in matrice X1 X2 a 1 1 b 1 2 c 6 3 d 8 2 e 8 0 a a b c d e b 0 c d e 1 29 50 50 0 26 49 53 0 5 13 0 4 0 ad esempio, infatti, la distanza tra a ed e è: (1 - 8)2 + (1 - 0)2 = 50 da cui deriva: X1 X2 (a, b) 1 1,5 c 6 3 d 8 2 e 8 0 e, da questa, la nuova matrice delle distanze: (a, b) (a, b) c d e c 0 d e 27,25 49,25 51,25 0 5 13 0 4 0 Le tecniche del legame singolo e del legame completo possono fare riferimento sia a misure di similarità che di distanza. Le tecniche di Ward e del legame medio possono invece fare riferimento alle sole misure di distanza. Il confronto tra le diverse tecniche, su un vecchio data-base elettorale, produce queste visibili differenze: (legame singolo) (legame completo) (legame medio) (Ward) Le tecniche basate sugli algoritmi scissori Queste tecniche, pur essendo più ricche «di proprietà matematiche, hanno un carattere meno empirico dei metodi aggregativi, basandosi su note proprietà statistiche della suddivisione della matrice delle devianze e codevianze» (Rizzi, 1985, p. 89). Tuttavia, esse – a causa della complessità dei calcoli richiesti – trovano scarso impiego all’interno della ricerca. Le tecniche basate sugli algoritmi scissori si distinguono in due classi: I metodi monotetici, che realizzano la suddivisione dei gruppi basandosi sui valori assunti da una sola variabile. I metodi politetici, che prendono in considerazione i valori assunti da tutte le variabili prescelte per la classificazione. Il metodo divisivo più noto è quello di Edwards - Cavalli Sforza. Il criterio seguito è quello di esaminare ad ogni stadio tutte le possibili suddivisioni in due parti di tutti i gruppi. Verrà operata la divisione che fa diminuire maggiormente la varianza entro i gruppi. L’applicazione di questo metodo divisivo porta a risultati come il seguente: (legame singolo) Le tecniche a partizioni ripetute Rispetto alle precedenti, le tecniche di clustering basate sulle partizioni ripetute presentano il vantaggio di poter lavorare su numeri assai elevati di casi. Questo vantaggio viene controbilanciato dalla necessità di dovere stabilire a priori il numero di gruppi da formare. Questo svantaggio può essere parzialmente superato attraverso lo spostamento – effettuato in ragione di differenti criteri – dei casi da un gruppo all'altro. I criteri per lo spostamento dei casi sono tre: •Le k-medie •Le nubi dinamiche •l'ottimizzazione di una funzione obiettivo Le k-medie Le k-medie fanno riferimento, per la classificazione, alle coordinate dei centroidi dei diversi gruppi. Le nubi dinamiche Le nubi dinamiche prendono invece come riferimento un nucleo iniziale, o "seme", attorno al quale vanno poi raccogliendosi i casi con una somiglianza maggiore. Le funzioni-obiettivo Le funzioni obiettivo cercano infine di realizzare gli spostamenti fra un gruppo e l'altro dei singoli casi senza uno specifico riferimento a considerazioni geometriche relative ad una funzione di distanza. Esse tengono piuttosto conto delle modifiche che si ottengono nei valori di tale funzione. A partire dalla funzione iniziale, vengono effettuati solo gli spostamenti di oggetti da un gruppo all'altro che migliorano (nel senso previsto) la funzione obiettivo. Il processo termina quando non si ottengono più miglioramenti significativi attraverso un intero ciclo di riclassificazione. Esempi Classificazione gerarchica: matrice delle distanze 1.1.1.1.1.1.1.1.1. 1.1.1.1.1.1.1.1.2. Squared Euclidean Distance 1.1.1.1.1.1.1.1.3. C 1.1.1.1.1.1.1.1.7. 1.1.1.1.1.1.1.1.8. 4 51.1.1.1.1.1.1.1.10. 71.1.1.1.1.1.1.1.12. 1.1.1.1.1.1.1.1.13. 91.1.1.1.1.1.1.1.14. 11.1.1.1.1.1.1.1.15. 11.1.1.1.1.1.1.1.16. 1 1 1.1.1.1.1.1.1.1.19. 1.1.1.1.1.1.1.1.20. 11.1.1.1.1.1.1.1.21. 11.1.1.1.1.1.1.1.22. 1 1.1.1.1.1.1.1.1.4. 1.1.1.1.1.1.1.1.5. 11.1.1.1.1.1.1.1.6. 2 3 1.1.1.1.1.1.1.1.9. 61.1.1.1.1.1.1.1.11. 8 1.1.1.1.1.1.1.1.17. 1.1.1.1.1.1.1.1.18. 1 1 ase :Dalmaz :Ermann :Gioacch :Immaco 0:Lambe 1:Mercu 2:Nestor 3:Osvald 6:Rosari 7:Santin 8:Temist 9:Umber :Aurora :Beatrice :Ciriaco :Fatima :Heather 4:Piera 5:Quinto io o ino lata rto zio e o o a ocle to 1.1.1.1.1.1.1.1.23. 1.1.1.1.1.1.1.1.24. 1 1.1.1.1.1.1.1.1.25. 1.1.1.1.1.1.1.1.26. 21.1.1.1.1.1.1.1.27. 81.1.1.1.1.1.1.1.28. 21.1.1.1.1.1.1.1.29. 51.1.1.1.1.1.1.1.30. 31.1.1.1.1.1.1.1.31. ,1.1.1.1.1.1.1.1.32. 51.1.1.1.1.1.1.1.33. 31.1.1.1.1.1.1.1.34. 51.1.1.1.1.1.1.1.35. 11.1.1.1.1.1.1.1.36. 31.1.1.1.1.1.1.1.37. 11.1.1.1.1.1.1.1.38. ,1.1.1.1.1.1.1.1.39. 61.1.1.1.1.1.1.1.40. 41.1.1.1.1.1.1.1.41. 31.1.1.1.1.1.1.1.42. 5 :Aurora ,656 ,331 ,388 ,362 ,773 989 ,452 ,847 ,004 0,249 ,708 ,098 403 ,171 ,463 ,207 ,091 ,973 1.1.1.1.1.1.1.1.43. 1.1.1.1.1.1.1.1.44. 2 1.1.1.1.1.1.1.1.45. 21.1.1.1.1.1.1.1.46. 1.1.1.1.1.1.1.1.47. 21.1.1.1.1.1.1.1.48. 71.1.1.1.1.1.1.1.49. 21.1.1.1.1.1.1.1.50. 11.1.1.1.1.1.1.1.51. 21.1.1.1.1.1.1.1.52. 81.1.1.1.1.1.1.1.53. 41.1.1.1.1.1.1.1.54. 31.1.1.1.1.1.1.1.55. 11.1.1.1.1.1.1.1.56. 11.1.1.1.1.1.1.1.57. ,1.1.1.1.1.1.1.1.58. 41.1.1.1.1.1.1.1.59. 81.1.1.1.1.1.1.1.60. 61.1.1.1.1.1.1.1.61. 31.1.1.1.1.1.1.1.62. 9 :Beatrice ,656 ,591 ,182 ,094 0,695 ,514 ,755 ,422 ,786 5,871 0,094 778 ,515 ,580 ,464 ,077 ,779 ,594 1.1.1.1.1.1.1.1.63. 1.1.1.1.1.1.1.1.64. 3 1.1.1.1.1.1.1.1.65. 81.1.1.1.1.1.1.1.66. 21.1.1.1.1.1.1.1.67. 1.1.1.1.1.1.1.1.68. 11.1.1.1.1.1.1.1.69. 51.1.1.1.1.1.1.1.70. 11.1.1.1.1.1.1.1.71. 81.1.1.1.1.1.1.1.72. 11.1.1.1.1.1.1.1.73. 61.1.1.1.1.1.1.1.74. 61.1.1.1.1.1.1.1.75. 11.1.1.1.1.1.1.1.76. 11.1.1.1.1.1.1.1.77. 51.1.1.1.1.1.1.1.78. 11.1.1.1.1.1.1.1.79. 81.1.1.1.1.1.1.1.80. 71.1.1.1.1.1.1.1.81. 71.1.1.1.1.1.1.1.82. 1 :Ciriaco ,331 ,591 0,669 ,554 6,823 ,631 0,941 ,808 ,550 6,048 4,496 ,627 0,277 ,877 ,918 ,628 4,844 0,055 1.1.1.1.1.1.1.1.83. 1.1.1.1.1.1.1.1.84. 4 1.1.1.1.1.1.1.1.85. 21.1.1.1.1.1.1.1.86. 71.1.1.1.1.1.1.1.87. 11.1.1.1.1.1.1.1.88. 1.1.1.1.1.1.1.1.89. 11.1.1.1.1.1.1.1.90. 11.1.1.1.1.1.1.1.91. 41.1.1.1.1.1.1.1.92. 11.1.1.1.1.1.1.1.93. 61.1.1.1.1.1.1.1.94. 61.1.1.1.1.1.1.1.95. 21.1.1.1.1.1.1.1.96. ,1.1.1.1.1.1.1.1.97. 51.1.1.1.1.1.1.1.98. 11.1.1.1.1.1.1.1.99. 11.1.1.1.1.1.1.1.100. 41.1.1.1.1.1.1.1.101. 51.1.1.1.1.1.1.1.102. 2 :Dalmazio ,388 ,182 0,669 0,088 ,256 ,156 ,976 ,555 ,503 ,896 352 ,235 ,112 ,985 ,653 ,735 ,903 ,593 1.1.1.1.1.1.1.1.103. 1.1.1.1.1.1.1.1.104. 5 1.1.1.1.1.1.1.1.105. 51.1.1.1.1.1.1.1.106. 21.1.1.1.1.1.1.1.107. 51.1.1.1.1.1.1.1.108. 11.1.1.1.1.1.1.1.109. 1.1.1.1.1.1.1.1.110. 11.1.1.1.1.1.1.1.111. 21.1.1.1.1.1.1.1.112. 81.1.1.1.1.1.1.1.113. 11.1.1.1.1.1.1.1.114. 11.1.1.1.1.1.1.1.115. 11.1.1.1.1.1.1.1.116. 11.1.1.1.1.1.1.1.117. 11.1.1.1.1.1.1.1.118. 61.1.1.1.1.1.1.1.119. 91.1.1.1.1.1.1.1.120. 11.1.1.1.1.1.1.1.121. 11.1.1.1.1.1.1.1.122. 7 :Ermanno ,362 ,094 ,554 0,088 1,350 ,439 ,072 2,177 ,193 7,950 2,275 ,784 ,732 ,195 4,547 ,049 ,789 ,221 1.1.1.1.1.1.1.1.123. 1.1.1.1.1.1.1.1.124. 6 1.1.1.1.1.1.1.1.125. 31.1.1.1.1.1.1.1.126. 11.1.1.1.1.1.1.1.127. 11.1.1.1.1.1.1.1.128. 11.1.1.1.1.1.1.1.129. 11.1.1.1.1.1.1.1.130. 1.1.1.1.1.1.1.1.131. 41.1.1.1.1.1.1.1.132. 21.1.1.1.1.1.1.1.133. 11.1.1.1.1.1.1.1.134. 61.1.1.1.1.1.1.1.135. 41.1.1.1.1.1.1.1.136. ,1.1.1.1.1.1.1.1.137. 61.1.1.1.1.1.1.1.138. 11.1.1.1.1.1.1.1.139. 31.1.1.1.1.1.1.1.140. 11.1.1.1.1.1.1.1.141. 51.1.1.1.1.1.1.1.142. 1 :Fatima ,773 0,695 6,823 ,256 1,350 ,320 ,075 2,092 ,959 ,152 480 ,880 ,724 ,500 0,092 ,740 ,199 ,049 1.1.1.1.1.1.1.1.143. 1.1.1.1.1.1.1.1.144. 7 1.1.1.1.1.1.1.1.145. ,1.1.1.1.1.1.1.1.146. 21.1.1.1.1.1.1.1.147. 81.1.1.1.1.1.1.1.148. 41.1.1.1.1.1.1.1.149. 21.1.1.1.1.1.1.1.150. 41.1.1.1.1.1.1.1.151. 1.1.1.1.1.1.1.1.152. 41.1.1.1.1.1.1.1.153. 71.1.1.1.1.1.1.1.154. 21.1.1.1.1.1.1.1.155. 11.1.1.1.1.1.1.1.156. 51.1.1.1.1.1.1.1.157. ,1.1.1.1.1.1.1.1.158. 11.1.1.1.1.1.1.1.159. 61.1.1.1.1.1.1.1.160. 91.1.1.1.1.1.1.1.161. ,1.1.1.1.1.1.1.1.162. 3 :Gioacchino 989 ,514 ,631 ,156 ,439 ,320 ,853 ,849 ,261 2,018 ,260 529 ,377 ,380 ,049 846 ,675 ,579 1.1.1.1.1.1.1.1.163. 1.1.1.1.1.1.1.1.164. 8 1.1.1.1.1.1.1.1.165. 51.1.1.1.1.1.1.1.166. 81.1.1.1.1.1.1.1.167. 11.1.1.1.1.1.1.1.168. 11.1.1.1.1.1.1.1.169. 81.1.1.1.1.1.1.1.170. 21.1.1.1.1.1.1.1.171. 41.1.1.1.1.1.1.1.172. 1.1.1.1.1.1.1.1.173. 11.1.1.1.1.1.1.1.174. 31.1.1.1.1.1.1.1.175. 21.1.1.1.1.1.1.1.176. 11.1.1.1.1.1.1.1.177. 61.1.1.1.1.1.1.1.178. 31.1.1.1.1.1.1.1.179. ,1.1.1.1.1.1.1.1.180. 11.1.1.1.1.1.1.1.181. 31.1.1.1.1.1.1.1.182. , :Heather ,452 ,755 0,941 ,976 ,072 ,075 ,853 3,181 ,442 ,390 ,886 ,575 ,582 464 0,995 ,961 885 ,112 1.1.1.1.1.1.1.1.183. 1.1.1.1.1.1.1.1.184. 9 1.1.1.1.1.1.1.1.185. 31.1.1.1.1.1.1.1.186. 41.1.1.1.1.1.1.1.187. 61.1.1.1.1.1.1.1.188. 61.1.1.1.1.1.1.1.189. 11.1.1.1.1.1.1.1.190. 11.1.1.1.1.1.1.1.191. 71.1.1.1.1.1.1.1.192. 11.1.1.1.1.1.1.1.193. 1.1.1.1.1.1.1.1.194. 11.1.1.1.1.1.1.1.195. 11.1.1.1.1.1.1.1.196. 91.1.1.1.1.1.1.1.197. 51.1.1.1.1.1.1.1.198. 51.1.1.1.1.1.1.1.199. 11.1.1.1.1.1.1.1.200. ,1.1.1.1.1.1.1.1.201. 11.1.1.1.1.1.1.1.202. 1 :Immacolata ,847 ,422 ,808 ,555 2,177 2,092 ,849 3,181 3,214 5,244 ,620 ,607 ,505 1,590 678 1,495 5,521 1,638 1.1.1.1.1.1.1.1.203. 1.1.1.1.1.1.1.1.204. 1 1.1.1.1.1.1.1.1.205. 51.1.1.1.1.1.1.1.206. 31.1.1.1.1.1.1.1.207. 61.1.1.1.1.1.1.1.208. 61.1.1.1.1.1.1.1.209. 11.1.1.1.1.1.1.1.210. 61.1.1.1.1.1.1.1.211. 21.1.1.1.1.1.1.1.212. 31.1.1.1.1.1.1.1.213. 11.1.1.1.1.1.1.1.214. 1.1.1.1.1.1.1.1.215. 11.1.1.1.1.1.1.1.216. 71.1.1.1.1.1.1.1.217. 21.1.1.1.1.1.1.1.218. 51.1.1.1.1.1.1.1.219. 41.1.1.1.1.1.1.1.220. 11.1.1.1.1.1.1.1.221. ,1.1.1.1.1.1.1.1.222. 3 0:Lamberto ,004 ,786 ,550 ,503 ,193 ,959 ,261 ,442 3,214 1,054 ,718 ,678 ,030 ,497 3,872 408 ,503 ,476 1.1.1.1.1.1.1.1.223. 1.1.1.1.1.1.1.1.224. 1 1.1.1.1.1.1.1.1.225. 11.1.1.1.1.1.1.1.226. 11.1.1.1.1.1.1.1.227. 11.1.1.1.1.1.1.1.228. 21.1.1.1.1.1.1.1.229. 11.1.1.1.1.1.1.1.230. 41.1.1.1.1.1.1.1.231. 11.1.1.1.1.1.1.1.232. 21.1.1.1.1.1.1.1.233. 11.1.1.1.1.1.1.1.234. 11.1.1.1.1.1.1.1.235. 1.1.1.1.1.1.1.1.236. 21.1.1.1.1.1.1.1.237. 11.1.1.1.1.1.1.1.238. 71.1.1.1.1.1.1.1.239. 11.1.1.1.1.1.1.1.240. 11.1.1.1.1.1.1.1.241. 11.1.1.1.1.1.1.1.242. 4 1:Mercuzio 0,249 5,871 6,048 ,896 7,950 ,152 2,018 ,390 5,244 1,054 ,420 3,923 ,318 ,571 0,859 1,941 ,972 ,317 1.1.1.1.1.1.1.1.243. 1.1.1.1.1.1.1.1.244. 1 1.1.1.1.1.1.1.1.245. 31.1.1.1.1.1.1.1.246. 11.1.1.1.1.1.1.1.247. 11.1.1.1.1.1.1.1.248. ,1.1.1.1.1.1.1.1.249. 11.1.1.1.1.1.1.1.250. ,1.1.1.1.1.1.1.1.251. 51.1.1.1.1.1.1.1.252. 11.1.1.1.1.1.1.1.253. 91.1.1.1.1.1.1.1.254. 71.1.1.1.1.1.1.1.255. 21.1.1.1.1.1.1.1.256. 1.1.1.1.1.1.1.1.257. 71.1.1.1.1.1.1.1.258. 11.1.1.1.1.1.1.1.259. 21.1.1.1.1.1.1.1.260. 71.1.1.1.1.1.1.1.261. 61.1.1.1.1.1.1.1.262. 2 2:Nestore ,708 0,094 4,496 352 2,275 480 ,260 ,886 ,620 ,718 ,420 ,193 ,763 ,383 ,168 ,840 ,226 ,802 1.1.1.1.1.1.1.1.263. 1.1.1.1.1.1.1.1.264. 1 1.1.1.1.1.1.1.1.265. 11.1.1.1.1.1.1.1.266. ,1.1.1.1.1.1.1.1.267. 51.1.1.1.1.1.1.1.268. 51.1.1.1.1.1.1.1.269. 11.1.1.1.1.1.1.1.270. 61.1.1.1.1.1.1.1.271. ,1.1.1.1.1.1.1.1.272. 61.1.1.1.1.1.1.1.273. 51.1.1.1.1.1.1.1.274. 21.1.1.1.1.1.1.1.275. 11.1.1.1.1.1.1.1.276. 71.1.1.1.1.1.1.1.277. 1.1.1.1.1.1.1.1.278. 21.1.1.1.1.1.1.1.279. 71.1.1.1.1.1.1.1.280. 71.1.1.1.1.1.1.1.281. 11.1.1.1.1.1.1.1.282. 6 3:Osvaldo ,098 778 ,627 ,235 ,784 ,880 529 ,575 ,607 ,678 3,923 ,193 ,257 ,412 ,357 ,424 ,238 ,103 1.1.1.1.1.1.1.1.283. 1.1.1.1.1.1.1.1.284. 1 1.1.1.1.1.1.1.1.285. ,1.1.1.1.1.1.1.1.286. 41.1.1.1.1.1.1.1.287. 11.1.1.1.1.1.1.1.288. 11.1.1.1.1.1.1.1.289. 61.1.1.1.1.1.1.1.290. 11.1.1.1.1.1.1.1.291. 11.1.1.1.1.1.1.1.292. 31.1.1.1.1.1.1.1.293. 51.1.1.1.1.1.1.1.294. 51.1.1.1.1.1.1.1.295. 71.1.1.1.1.1.1.1.296. 11.1.1.1.1.1.1.1.297. 21.1.1.1.1.1.1.1.298. 1.1.1.1.1.1.1.1.299. 41.1.1.1.1.1.1.1.300. 51.1.1.1.1.1.1.1.301. 31.1.1.1.1.1.1.1.302. 3 4:Piera 403 ,515 0,277 ,112 ,732 ,724 ,377 ,582 ,505 ,030 ,318 ,763 ,257 ,469 ,217 ,410 ,123 ,976 1.1.1.1.1.1.1.1.303. 1.1.1.1.1.1.1.1.304. 1 1.1.1.1.1.1.1.1.305. 61.1.1.1.1.1.1.1.306. 81.1.1.1.1.1.1.1.307. 81.1.1.1.1.1.1.1.308. 11.1.1.1.1.1.1.1.309. 91.1.1.1.1.1.1.1.310. 31.1.1.1.1.1.1.1.311. 61.1.1.1.1.1.1.1.312. ,1.1.1.1.1.1.1.1.313. 11.1.1.1.1.1.1.1.314. 41.1.1.1.1.1.1.1.315. 11.1.1.1.1.1.1.1.316. 21.1.1.1.1.1.1.1.317. 71.1.1.1.1.1.1.1.318. 41.1.1.1.1.1.1.1.319. 1.1.1.1.1.1.1.1.320. 91.1.1.1.1.1.1.1.321. 51.1.1.1.1.1.1.1.322. 2 5:Quinto ,171 ,580 ,877 ,985 ,195 ,500 ,380 464 1,590 ,497 ,571 ,383 ,412 ,469 ,049 ,454 ,597 ,453 1.1.1.1.1.1.1.1.323. 1.1.1.1.1.1.1.1.324. 1 1.1.1.1.1.1.1.1.325. 41.1.1.1.1.1.1.1.326. 61.1.1.1.1.1.1.1.327. 71.1.1.1.1.1.1.1.328. 41.1.1.1.1.1.1.1.329. 11.1.1.1.1.1.1.1.330. 11.1.1.1.1.1.1.1.331. 91.1.1.1.1.1.1.1.332. 11.1.1.1.1.1.1.1.333. ,1.1.1.1.1.1.1.1.334. 11.1.1.1.1.1.1.1.335. 11.1.1.1.1.1.1.1.336. 71.1.1.1.1.1.1.1.337. 71.1.1.1.1.1.1.1.338. 51.1.1.1.1.1.1.1.339. 91.1.1.1.1.1.1.1.340. 1.1.1.1.1.1.1.1.341. 11.1.1.1.1.1.1.1.342. 1 6:Rosario ,463 ,464 ,918 ,653 4,547 0,092 ,049 0,995 678 3,872 0,859 ,168 ,357 ,217 ,049 2,570 3,947 1,065 1.1.1.1.1.1.1.1.343. 1.1.1.1.1.1.1.1.344. 1 1.1.1.1.1.1.1.1.345. 31.1.1.1.1.1.1.1.346. 31.1.1.1.1.1.1.1.347. 71.1.1.1.1.1.1.1.348. 51.1.1.1.1.1.1.1.349. 11.1.1.1.1.1.1.1.350. 51.1.1.1.1.1.1.1.351. ,1.1.1.1.1.1.1.1.352. 31.1.1.1.1.1.1.1.353. 11.1.1.1.1.1.1.1.354. ,1.1.1.1.1.1.1.1.355. 11.1.1.1.1.1.1.1.356. 61.1.1.1.1.1.1.1.357. 11.1.1.1.1.1.1.1.358. 31.1.1.1.1.1.1.1.359. 51.1.1.1.1.1.1.1.360. 11.1.1.1.1.1.1.1.361. 1.1.1.1.1.1.1.1.362. 3 7:Santina ,207 ,077 ,628 ,735 ,049 ,740 846 ,961 1,495 408 1,941 ,840 ,424 ,410 ,454 2,570 ,198 ,142 1.1.1.1.1.1.1.1.363. 1.1.1.1.1.1.1.1.364. 1 1.1.1.1.1.1.1.1.365. 51.1.1.1.1.1.1.1.366. 91.1.1.1.1.1.1.1.367. 11.1.1.1.1.1.1.1.368. 21.1.1.1.1.1.1.1.369. 71.1.1.1.1.1.1.1.370. 11.1.1.1.1.1.1.1.371. 31.1.1.1.1.1.1.1.372. ,1.1.1.1.1.1.1.1.373. 11.1.1.1.1.1.1.1.374. 31.1.1.1.1.1.1.1.375. 41.1.1.1.1.1.1.1.376. 21.1.1.1.1.1.1.1.377. 61.1.1.1.1.1.1.1.378. 31.1.1.1.1.1.1.1.379. 21.1.1.1.1.1.1.1.380. 11.1.1.1.1.1.1.1.381. 31.1.1.1.1.1.1.1.382. 8:Temistocle ,091 ,779 4,844 ,903 ,789 ,199 ,675 885 5,521 ,503 ,972 ,226 ,238 ,123 ,597 3,947 ,198 610 1.1.1.1.1.1.1.1.383. 1.1.1.1.1.1.1.1.384. 1 1.1.1.1.1.1.1.1.385. 21.1.1.1.1.1.1.1.386. 51.1.1.1.1.1.1.1.387. 11.1.1.1.1.1.1.1.388. 21.1.1.1.1.1.1.1.389. 41.1.1.1.1.1.1.1.390. 21.1.1.1.1.1.1.1.391. 11.1.1.1.1.1.1.1.392. 11.1.1.1.1.1.1.1.393. 11.1.1.1.1.1.1.1.394. 11.1.1.1.1.1.1.1.395. 61.1.1.1.1.1.1.1.396. 21.1.1.1.1.1.1.1.397. 31.1.1.1.1.1.1.1.398. 11.1.1.1.1.1.1.1.399. 21.1.1.1.1.1.1.1.400. 11.1.1.1.1.1.1.1.401. 11.1.1.1.1.1.1.1.402. , 9:Umberto ,973 ,594 0,055 ,593 ,221 ,049 ,579 ,112 1,638 ,476 ,317 ,802 ,103 ,976 ,453 1,065 ,142 610 1.1.1.1.1.1.1.1.403. 1 2 5 1 2 4 2 1 1 1 1 6 2 3 1 2 1 1 , Processo di agglomerazione Cluster di appartenenza Grafico a stalattite Ve rtical Icicle X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X 1:Aurora 14:Piera 4:Dalmazio 12:Nestore 6:Fatima 11:Mercuzio 8:Heat her 15:Quinto 18:Temistocle 19:Umberto 2:Beat rice 7:Gioacchino 13:Osvaldo 5:Ermanno 17:Santina 10:Lambert o Number of clus ters 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 3:Ciriaco 16:Rosario 9:I mmacolata Case X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X Dendogramma (metodo di Ward) Rescaled Distance Cluster Combine C A S E Label Dalmazio Num 4 0 5 10 15 20 25 +---------+---------+---------+---------+---------+ Nestore Fatima Temistocle 12 6 18 Umberto 19 Heather Quinto 8 15 Mercuzio 11 Lamberto 10 Santina Ermanno 17 5 Aurora 1 Piera Gioacchino 14 7 Osvaldo 13 Beatrice 2 Immacolata Rosario Ciriaco 9 16 3 Appartenenza dei casi ai gruppi Centri finali dei cluster Final Cluster Centers Nevroticis mo Estroversione Apertura all'es perienza Amabilità Cos cenzios ità 1 2,06 2,34 2,56 2,18 1,96 Cluster 2 1,83 2,47 2,71 2,83 2,88 3 2,27 2,04 2,19 2,16 2,83 Numero di casi in ciascun cluster Number of Cases in each Cluster Cluster Valid Mis sing 1 2 3 10,000 23,000 17,000 50,000 ,000