Comments
Transcript
Lez 2013 1B- Dispersione e tendenza centrale - e
DISPERSIONE E TENDENZA CENTRALE 1 Dall’esame della distribuzione di frequenza, si possono desumere alcune caratteristiche: Le misurazioni sono concentrate sul lato sinistro (A), sul lato destro (B), al centro (C), da nessuna parte (D) o in due punti (E). A- Pre v ale nza di v alori bassi B Prevalenza di valori alti 40 35 40 30 25 30 20 15 10 20 10 C- Valori concentrati nel centro 32 30 28 26 24 22 20 18 16 14 12 10 32 30 28 26 24 22 20 18 16 14 0 12 10 5 0 D - Distribuzione uniforme 40 35 16 14 12 10 8 6 4 2 0 30 25 20 15 10 5 32 30 E- distribuzione bimodale 30 25 20 2 15 10 5 32 30 28 26 24 22 20 18 16 14 12 0 10 28 26 24 22 20 18 16 14 12 10 0 LA DISTRIBUZIONE CUMULATIVA DELLE FREQUENZE Sommando le frequenze dai valori più bassi ai valori più alti, si ottiene la distribuzione cumulativa (o cumulata) delle frequenze: Valori osservati Frequenza Percentuale Frequenza cumulativa Percentuale comulativa 23 1 7.7 1 7.7 24 3 23.1 4 30.8 25 1 7.7 5 38.5 26 2 15.4 7 53.8 27 4 30.8 11 84.6 29 1 7.7 12 92.3 30 1 7.7 13 100.0 Totale 13 100.0 13 100.0 3 L’ogiva Per rappresentare la distribuzione cumulativa di frequenza si usa più spesso il poligono piuttosto che l’istogramma, e il poligono delle frequenze cumulative si chiama ogiva. Si usano le percentuali piuttosto che le frequenze assolute: Percentuale cumulativa 100% 80% 60% 40% 20% 0% 23 24 25 26 27 29 30 età Ogni punto rappresenta un valore della variabile abbinato alla sua percentuale cumulativa. L’unione di tutti i punti dà questo segmento spezzato detto ogiva. 4 ESEMPIO Nella tabella sono mostrati i punteggi relativi a un test di abilità verbale eseguito da 635 quattordicenni. Riporta inoltre le frequenze assolute e le percentuali assolute e cumulate. Valori Frequenza Percentuale Percentuale cumulata 4 1 ,2 ,2 5 1 ,2 ,3 7 2 ,3 ,6 8 9 1,4 2,0 9 6 ,9 3,0 31 3 ,5 98,6 32 5 ,8 99,4 33 2 ,3 99,7 34 1 ,2 99,8 35 1 ,2 100,0 Totale 635 100 5 70 60 A 62 58 53 50 49 46 40 42 41 30 31 30 2626 25 22 20 Istogramma delle frequenze (A) e poligono di frequenza (B) relativi ai punteggi della tabella precedente. 21 16 10 9 6 0 4 12 1212 10 9 11 5 9 13 17 21 25 29 33 verbale B 10 8 6 4 2 6 0 4 7 verbale 9 11 13 15 17 19 21 23 25 27 29 31 33 35 Ranghi I ranghi sono dei numeri che indicano la posizione di ciascuna osservazione in rapporto alle altre. Il rango 1 può essere attribuito o al numero più piccolo (disposizione crescente) o al numero più grande (disposizione decrescente). Ogni volta è necessario specificare quale scelta si fa. OSSERVAZIONI RANGO A RANGO B 4 1 7 18 2 6 19 3 5 20 4 4 22 5 3 50 6 2 120 7 1 In questa tabella, per esempio, il punteggio 4 ha rango a uguale a 1 perché, ordinando in maniera crescente i punteggi, risulta in prima posizione; rango b uguale a 7 perché,ordinando in maniera decrescente, risulta in ultima posizione. 7 NEL CASO DI DUE O PIÙ OSSERVAZIONI UGUALI SI PROCEDE CALCOLANDO LA MEDIA DEI RANGHI INIZIALI, QUINDI ATTRIBUITI ALLO STESSO PUNTEGGIO. Conversione in ranghi dei punteggi ordinati Osser Osser equi equi rango v. con ranghi ranghi v con ranghi ranghi vale vale Osserv. a finali iniziali finali due iniziali tre nti nti valori valori 4 1 4 1 1 4 1 1 18 2 18 2 2 18 2 2 19 20 22 50 120 3 4 5 6 7 19 19 20 22 50 120 3 4 3,5 3,5 3,5 3,5 5 5 6 6 7 8 7 8 19 19 19 20 22 50 120 3 4 4 4 4 4 5 4 4 6 6 7 7 8 9 88 8 9 NEL CASO DI DUE O PIÙ OSSERVAZIONI UGUALI SI PROCEDE CALCOLANDO LA MEDIA DEI RANGHI INIZIALI, QUINDI ATTRIBUITI ALLO STESSO PUNTEGGIO. Conversione in ranghi dei punteggi ordinati Osser Osser equi equi rango v. con ranghi ranghi v con ranghi ranghi vale vale Osserv. a finali iniziali finali due iniziali tre nti nti valori valori 4 1 4 1 1 4 1 1 18 2 18 2 2 18 2 2 19 20 22 50 120 3 4 5 6 7 19 19 20 22 50 120 3 4 3,5 3,5 3,5 3,5 5 5 6 6 7 8 7 8 19 19 19 20 22 50 120 3 4 4 4 4 4 5 4 4 6 6 7 7 8 9 89 99 COME SI PROCEDE CON OSSERVAZIONI UGUALI? UN PUNTEGGIO CHE APPARE PIÙ VOLTE RICEVE LA MEDIA DEI RANGHI INIZIALI Conversione in ranghi dei punteggi ordinati Osser Osser equi equi rango v. con ranghi ranghi v con ranghi ranghi vale vale Osserv. a finali iniziali finali due iniziali tre nti nti valori valori 4 1 4 1 1 4 1 1 18 2 18 2 2 18 2 2 19 20 22 50 120 3 4 5 6 7 19 19 20 22 50 120 3 4 3,5 3,5 3,5 3,5 5 5 6 6 7 8 7 8 19 19 19 20 22 50 120 3 4 4 4 4 4 5 4 4 6 6 7 7 8 9 810 9 COME SI PROCEDE CON OSSERVAZIONI UGUALI? UN PUNTEGGIO CHE APPARE PIÙ VOLTE RICEVE LA MEDIA DEI RANGHI INIZIALI Conversione in ranghi dei punteggi ordinati Osser Osser equi equi rango v. con ranghi ranghi v con ranghi ranghi vale vale Osserv. a finali iniziali finali due iniziali tre nti nti valori valori 4 1 4 1 1 4 1 1 18 2 18 2 2 18 2 2 19 20 22 50 120 3 4 5 6 7 19 19 20 22 50 120 3 4 3,5 3,5 3,5 3,5 5 5 6 6 7 8 7 8 19 19 19 20 22 50 120 3 4 4 4 4 4 5 4 4 6 6 7 7 8 9 8 9 11 11 Il rango percentile indica la posizione di un’osservazione all’interno di un insieme prescindendo dalla numerosità del campione (come le percentuali). Ranghi percentili Punto grezzo rango Rango centile o percentile 2 12 4,17 4 11 12,50 18 10 20,83 19 8 37,50 19 8 37,50 Richiede una formula specifica: 19 8 37,50 ( N (G 0,5)) RC 100 N 20 6 54,17 22 5 62,50 28 4 70,83 38 3 79,17 50 2 87,50 120 1 95,83 Il percentile 70 è, per esempio, il valore superiore al 70 % dei casi, e inferiore al 30% dei casi. Formula di calcolo N = Numero delle osservazioni G = Rango RC = Rango percentile (o centile) 12 osservazione rango ascendente (quasi) percentile rango percentile 1002 1004 1018 1019 1020 1021 1022 1026 1028 1036 1 2 3 4 5 6 7 8 9 10 10 20 30 40 50 60 70 80 90 100 0,5 10,5 20,5 30,5 40,5 50,5 60,5 70,5 80,5 90,5 13 osservazione rango discendente rango percentile 1002 1004 1018 1019 1020 1021 1022 1026 1028 1036 10 9 8 7 6 5 4 3 2 1 90,5 80,5 70,5 60,5 50,5 40,5 30,5 20,5 10,5 0,5 14 Distribuzione cumulativa di frequenze e ogiva Come interpretare i dati usando l’ogiva e i percentili: Il punteggio 17 o inferiore è ottenuto all’incirca da 50 % dei soggetti; un punteggio uguale o inferiore a 25 è ottenuto dal 90% dei soggetti. Percentili 5 10 25 50 75 90 95 Punteggio di abilità verbale 11 12 15 17 21 25 28 15 Distribuzione cumulativa di frequenze e ogiva 120 100 80 [Grafico relativo alla tabella precedente] 60 40 20 0 16 4 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 16 verbale punto rango grezzo ordinato con N dispari con N pari 2 1 5 2 6 3 9 4 10 5 11 6 15 7 2 1 5 2 6 3 9 4 10 5 11 6 mediana mediana = 9 mediana = 7,5 17 LA MEDIANA Mediana (Mdn): in un insieme di dati ordinati, è quel valore che occupa la posizione centrale nella distribuzione dei dati stessi. Divide in due metà( 50% inferiore e 50% superiore) la distribuzione dei dati: Mdn= dove N è il numero di osservazioni 18 Esempio: • N dispari = 7 {2,5,6,9,10,11,15} Mdn= N4= 9 (è nella quarta posizione) • N pari = 6 {2,5,6,9,10,11} Mdn= La posizione 3,5 si colloca tra i valori 6 e 9 e dunque è necessario calcolare la media aritmetica tra i due valori 6+9=7,5 ; la mediana in questo caso non esiste e si pone come convenzione pari al valore medio fra le due posizioni. 19 I QUANTILI Se dividendo una distribuzione a metà otteniamo la mediana, dividendola in quattro parti otterremo tre valori corrispondenti ai quartili. Allo stesso modo, dividendo in tre parti si ottengono i terzili, in cinque i quintili, in cento i centili, e così via. Distribuzione 0 50% dei casi Mediana Mdn N 50% dei casi Divisione in terzili T1 0 0 Q1 P 25 N T2 Divisione in quartili Q2 Divisione in centili P 50 Q3 N P 75 0 Equivalenze Q1 (primo quartile) = 25° percentile Q2 (secondo quartile) = 50° percentile = Mediana Q3 (terzo quartile) = 75° percentile N 20 COME CALCOLARE IL PERCENTILE Per esempio, il 43° percentile n 1 PosP43 43 100 con n = numero totale dei casi 21 MEDIA, VARIANZA E DEVIAZIONE STANDARD MEDIA: valore centrale di un insieme di dati, dato dalla somma di tutti i valori della distribuzione diviso per il numero totale dei casi che la compongono. VARIANZA: somma degli scarti dalla media elevati al quadrato e divisi per il numero totale dei casi. DEVIAZIONE STANDARD: scarto dalla media, ottenibile tramite la radice quadrata della varianza. 22 FORMULE MEDIA VARIANZA xi M N 2 s 2 x xi M2 N 2 oppure, semplificando s 2 x DEVIAZIONE STANDARD 23 CALCOLO DI MEDIA, VARIANZA E DEVIAZIONE STANDARD Punteggio Scarto dalla media Quadrato dello scarto Quadrato del punteggio 1 Alessio 2 -2 4 4 2 Bruno 3 -1 1 9 3 Carlo 4 0 0 16 4 Davide 2 -2 4 4 5 Enrico 9 5 25 81 Totale 20 0 34 114 Media 4 0 6,8 22,8 Media 4 Deviazione Standard 2,61 Varianza 6,8 Soggetto Media dei quadrati degli scarti 24 VARIANZA Due modi Media dei quadrati degli scarti xi M sx N 2 34 6,8 = 5 2 media dei quadrati meno quadrato della media. xi 2 M N 2 s 2 x 114 6,8 = 5 4 2 25 LA STANDARDIZZAZIONE 26 Standardizzazione dei punteggi I punti grezzi di un test possono essere convertiti in modo da imporre una media pari a zero e una deviazione standard uguale a uno con questa formula: grezzo media punto zeta d .s. 27 Trasformazione in punti zeta soggetto test K scarto dalla media Anna 1 -3,4 11,56 1 -1,247 Brigida 2 4 7 8 -2,4 5,76 4 -0,880 -0,4 0,16 16 -0,147 2,6 6,76 49 0,953 3,6 12,96 64 1,320 0 37,2 134 0 media 22 4,4 0 7,44 26,8 0 varianza 7,44 dev stand 2,728 Carlo Delia Enrico somma quadrato dello scarto quadrato del punteggio punto zeta (*) [trovato con (26,8 – (4,4)2] (*) z= (grezzo - media)/dev. stand. 28 VANTAGGI DEI PUNTI ZETA Sono confrontabili con punteggi di altri test e misurazioni Se hanno una distribuzione normale, si può far riferimento alle tavole della distribuzione della curva normale SVANTAGGI DEI PUNTI ZETA Hanno la virgola (o punto) decimale Hanno il segno negativo 29 ESEMPI DI PUNTEGGI STANDARDIZZATI Punti T Media = 50 ds = 10 Si ottengono con la formula T = z ∙10 + 50 Esempio: Trasformare il punto zeta -0,42 in punto T T= -0,42 ∙10 + 50 = 45,8 , arrotondato a 46 30 ESEMPI DI PUNTEGGI STANDARDIZZATI Punti C Media = 5 ds = 2 Si ottengono con la formula C = z ∙2 + 5 Esempio: Trasformare il punto zeta -0,42 in punto C C = -0,42 ∙2 + 5 = 4,16 arrotondato a 4 31 ESEMPI DI PUNTEGGI STANDARDIZZATI Punti Q Media = 100 ds = 20 (GATB) oppure 15 (WAIS) oppure 16 (Stanford-Binet) Per quanto riguarda, ad esempio, il test GATB, si ottengono con la formula Q = z ∙20 + 100 Per gli altri due test cambierà ovviamente il valore per cui si moltiplica z,ovvero il valore della deviazione standard. Esempio: Trasformare il punto zeta -0,42 in punto Q Q = -0,42 ∙20 + 100 = 91,6 arrotondato a 92 32 ESISTONO ALTRE FORME DI PUNTI STANDARDIZZATI Punti Stanine (Stanine) punto z· 2 +5 (9 punti in totale, perché gli intervalli estremi sono aperti) Punti Sten (standard Ten) punto z· 2 +5,5 (10 punti in totale) 33 La conversione in punti T non normalizza la distribuzione. . Esempio con dati reali Punti grezzi di Colpevolezza (da 5 a 22), media= 8,15 ; d.s.= 3,36 160 140 120 100 80 60 40 20 34 0 4 6 5 8 7 10 9 12 11 14 13 16 15 18 17 20 19 22 21 23 Punti di Colpevolezza convertiti in punti T 160 140 120 100 80 60 40 20 0 40,0 48,0 44,0 56,0 52,0 64,0 60,0 72,0 68,0 80,0 76,0 35 88,0 84,0 92,0