Comments
Description
Transcript
Lezione 4
Lezione 4 La Variabilità Lezione 4 1 Definizione Un valore medio, comunque calcolato, non è sufficiente a rappresentare l’insieme delle osservazioni effettuate (o l’insieme dei valori assunti dalla variabile statistica); è necessario quindi affiancare ad esso altri indici che siano in grado di fornire delle informazioni sulla dispersione, in pratica sulla distanza delle varie osservazioni dal valore medio che rappresenta il centro della distribuzione. Lezione 4 2 Caratteristiche Indicatore di variabilità è una misura che: z deve annullarsi quando, e solo quando, tutte le unità osservate presentano il medesimo stato di grandezza del carattere; z deve assumere valori crescenti all'aumentare della variabilità. Lezione 4 3 Classificazione degli Indici di Variabilità Campo di Variazione Differenza Interquartile Scosatamento Semplice Medio Assoluti Varianza Devianza Indici di Variabilità Deviazione Standard Differenze Medie Coefficiente di Variazione Relativi Rapporto di Concentrazione Lezione 4 4 Indici di Variabilità Assoluti Campo di Variazione È il più semplice da calcolare ed è dato dalla differenza fra il maggiore e il minore dei valori rilevati. Talvolta il campo di variazione si esprime indicando, invece della differenza fra il maggiore e il minore dei valori rilevati, gli estremi dell’intervallo. Il campo di variazione è un indice molto semplice da calcolare, ma di scarsa importanza perché tiene conto solo dei valori estremi e non degli altri. CV = xmax − xmin Limiti: Troppo sensibile ai valori estremi Lezione 4 5 Esempio Lezione 4 6 Differenza Interquartile La differenza interquartile è data dalla differenza tra il terzo e il primo quartile Q=Q3-Q1 E’ una misura di variabilità analoga al campo di variazione ma tiene conto soltanto dei valori che cadono tra il 1° e 3° Quartile (cioè del 50% della distribuzione) Limiti: E’ un indice che non tiene conto di cosa accade all’interno della distribuzione (casi centrali) e agli estremi distribuzione Lezione 4 7 Esempio Lezione 4 8 Lo Scostamento Semplice Medio dalla Media Aritmetica Un altro indice di variabilità è lo scostamento semplice medio, che è la media aritmetica dei valori assoluti degli scarti da un valore medio. Esistono due tipi di scostamenti: 1. Scostamento semplice medio dalla media aritmetica: i=n ∑ i =1 xi − x ni i=n ∑n i =1 2. i Scostamento semplice medio dalla mediana i=n ∑ i=l x i − Me n i i=n ∑n i=l 4 Lezione i 9 Esempio Lezione 4 10 Varianza Lezione 4 11 Proprietà della Varianza Lezione 4 12 Esempio Lezione 4 13 Formula Alternativa per il calcolo della Varianza La Varianza può essere inoltre calcolata nel seguente modo: ⎛ x ⎜ ∑ xi ∑ S 2 = M q2 − M 2 = i =1 − ⎜ i =1 ⎜ n n ⎜ ⎝ n n 2 i Lezione 4 ⎞ ⎟ ⎟ ⎟ ⎟ ⎠ 2 14 Devianza La quantità 2 n ∑ (x − x ) i =1 i Viene definita devianza Lezione 4 15 Scarto Quadratico Medio (Deviazione Standard) La deviazione standard è rappresentata dal radice quadrata della varianza n S= ∑ (x − x ) i =1 2 i n La Deviazione standard viene espressa nella stessa unità di misura dei dati originari. Lezione 4 16 Esempio Lezione 4 17 Indici di Variabilità Relativi Tutti gli indici di variabilità sono definiti indici di variabilità assoluta e sono espressi nella stessa unità di misura del fenomeno considerato; nel caso occorra confrontare più distribuzioni che siano espresse con diverse unità di misura, si ricorre agli indici di variabilità relativa. Gli indici di variabilità relativa hanno quindi la caratteristica di essere dei numeri puri, indipendenti cioè dall’unità di misura prescelta, e permettono di confrontare più distribuzioni. Lezione 4 18 Il Coefficiente di Variazione Lezione 4 19 La Concentrazione La concentrazione è un particolare aspetto della variabilità di un fenomeno, e il suo studio è utile per vedere se il fenomeno è equamente distribuito fra tutte le unità statistiche oppure è concentrato in poche unità. Ad esempio, si può dire che il reddito in un paese come l’Italia è poco concentrato perché non ci sono grandi disparità di reddito tra i cittadini, mentre ad esempio in Brasile è molto concentrata perché ci sono grandi disparità di reddito tra i cittadini. Lezione 4 20 Un carattere quantitativo trasferibile, le cui modalità ordinate sono x1, x2,…xn, si dice equidistribuito se ognuna delle N unità possiede una quota dell’ammontare del carattere n pari a A/N dove ∑ xi A= i =1 N che coincide con la media aritmetica. Se non c’è equidistribuzione allora si ha concentrazione. Si ha massima concentrazione quando una sola unità del collettivo possiede tutto l’ammontare del carattere e tutte le altre nulla, cioè: xn=A x1=…=xn-1 Lezione 4 21 Esempio Si hanno 100 soggetti e l’ammontare complessivo del reddito mensile è A=50.000€. Se c’è equidistribuzione ogni soggetto ha reddito pari a 500€ mentre nel caso di massima concentrazione un solo soggetto ha reddito pari a 50.000€ e gli altri soggetti non hanno reddito. Lezione 4 22 Misurazione della concentrazione Ammontare del carattere posseduto dalla i unità “più povere”: dopo aver ordinato i termini della distribuzione in senso non decrescente I Ai = x1 + x2 + L + x I = ∑ xi i =1 Ammontare relativo del carattere posseduto dalla i unità “più povere”: I . A qi = i = A ∑x i =1 N i ∑x Lezione 4 i =1 i 23 Misurazione della concentrazione Ammontare relativo del carattere posseduto dalla i unità “più povere” nel caso (ipotetico) di equidistribuzione: i pi = N Per qualsiasi distribuzione si ha: pi ≥ qi ∀i All’aumentare della concentrazione aumentano le differenze: pi-qi Nel caso di massima concentrazione si ha: q1=q2=…=qn-1 Lezione 4 24 Rapporto di Concentrazione di Gini Per avere un indice sintetico si usa il rapporto di concentrazione di Gini che si ottiene come rapporto tra e il suo valore massimo: N −1 R= ∑(p − q ) i =1 i i N −1 ∑p i =1 i L’indice di Gini cresce al crescere del livello di concentrazione ed è sempre compreso tra 0 (nel caso di equidistribuzione) e 1 (nel caso di massima concentrazione). Lezione 4 25 La Curva di Lorenz Un altro strumento che permette di valutare il grado di concentrazione è la curva di Lorenz. Si tratta di un grafico ottenuto unendo con dei segmenti i punti di coordinate (pi;qi) per i= 1,n,…, N. Maggiore è l’area tra la curva di Lorenz e la bisettrice, maggiore è la concentrazione. Dal grafico della curva di Lorenz si può ricavare una ulteriore misura di concentrazione, denominata area di concentrazione, strettamente legata al rapporto di concentrazione di Gini. Questa è data dall’area compresa tra la curva di concentrazione e la retta di equidistribuzione: N R = 1 − ∑ (qi + qi −1 )( pi − pi −1 ) i =1 Lezione 4 26 Lezione 4 27 Lezione 4 28 Indici di Mutabilità Mutabilità: Attitudine di un carattere qualitativo ad assumere differenti modalità. Insieme Omogeneo: Tutte le unità rispetto ad un determinato carattere presentano le stesse modalità Insieme Eterogeneo: Tutte le unità statistiche tendono a distribuirsi in maniera uniforme. Lezione 4 29 Indice di Eterogeneità di Gini ⎛ ni ⎞ IE = 1 − ∑ ⎜ ⎟ i =1 ⎝ n ⎠ k Lezione 4 2 30 Proprietà dell’indice di Gini k −1 0 ≤ IE ≤ k IE= 0 quando il collettivo è omogeneo IE= (k-1)/k quando ciascuna unità statistica possiede n/k unità del carattere Lezione 4 31 Indice di Gini Normalizzato IE IE = IEn = max (IE ) k − 1 k Lezione 4 32 Lezione 4 33 L’indice di Mutabilità di Frosini 1⎞ ⎛ d = ∑ ⎜ fi − ⎟ k⎠ 1=1 ⎝ k 2 k −1 0≤d ≤ k Indice Normalizzato di Frosini dn = d = max (d ) Lezione 4 d k −1 k 34 Lezione 4 35