...

Lezione 4

by user

on
Category: Documents
21

views

Report

Comments

Description

Transcript

Lezione 4
Lezione 4
La Variabilità
Lezione 4
1
Definizione
Un valore medio, comunque calcolato, non è
sufficiente a rappresentare l’insieme delle
osservazioni effettuate (o l’insieme dei valori
assunti dalla variabile statistica); è
necessario quindi affiancare ad esso altri
indici che siano in grado di fornire delle
informazioni sulla dispersione, in pratica
sulla distanza delle varie osservazioni dal
valore medio che rappresenta il centro della
distribuzione.
Lezione 4
2
Caratteristiche
Indicatore di variabilità è una misura che:
z deve annullarsi quando, e solo quando,
tutte le unità osservate presentano il
medesimo stato di grandezza del carattere;
z deve assumere valori crescenti
all'aumentare della variabilità.
Lezione 4
3
Classificazione degli Indici di
Variabilità
Campo di Variazione
Differenza Interquartile
Scosatamento Semplice
Medio
Assoluti
Varianza
Devianza
Indici di
Variabilità
Deviazione Standard
Differenze Medie
Coefficiente di Variazione
Relativi
Rapporto di
Concentrazione
Lezione 4
4
Indici di Variabilità Assoluti
Campo di Variazione
È il più semplice da calcolare ed è dato dalla differenza fra
il maggiore e il minore dei valori rilevati. Talvolta il
campo di variazione si esprime indicando, invece della
differenza fra il maggiore e il minore dei valori rilevati,
gli estremi dell’intervallo. Il campo di variazione è un
indice molto semplice da calcolare, ma di scarsa
importanza perché tiene conto solo dei valori estremi e
non degli altri.
CV = xmax − xmin
Limiti: Troppo sensibile ai valori estremi
Lezione 4
5
Esempio
Lezione 4
6
Differenza Interquartile
La differenza interquartile è data dalla differenza tra il terzo
e il primo quartile
Q=Q3-Q1
E’ una misura di variabilità analoga al campo di variazione
ma tiene conto soltanto dei valori che cadono tra il 1° e 3°
Quartile (cioè del 50% della distribuzione)
Limiti: E’ un indice che non tiene conto di cosa accade
all’interno della distribuzione (casi centrali) e agli estremi
distribuzione
Lezione 4
7
Esempio
Lezione 4
8
Lo Scostamento Semplice Medio
dalla Media Aritmetica
Un altro indice di variabilità è lo scostamento semplice medio, che è la
media aritmetica dei valori assoluti degli scarti da un valore medio.
Esistono due tipi di scostamenti:
1.
Scostamento semplice medio dalla media aritmetica:
i=n
∑
i =1
xi − x ni
i=n
∑n
i =1
2.
i
Scostamento semplice medio dalla mediana
i=n
∑
i=l
x i − Me n i
i=n
∑n
i=l 4
Lezione
i
9
Esempio
Lezione 4
10
Varianza
Lezione 4
11
Proprietà della Varianza
Lezione 4
12
Esempio
Lezione 4
13
Formula Alternativa per il
calcolo della Varianza
La Varianza può essere inoltre calcolata nel
seguente modo:
⎛
x ⎜ ∑ xi
∑
S 2 = M q2 − M 2 = i =1 − ⎜ i =1
⎜ n
n
⎜
⎝
n
n
2
i
Lezione 4
⎞
⎟
⎟
⎟
⎟
⎠
2
14
Devianza
La quantità
2
n
∑ (x − x )
i =1
i
Viene definita devianza
Lezione 4
15
Scarto Quadratico Medio
(Deviazione Standard)
La deviazione standard è rappresentata dal radice
quadrata della varianza
n
S=
∑ (x − x )
i =1
2
i
n
La Deviazione standard viene espressa nella
stessa unità di misura dei dati originari.
Lezione 4
16
Esempio
Lezione 4
17
Indici di Variabilità Relativi
Tutti gli indici di variabilità sono definiti indici di
variabilità assoluta e sono espressi nella stessa
unità di misura del fenomeno considerato; nel caso
occorra confrontare più distribuzioni che siano
espresse con diverse unità di misura, si ricorre agli
indici di variabilità relativa.
Gli indici di variabilità relativa hanno quindi la
caratteristica di essere dei numeri puri, indipendenti
cioè dall’unità di misura prescelta, e permettono di
confrontare più distribuzioni.
Lezione 4
18
Il Coefficiente di Variazione
Lezione 4
19
La Concentrazione
La concentrazione è un particolare aspetto della variabilità
di un fenomeno, e il suo studio è utile per vedere se il
fenomeno è equamente distribuito fra tutte le unità
statistiche oppure è concentrato in poche unità.
Ad esempio, si può dire che il reddito in un paese come
l’Italia è poco concentrato perché non ci sono grandi
disparità di reddito tra i cittadini, mentre ad esempio in
Brasile è molto concentrata perché ci sono grandi
disparità di reddito tra i cittadini.
Lezione 4
20
Un carattere quantitativo trasferibile, le cui modalità ordinate
sono x1, x2,…xn, si dice equidistribuito se ognuna delle N
unità possiede una quota dell’ammontare del carattere
n
pari a A/N dove
∑ xi
A=
i =1
N
che coincide con la media aritmetica.
Se non c’è equidistribuzione allora si ha concentrazione.
Si ha massima concentrazione quando una sola unità del
collettivo possiede
tutto l’ammontare del carattere e tutte le altre nulla, cioè:
xn=A
x1=…=xn-1
Lezione 4
21
Esempio
Si hanno 100 soggetti e l’ammontare
complessivo del reddito mensile è
A=50.000€. Se c’è equidistribuzione ogni
soggetto ha reddito pari a 500€ mentre nel
caso di massima concentrazione un solo
soggetto ha reddito pari a 50.000€ e gli altri
soggetti non hanno reddito.
Lezione 4
22
Misurazione della concentrazione
Ammontare del carattere posseduto dalla i
unità “più povere”: dopo aver ordinato i termini
della distribuzione in senso non decrescente
I
Ai = x1 + x2 + L + x I = ∑ xi
i =1
Ammontare relativo del carattere posseduto
dalla i unità “più povere”:
I
.
A
qi = i =
A
∑x
i =1
N
i
∑x
Lezione 4
i =1
i
23
Misurazione della concentrazione
Ammontare relativo del carattere posseduto dalla i unità
“più povere” nel caso (ipotetico) di equidistribuzione:
i
pi =
N
Per qualsiasi distribuzione si ha:
pi ≥ qi
∀i
All’aumentare della concentrazione aumentano le differenze:
pi-qi
Nel caso di massima concentrazione si ha:
q1=q2=…=qn-1
Lezione 4
24
Rapporto di Concentrazione di
Gini
Per avere un indice sintetico si usa il rapporto di concentrazione di
Gini che si ottiene come rapporto tra e il suo valore massimo:
N −1
R=
∑(p − q )
i =1
i
i
N −1
∑p
i =1
i
L’indice di Gini cresce al crescere del livello di
concentrazione ed è sempre compreso tra 0 (nel
caso di equidistribuzione) e 1 (nel caso di massima
concentrazione).
Lezione 4
25
La Curva di Lorenz
Un altro strumento che permette di valutare il grado di
concentrazione è la curva di Lorenz. Si tratta di un grafico
ottenuto unendo con dei segmenti i punti di coordinate
(pi;qi) per i= 1,n,…, N. Maggiore è l’area tra la curva di
Lorenz e la bisettrice, maggiore è la concentrazione.
Dal grafico della curva di Lorenz si può ricavare una ulteriore
misura di concentrazione, denominata area di
concentrazione, strettamente legata al rapporto di
concentrazione di Gini. Questa è data dall’area compresa
tra la curva di concentrazione e la retta di
equidistribuzione:
N
R = 1 − ∑ (qi + qi −1 )( pi − pi −1 )
i =1 Lezione 4
26
Lezione 4
27
Lezione 4
28
Indici di Mutabilità
Mutabilità: Attitudine di un carattere qualitativo
ad assumere differenti modalità.
Insieme Omogeneo: Tutte le unità rispetto ad
un determinato carattere presentano le
stesse modalità
Insieme Eterogeneo: Tutte le unità statistiche
tendono a distribuirsi in maniera uniforme.
Lezione 4
29
Indice di Eterogeneità di Gini
⎛ ni ⎞
IE = 1 − ∑ ⎜ ⎟
i =1 ⎝ n ⎠
k
Lezione 4
2
30
Proprietà dell’indice di Gini
k −1
0 ≤ IE ≤
k
IE= 0 quando il collettivo è omogeneo
IE= (k-1)/k quando ciascuna unità statistica possiede n/k unità del
carattere
Lezione 4
31
Indice di Gini Normalizzato
IE
IE
=
IEn =
max (IE ) k − 1
k
Lezione 4
32
Lezione 4
33
L’indice di Mutabilità di Frosini
1⎞
⎛
d = ∑ ⎜ fi − ⎟
k⎠
1=1 ⎝
k
2
k −1
0≤d ≤
k
Indice Normalizzato di Frosini
dn =
d
=
max (d )
Lezione 4
d
k −1
k
34
Lezione 4
35
Fly UP