...

Esercizi sulla variabilità

by user

on
Category: Documents
45

views

Report

Comments

Transcript

Esercizi sulla variabilità
STATISTICA esercizi svolti sulla
VARIABILITA’
1
1 VARIABILITA’
1
2
VARIABILITA’
1.1
Esercizi
1. La seguente tabella riporta il tempo (in giorni) impiegato da sei individui per il
consumo di una confezione di pasta da 250 grammi:
1
3
5
6
15
30 .
Si calcolino: lo scostamento medio dalla mediana, lo scostamento medio dalla media
aritmetica e lo scarto quadratico medio, commentando i risultati ottenuti.
Svolgimento
Per prima cosa, notiamo che i valori forniti dal testo sono già ordinati: per maggiore
chiarezza, comunque li riportiamo di seguito:
x(1) = 1
x(2) = 3
x(3) = 5
x(4) = 6
x(5) = 15
x(6) = 30.
Dato che il loro numero è pari (N = 6), si hanno due posizioni centrali:
N
=3
2
,
N
+ 1 = 4.
2
La mediana è pertanto:
x(3) + x(4)
5+6
=
= 5.5.
2
2
Il valore assunto dalla mediana dice che nel 50% dei casi circa, la durata di un pacchetto di pasta è minore di 5.5 giorni. Analogamente, nel 50% dei casi circa, la durata
di un pacchetto di pasta è superiore a 5.5 giorni.
La media aritmetica è data da
6
1X
1 + 3 + 5 + 6 + 15 + 30
M1 =
= 10.
xi =
6 i=1
6
Per calcolare lo scostamento medio dalla mediana e dalla media aritmetica e lo scarto
quadratico medio, è necessario completare la seguente tabella:
xi
1
3
5
6
15
30
Totale
|xi − M e|
4.5
2.5
0.5
0.5
9.5
24.5
42
|xi − M1 | (xi − M1 )2
9
81
7
49
5
25
4
16
5
25
20
400
50
596
1 VARIABILITA’
3
Si ha quindi che lo scostamento medio dalla mediana è
6
SM e
42
1X
|xi − M e| =
=7
=
6 i=1
6
e indica che mediamente le durate del pacchetto di pasta differiscono (si discostano)
dalla durata mediana di 7 giorni.
Lo scostamento medio dalla media aritmetica è:
6
SM 1
1X
50
=
= 8.3̄
|xi − M1 | =
6 i=1
6
e indica che mediamente le durate del pacchetto di pasta differiscono (si discostano)
dalla durata media di 8.3̄ giorni.
Lo scarto quadratico medio è:
v
r
u 6
u1 X
596
σ=t
= 9.967
(xi − M1 )2 =
6 i=1
6
e indica che mediamente le durate del pacchetto di pasta differiscono dalla durata
media di 9.967 giorni.
2. La seguente tabella fornisce il reddito annuo di sette individui:
individui
A B C D E
reddito (in migliaia di euro) 15 20 12 10 18
F
30
G
.
35
Calcolare lo scostamento medio dalla mediana, lo scostamento medio dalla media
aritmetica, lo scarto quadratico medio, la devianza e la varianza.
Svolgimento
Per prima cosa, ordiniamo in ordine crescente i valori forniti dal testo:
x(1) = 10
x(2) = 12
x(3) = 15
x(4) = 18
x(5) = 20
x(6) = 30
x(7) = 35.
Dato che il loro numero è dispari (N = 7), la posizione mediana è data da:
N +1
8
= = 4.
2
2
La mediana è pertanto:
x(4) = 18.
Il valore assunto dalla mediana dice che circa il 50% dei redditi (dei 7 individui presi
in esame) è minore di 18 (migliaia di euro). Analogamente, circa il 50% dei redditi
1 VARIABILITA’
4
(dei 7 individui presi in esame) è maggiore di 18 (migliaia di euro).
La media aritmetica è data da
7
1X
15 + 20 + 12 + 10 + 18 + 30 + 35
= 20.
M1 =
xi =
7 i=1
7
Per calcolare lo scostamento dalla mediana e dalla media aritmetica e lo scarto
quadratico medio, è necessario completare la seguente tabella:
|xi − M e|
3
2
6
8
0
12
17
48
xi
15
20
12
10
18
30
35
TOTALE
|xi − M1 | (xi − M1 )2
5
25
0
0
2
4
10
100
8
64
10
100
15
225
50
518
Si ha quindi che lo scostamento medio dalla mediana è
7
SM e
1X
48
=
|xi − M e| =
= 6.857
7 i=1
7
e indica che mediamente i redditi (dei 7 individui presi in esame) differiscono (si discostano) dal reddito mediano di 6.857 migliaia di euro.
Lo scostamento medio dalla media aritmetica è:
7
SM 1 =
50
1X
= 7.143
|xi − M1 | =
7 i=1
7
e indica che mediamente i redditi (dei 7 individui presi in esame) differiscono (si discostano) dal reddito medio di 7.143 migliaia di euro.
Lo scarto quadratico medio è:
v
r
u 7
u1 X
518
σ=t
= 8.6023
(xi − M1 )2 =
7 i=1
7
e indica che mediamente i redditi (dei 7 individui presi in esame) differiscono dal
reddito medio di 8.6023 migliaia di euro.
1 VARIABILITA’
5
Avendo calcolato lo scarto quadratico medio, è possibile calcolare la varianza elevandolo al quadrato:
7
518
1X
2
(xi − M1 )2 =
= 74.
σ =
7 i=1
7
Dalla tabella precedente, si ricava immediatamente anche la devianza:
Dev =
7
X
i=1
(xi − M1 )2 = 518.
3. La seguente tabella fornisce la distribuzione delle 100 famiglie di un quartiere secondo
il carattere X = “numero di figli”:
numero di figli
frequenze assolute
0
30
1
15
2
20
3
12
4
10
5
9
6
.
4
Determinare:
a) il campo di variazione;
b) la differenza interquartile;
c) la varianza con il metodo indiretto;
d) lo scostamento medio dalla media aritmetica;
e) lo scostamento medio dalla mediana.
Svolgimento
Come prima cosa, conviene riscrivere la tabella fornita dal testo nel seguente modo,
calcolando anche le frequenze cumulate:
N umero di f igli (xj ) nj
0
30
1
15
2
20
3
12
4
10
5
9
6
4
Totale
100
Cj
30
45
65
77
87
96
100
É possibile ora calcolare:
a) Il campo di variazione
x(N ) − x(1) = x(100) − x(1) = 6 − 0 = 6.
Tale valore indica che la lunghezza dell’intervallo in cui sono compresi i valori
del carattere X (numero di figli) è pari a 6.
1 VARIABILITA’
6
b) La differenza interquartile
Q3 − Q1 = x(3· N +1 ) − x( N +1 ) = x(75.75) − x(25.25) = 3 − 0 = 3.
4
4
Tale valore indica che il 50% delle famiglie analizzate hanno un numero di figli
compreso in un intervallo di ampiezza 3.
c) La varianza (con il metodo indiretto)
7
1 X 2
σ =
x nj − M12 = M22 − M12 .
N j=1 j
2
La seguente tabella
xj
0
1
2
3
4
5
6
TOT
nj
30
15
20
12
10
9
4
100
x j nj
0
15
40
36
40
45
24
200
x2j
0
1
4
9
16
25
36
x2j nj
0
15
80
108
160
225
144
732
permette di calcolare:
7
1 X
200
M1 =
=2
x j nj =
100 j=1
100
e
7
M22
732
1 X 2
x j nj =
= 7.32.
=
100 j=1
100
Quindi
σ 2 = 7.32 − (2)2 = 3.32
d) Lo scostamento medio dalla media aritmetica.
La seguente tabella
xj
0
1
2
3
4
5
6
TOT
nj
30
15
20
12
10
9
4
100
|xj − M1 | |xj − M1 | · nj
2
60
1
15
0
0
1
12
2
20
3
27
4
16
150
1 VARIABILITA’
7
permette di calcolare lo scostamento medio da M1 :
SM 1 =
7
150
1 X
·
= 1.5.
|xj − M1 | · nj =
100 j=1
100
Tale valore indica che mediamente il numero di figli (delle 100 famiglie prese in
esame) differisce (si discosta) dal loro valore medio di 1.5 figli.
e) Lo scostamento medio dalla mediana.
Per prima cosa, si calcola la mediana: ricordando che N = 100 e utilizzando le
frequenze cumulate precedentemente calcolate, si ha
M e = x( N +1 ) = x(50.5) = 2.
2
In questo caso, quindi M e = M1 = 2: si avrà di conseguenza che
SM e = SM1 = 1.5.
É possibile quindi affermare che mediamente il numero di figli (delle 100 famiglie
prese in esame) differisce (si discosta) dal loro valore mediano di 1.5 figli.
4. La seguente tabella riporta la distribuzione del carattere X= “numero di stanze” di
120 abitazioni della provincia di Belluno:
N umero di stanze (xj ) 1
nj
5
2
22
3
32
4
35
5
16
6
7
7 8
.
2 1
Calcolare il campo di variazione, la differenza interquartile, lo scarto quadratico medio
e lo scostamento medio dalla media aritmetica.
Svolgimento
Come prima cosa, conviene riscrivere la tabella fornita dal testo nel seguente modo,
calcolando anche le frequenze cumulate:
xj
1
2
3
4
5
6
7
8
TOTALE
nj
5
22
32
35
16
7
2
1
120
Cj
5
27
59
94
110
117
119
120
1 VARIABILITA’
8
É possibile ora calcolare:
a) Il campo di variazione
x(N ) − x(1) = x(120) − x(1) = 8 − 1 = 7.
Tale valore indica che la lunghezza dell’intervallo in cui sono compresi i valori
del carattere X (numero di stanze) è pari a 7.
b) La differenza interquartile
Q3 − Q1 = x(3· N +1 ) − x( N +1 ) = x(90.75) − x(30.25) = 4 − 3 = 1.
4
4
Tale valore indica che il 50% delle abitazioni prese in esame hanno un numero
di stanze compreso in un intervallo di ampiezza pari a 1.
c) Lo scarto quadratico medio e lo scostamento medio dalla media aritmetica.
Per prima cosa, è necessario calcolare la media aritmetica. Si completa pertanto
la seguente tabella.
xj
1
2
3
4
5
6
7
8
TOT
nj
5
22
32
35
16
7
2
1
120
x j nj
5
44
96
140
80
42
14
8
429
la quale, permette di calcolare:
8
M1 =
1 X
429
= 3.575
x j nj =
120 j=1
120
Completando la seguente tabella
xj
1
2
3
4
5
6
7
8
TOT
nj
5
22
32
35
16
7
2
1
120
|xj − M1 |
2.575
1.575
0.575
0.425
1.425
2.425
3.425
4.425
(xj − M1 )2
6.63
2.48
0.33
0.18
2.03
5.88
11.73
19.58
|xj − M1 | · nj
12.875
34.65
18.4
14.875
22.8
16.975
6.85
4.425
131.85
(xj − M1 )2 · nj
33.15
54.56
10.56
6.3
32.48
41.16
23.46
19.58
221.25
1 VARIABILITA’
9
è possibile calcolare lo scostamento medio da M1 :
SM 1
8
131.85
1 X
·
= 1.09875
|xj − M1 | · nj =
=
120 j=1
120
(mediamente il numero di stanze delle 120 abitazioni prese in esame differisce
dal valore medio di 1.09875 stanze)
e lo scarto quadratico medio:
v
r
u
8
u 1 X
221.25
σ=t
·
= 1.358
(xj − M1 )2 · nj =
120 j=1
120
(mediamente il numero di stanze delle 120 abitazioni prese in esame differisce
dal valore medio di 1.358 stanze).
5. La distribuzione del reddito annuo in euro dei 1000 abitanti di un comune è la
seguente:
classi di reddito redditieri
1000 |– 5000
100
5000 |– 15000
400
.
15000 |– 35000
300
35000 |– 75000
200
Si determini la varianza del reddito dei 1000 abitanti. Si verifichi numericamente la relazione tra lo scarto quadratico medio e lo scostamento medio dalla media aritmetica.
Svolgimento
Per prima cosa, è necessario calcolare la media aritmetica, completando la seguente
lj− + lj+
tabella, dove xj =
indica il valore centrale della j-esima classe:
2
classi di reddito
1000|–5000
5000|–15000
15000|– 35000
35000 |– 75000
TOTALE
xj
3000
10000
25000
55000
nj
100
400
300
200
1000
x j · nj
300000
4000000
7500000
11000000
22800000
Si ha quindi che:
4
1 X
22800000
M1 =
x j · nj =
= 22800.
N j=1
1000
Per calcolare la varianza, e lo scostamento medio da M1 è necessario completare la
seguente tabella:
1 VARIABILITA’
10
classi di reddito
1000|–5000
5000|–15000
15000|– 35000
35000 |– 75000
TOTALE
xj
3000
10000
25000
55000
nj
100
400
300
200
1000
|xj − M1 |
19800
12800
2200
32200
|xj − M1 | · nj
1980000
5120000
660000
6440000
14200000
(xj − M1 )2
392040000
163840000
4840000
1036840000
(xj − M1 )2 · nj
39204000000
65536000000
1452000000
207368000000
313560000000
Quindi lo scostamento medio dalla media aritmetica è pari a
SM 1 =
4
X
1
14200000
·
= 14200
|xj − M1 | · nj =
1000 j=1
1000
e tale valore indica che mediamente i redditi dei 1000 abitanti si discostano dal loro
valore medio di 14200 euro.
La varianza è pari a
4
1 X
313560000000
σ =
(xj − M1 )2 · nj =
= 313560000
1000 j=1
1000
2
e lo scarto quadratico medio è
v
r
u
4
u 1 X
313560000000
(xj − M1 )2 · nj =
= 17707.625
σ=t
1000 j=1
1000
e tale valore indica che mediamente i redditi dei 1000 abitanti si discostano dal loro
valore medio di 17707.625 euro.
É facile notare che i valori ottenuti verificano la relazione
14200 < 17707.625
e pertanto è soddisfatta la seguente relazione tra scarto quadratico medio e scostamento medio da M1 :
SM1 ≤ σ.
6. La distribuzione delle fatture di una grande azienda, emesse in un mese, secondo
l’importo in migliaia di euro è riportata nella seguente tabella:
classi d’importo
n. fatture
importo totale di classe
0–|50
8
304
50–|100
70
5600
100–|150
71
8946
.
150–|200
62
10540
200–|250
27
6210
250–|300
7
1960
300–|350
3
960
tot
248
1 VARIABILITA’
11
Calcolare lo scostamento medio dalla mediana; lo scostamento medio dalla media
aritmetica; la varianza e lo scarto quadratico medio. Verificare numericamente la
relazione esistente tra SMe , SM1 e σ.
Svolgimento
Per prima cosa, è necessario calcolare la mediana e la media aritmetica della distribuzione. Completiamo perciò la seguente tabella.
Classi d’importo
0–|50
50–|100
100–|150
150–|200
200–|250
250–|300
300–|350
TOTALE
nj
8
70
71
62
27
7
3
248
T ot. di classe (Tj )
304
5600
8946
10540
6210
1960
960
34520
Cj
8
78
149
211
238
245
248
La posizione mediana è data da
pos(M e) =
N +1
248 + 1
=
= 124.5.
2
2
Scorrendo la colonna delle frequenze cumulate, riconosciamo che la classe (100; 150]
è la classe mediana. Il valore della mediana è pertanto:
M e = x(124.5) = 100 + [124.5 − 78 − 0.5] ·
(150 − 100)
= 132.39.
71
Utilizzando l’informazione relativa ai totali di classe, il calcolo della media aritmetica
si può effettuare nel seguente modo:
M1 =
304 + 5600 + 8946 + 10540 + 6210 + 1960 + 960
34520
=
= 139.19.
248
248
Utilizzando l’informazione sui totali di classe, calcoliamo per ciascuna classe un valore
rappresentativo x′j , dividendo ciascun totale di classe per la frequenza della classe.
Completiamo la seguente tabella.
Classi d’importo
0–|50
50–|100
100–|150
150–|200
200–|250
250–|300
300–|350
TOTALE
nj
8
70
71
62
27
7
3
248
Tot. di classe
304
5600
8946
10540
6210
1960
960
x′j
38
80
126
170
230
280
320
|x′j − M e| |x′j − M e| · nj
94.4
755.2
52.39
3667.3
6.39
453.69
37.61
2331.82
97.61
2635.47
147.61
1033.27
187.61
562.83
11439.58
1 VARIABILITA’
12
Lo scostamento medio dalla mediana è quindi
SM e =
7
11439.58
1 X ′
·
= 46.127
|xj − M e| · nj =
248 j=1
248
e tale valore indica che mediamente gli importi delle fatture si discostano dal loro
valore mediano di 46.127 (migliaia di euro).
Completando la seguente tabella
Classi
0–|50
50–|100
100–|150
150–|200
200–|250
250–|300
300–|350
TOTALE
nj
8
70
71
62
27
7
3
248
x′j
38
80
126
170
230
280
320
|x′j − M1 |
101.19
59.19
13.19
30.81
90.81
140.81
180.81
|x′j − M1 | · nj
809.52
4143.3
936.49
1910.22
2451.87
985.67
542.43
11779.50
(x′j − M1 )2
10239.4161
3503.4561
173.9761
949.2561
8246.4561
19827.4561
32692.2561
(x′j − M1 )2 · nj
81915.33
245241.93
12352.30
58853.88
222654.31
138792.19
98076.77
857886.71
calcoliamo agevolmente lo scostamento medio dalla media aritmetica:
SM 1 =
7
11779.50
1 X ′
·
= 47.498
|xj − M1 | · nj =
248 j=1
248
e tale valore indica che mediamente gli importi delle fatture si discostano dal loro
valore medio di 47.498 (migliaia di euro).
La varianza è data da:
7
857886.71
1 X ′
= 3459.22,
(xj − M1 )2 · nj =
σ =
248 j=1
248
2
lo scarto quadratico medio
v
r
u
7
u 1 X
857886.71
σ=t
= 58.815
(x′j − M1 )2 · nj =
248 j=1
248
e possiamo interpretare tale valore dicendo che mediamente gli importi delle fatture
differiscono dal loro valore medio di 58.815 (migliaia di euro).
É possibile verificare infine che vale la relazione
infatti
SM e ≤ SM 1 ≤ σ
46.127 < 47.498 < 58.815.
1 VARIABILITA’
13
7. Sia X un carattere quantitativo con media aritmetica M1 (X) = 5 e scarto quadratico
medio σ(X) = 1.5. Sia Y un altro carattere quantitativo tale che Y = 0.5 − 2X.
Determinare la media aritmetica e la varianza di Y .
Svolgimento
Dalla proprietà di linearità della media aritmetica, segue immediatamente che
M1 (Y ) = 0.5 − 2 · M1 (X) = 0.5 − 2 · 5 = −9.5.
A questo punto, calcoliamo la varianza di X
σ 2 (X) = (1.5)2 = 2.25
e ricordiamo la proprietà della varianza che afferma che se tra i caratteri X e Y
sussiste una relazione del tipo
Y =a+b·X
allora tra le varianze di X e Y , vale la relazione:
σ 2 (Y ) = b2 · σ 2 (X).
Applicando tale proprietà, utilizzando i valori a = 0.5 e b = −2 si ricava la varianza
di Y :
σ 2 (Y ) = 22 · σ 2 (X) = 4 · 2.25 = 9.
8. In un reparto produttivo, vengono impiegate tre macchine alle quali lavorano, rispettivamente, 4, 5 e 3 operai. La seguente tabella riporta i dati relativi alla produzione
oraria (per operaio e per macchina):
produzione oraria macchina 1
produzione oraria macchina 2
produzione oraria macchina 3
48
56
52
49
56
51
48
57
51
47
57
55
Determinare la varianza della produzione oraria dell’intero sistema col metodo indiretto; determinare inoltre la varianza fra e nei gruppi e verificare la proprietà di
scomposizione della varianza totale.
Svolgimento
Come prima cosa, dividiamo i 12 operai in K = 3 gruppi, a seconda della macchina
a cui lavorano: si avrà quindi il primo gruppo (di numerosità N1 pari a 4) composto
dagli operai che lavorano alla prima macchina, il secondo gruppo (di numerosità N2
pari a 5) formato dagli operai che lavorano alla seconda macchina e infine il terzo
gruppo (di numerosità N3 pari a 3) a cui appartengono gli operai che lavorano alla
terza macchina. A ciascun operaio è associato un numero che rappresenta la sua
produzione oraria.
1 VARIABILITA’
14
É possibile a questo punto calcolare, per ciascun gruppo, la produzione oraria media
(ovvero le medie parziali):
X̄1 = M1 (1a macchina) =
192
48 + 49 + 48 + 47
=
= 48
4
4
59 + 59 + 57 + 57 + 55
281
=
= 56.2
5
5
154
52 + 51 + 51
=
= 51.3̄.
X̄3 = M1 (3a macchina) =
3
3
X̄2 = M1 (2a macchina) =
La proprietà associativa della media aritmetica permette di calcolare la media aritmetica totale (ovvero la produzione media oraria complessiva):
X̄ =
48 · 4 + 56.2 · 5 + 51.3̄ · 3
X̄1 · N1 + X̄2 · N2 + X̄3 · N3
= 52.25.
=
N1 + N2 + N3
12
Per determinare la varianza della produzione oraria complessiva con il metodo indiretto è necessario applicare la formula:
2
σtot
N
1 X 2
=
x − M12 = M22 − M12 .
N i=1 i
Si completa la seguente tabella:
Numero
macchina
1
2
3
TOT
xi
x2i
48
49
48
47
56
56
57
57
55
52
51
51
628
2304
2401
2304
2209
3136
3136
3249
3249
3025
2704
2601
2601
32919
Quindi:
12
M22
1 X 2 32919
= 2743.25.
x =
=
12 i=1 i
12
1 VARIABILITA’
15
A questo punto si ricava immediatamente la varianza totale:
2
σtot
= 2743.25 − (52.25)2 = 13.1875.
Calcoliamo ora la varianza fra le produzioni medie delle singole macchine (ovvero la
varianza fra i gruppi).
Si ha quindi:
σF2 =
K
1 X
[X̄j − X̄]2 · Nj
N j=1
3
2
1 X
X̄j − X̄ · Nj
=
12 j=1
(48 − 52.25)2 · 4 + (56.2 − 52.25)2 · 5 + (51.3̄ − 52.25)2 · 3
12
152.7833
=
= 12.732.
12
=
Per determinare la varianza nei gruppi, è necessario innanzitutto calcolare le varianze
parziali.
Si ha quindi (utilizzando il metodo indiretto per il calcolo della varianza), che la
varianza del primo gruppo è:
σ12
482 + 492 + 482 + 472
− (48)2 = 0.5
=
4
quella del secondo gruppo:
σ22 =
562 + 562 + 572 + 572 + 552
− (56.2)2 = 0.56
5
e infine per il terzo gruppo:
σ32 =
522 + 512 + 512
− (51.3̄)2 = 0.2̄.
3
Il calcolo della media aritmetica ponderata delle varianze parziali (varianza nei
gruppi), è pertanto:
2
σN
=
K
3
1 X 2
1 X 2
0.5 · 4 + 0.56 · 5 + 0.2̄ · 3
= 0.4556.
σj · Nj =
σj · Nj =
N j=1
N j=1
12
A questo punto è possibile verificare la scomposizione della varianza totale:
1 VARIABILITA’
16
2
σN
+
σF2
=
2
σtot
0.4556
+
12.732
=
13.1876 (∼
= 13.1875)
Calcolando i rapporti di composizione:
•
2
0.4556
σN
= 0.0345 (= 3.45%)
=
2
σtot
13.1876
•
σF2
12.732
= 0.9655 (= 96.55%)
=
2
σtot
13.1876
è possibile notare che la varianza nei gruppi è il 3.45% della varianza totale e che la
varianza fra i gruppi è il 96.55% della varianza totale.
Da tali considerazioni possiamo concludere che la produzione risulta molto omogenea
per ogni macchina (cioè operai che lavorano alla stessa macchina hanno più o meno
la stessa produttività) ed eterogenea fra le varie macchine (cioè operai lavoranti a
macchine diverse hanno produttività differenti). Le differenze di produttività tra gli
operai sono dunque principalmente imputabili al fatto che utilizzano diversi macchinari.
9. La seguente tabella riporta la distribuzione del numero di alberghi delle due località
turistiche A e B di un comprensorio, secondo le classi di fatturato annuale (in milioni
di Euro):
classi di fatturato
fino a 1
Numero di Alberghi in A
15
Numero di Alberghi in B
25
1 |– 3
24
51
3 |– 5
85
67
5 |– 10
48
59
10 |– 20
40
31
20 |– 40
29
31
Tot
241
264
Si verifichi la scomposizione della varianza del fatturato annuo degli alberghi del comprensorio, commentando il risultato ottenuto.
Svolgimento
Per prima cosa, dividiamo in K = 2 gruppi gli alberghi del comprensorio: ovviamente
avremo un primo gruppo (di numerosità N1 pari a 241) formato dagli alberghi della
località A e un secondo gruppo (di numerosità N2 pari a 264) composto dagli alberghi
della località B.
Completiamo quindi la seguente tabella per agevolare i calcoli successivi (con nA
j
e con nB
si
sono
indicate
rispettivamente
le
frequenze
degli
alberghi
della
località
j
A e quelle degli alberghi della località B corrispondenti alla j-esima classe, mentre
lj− + lj+
xj =
(j = 1, ..., 6) indica il valore centrale di ogni classe).
2
1 VARIABILITA’
17
Classi di
fatturato
0 |– 1
1 |– 3
3 |– 5
5 |– 10
10 |– 20
20 |– 40
Totale
xj
x2j
nA
j
nB
j
B
nA
j + nj
0.5
2
4
7.5
15
30
0.25
4
16
56.25
225
900
15
24
85
48
40
29
241
25
51
67
59
31
31
264
40
75
152
107
71
60
505
A questo punto è possibile calcolare la media aritmetica del fatturato per gli alberghi
della località A:
6
1 X
0.5 · 15 + 2 · 24 + 4 · 85 + 7.5 · 48 + 15 · 40 + 30 · 29
X̄1 =
x j · nA
= 9.234
j =
N1 j=1
241
e per gli alberghi della località B:
6
1 X
0.5 · 25 + 2 · 51 + 4 · 67 + 7.5 · 59 + 15 · 31 + 30 · 31
X̄2 =
x j · nB
= 8.409.
j =
N2 j=1
264
La media aritmetica del fatturato degli alberghi di tutto il comprensorio è quindi,
utilizzando la proprietà associativa della media aritmetica:
9.234 · 241 + 8.409 · 264
= 8.803.
X̄ =
241 + 264
É possibile ora calcolare la varianza del fatturato degli alberghi di tutto il comprenB
sorio, utilizzando le frequenze totali nA
j + nj (ed il procedimento indiretto):
2
σtot
6
1 X 2
B
2
=
x · [nA
j + nj ] − X̄
N j=1 j
0.25 · 40 + 4 · 75 + 16 · 152 + 56.25 · 107 + 225 · 71 + 900 · 60
− (8.803)2
505
= 78.422.
=
Calcoliamo ora:
• la varianza nei gruppi
Si deve innanzitutto calcolare la varianza parziale di ciascun gruppo:
σ12
6
1 X 2 A
=
x · n − X̄12
N1 j=1 j j
0.25 · 15 + 4 · 24 + 16 · 85 + 56.25 · 48 + 225 · 40 + 900 · 29
− (9.234)2
241
39259.75
=
− 85.267 = 77.64.
241
=
1 VARIABILITA’
σ22
18
6
1 X 2 B
x · n − X̄22
=
N2 j=1 j j
0.25 · 25 + 4 · 51 + 16 · 67 + 56.25 · 59 + 225 · 31 + 900 · 31
− (8.409)2
264
39475
− 70.711 = 78.81
=
264
=
2
e quindi la varianza nei gruppi (σN
):
2
σN
=
σ12 · N1 + σ22 · N2
77.64 · 241 + 78.81 · 264
= 78.252;
=
N1 + N2
505
• la varianza fra gruppi
Il calcolo della varianza fra i gruppi è invece:
[(X̄1 − X̄)2 · N1 + (X̄2 − X̄)2 · N2 ]
N1 + N2
[(9.234 − 8.803)2 · 241 + (8.409 − 8.803)2 · 264]
=
505
85.750
= 0.1698.
=
505
σF2 =
In base ai risultati ottenuti, si verifica la scomposizione:
2
σN
+
σF2
=
2
σtot
78.252
+
0.1698
=
78.4218 (∼
= 78.422).
Calcolando i rapporti di composizione:
2
σN
78.252
= 0.9978 (= 99.78%)
=
2
σtot
78.422
0.1698
σ2
= 0.0022 (= 0.22%)
• 2F =
σtot
78.422
•
è possibile notare che la varianza nei gruppi è il 99.78% della varianza totale e che
la varianza fra i gruppi è solo lo 0.22% della varianza totale.
Da tali considerazioni possiamo concludere che la distribuzione dei fatturati degli
alberghi delle località A e B è omogenea (varianza fra i gruppi molto piccola) e che in
entrambe le località esistono alberghi con fatturati molto diversi (varianza nei gruppi
molto grande). Le differenze tra i fatturati degli alberghi non sono dunque imputabili
alla diversa collocazione geografica (località A o B).
1 VARIABILITA’
19
10. Nel 1981 gli ospedali in Italia erano 1826 ripartiti per tipo come segue: ospedali
generali 1345, ospedali specialistici 295, ospedali psichiatrici 186. Per ogni ospedale
è stato rilevato il numero di posti letto ottenendo le informazioni seguenti:
n. medio di posti letto
scarto quadratico medio dei posti letto
osp. generali
318,51
445,96
osp. specialist.
215,58
259,54
osp. psichiatr.
407,22
.
477,84
Si determini il numero medio di posti letto per il complesso di ospedali e la varianza
della stessa variabile, commentando il risultato.
Svolgimento
In questo caso, riconosciamo K = 3 gruppi di numerosità N1 = 1345, N2 = 295 e
N3 = 186, formati rispettivamente dagli ospedali generali, dagli ospedali specialistici
e dagli ospedali psichiatrici.
Avendo le medie della variabile “numeri di posti letto” per ciascun gruppo, è possibile
calcolare la media aritmetica totale, utilizzando la proprietà associativa della media
aritmetica:
X̄ =
3
1 X
318.51 · 1345 + 215.58 · 295 + 407.22 · 186
567734.97
X̄j ·Nj =
=
= 310.917.
N j=1
1345 + 295 + 186
1826
Per calcolare la varianza totale, è necessario utilizzare la sua scomposizione in varianza nei gruppi più varianza fra i gruppi.
La varianza nei gruppi è perciò (indicando con σj2 la varianza del j-esimo gruppo):
2
σN
3
1 X 2
σ · Nj
=
N j=1 j
(445.96)2 · 1345 + (259.54)2 · 295 + (477.84)2 · 186
1826
329835109.2
=
= 180632.59.
1826
=
La varianza fra i gruppi è:
σF2 =
3
1 X
[X̄j − X̄]2 · Ni
N j=1
[318.51 − 310.917]2 · 1345 + [215.58 − 310.917]2 · 295 + [407.22 − 310.917]2 · 186
1826
4483855.323
=
= 2455.56.
1826
=
La varianza totale è quindi pari a:
1 VARIABILITA’
20
2
σtot
=
2
σN
183088.15
=
180632.59
σF2
+
+ 2455.56.
Calcolando i rapporti di composizione:
2
180632.59
σN
= 0.9866 (= 98.66%)
• 2 =
σtot
183088.15
σ2
2455.56
• 2F =
= 0.0134 (= 1.34%)
σtot
183088.15
è possibile notare che la varianza nei gruppi è il 98.66% della varianza totale e che
la varianza fra i gruppi è l’1.34% della varianza totale.
Da tali considerazioni possiamo concludere che ogni gruppo è molto eterogeneo al
suo interno (varianza nei gruppi alta): nell’ambito di ciascuna tipologia di ospedale
(generale, specialistico, psichiatrico) il numero di posti letto è molto variabile da ospedale a ospedale, mentre vi è una forte omogeneità tra le varie tipologie di ospedale
(bassa varianza fra i gruppi). Le differenze tra il numero di posti letto degli ospedali
non sono dunque imputabili alla diversa tipologia degli ospedali.
11. Il reddito annuo (in migliaia di euro) di sette individui è rispettivamente pari a 15,
20, 12, 10, 18, 30, 35. Determinare e interpretare la differenza media e con ripetizione
del reddito.
Svolgimento
Per agevolare i conti, completiamo la seguente tabella scrivendo nella cella (i, j), la
quantità |xi − xj |:
xj
xi
15
20
12
10
18
30
35
15
20
12
10
18
30
35
0
5
3
5
3
15
20
5
0
8
10
2
10
15
3
8
0
2
6
18
23
5
10
2
0
8
20
25
3
2
6
8
0
12
17
15
10
18
20
12
0
5
20
15
23
25
17
5
0
464
Si ottiene in questo modo che:
N X
N
X
S
1
1
∆=
=
·
· 464 = 11.048
|xi − xj | =
N (N − 1)
N (N − 1) i=1 j=1
7·6
1 VARIABILITA’
21
e tale valore indica che mediamente i redditi dei sette individui differiscono tra loro
per 11.048 migliaia di euro.
Inoltre
N
N
S
1 XX
1
∆R = 2 = 2 ·
|xi − xj | = 2 · 464 = 9.469.
N
N i=1 j=1
7
e tale valore indica che mediamente i redditi dei sette individui differiscono tra loro
(e con loro stessi) per 9.469 migliaia di euro.
Un ulteriore modo per calcolare il numeratore S delle differenze medie è dato da:
S =2·
N X
i
X
i=1 j=1
|x(i) − x(j) |.
Illustriamo il calcolo del numeratore S attraverso quest’ultima formula.
Per prima cosa, è necessario ordinare i valori xj :
x(1) = 10
x(2) = 12
x(3) = 15
x(4) = 18
x(5) = 20
x(6) = 30
x(7) = 35
e completare la parte sotto la diagonale principale della seguente tabella, scrivendo
nella cella (i, j) la quantità |x(i) − x(j) |.
x(j)
x(i)
10
12
15
18
20
30
35
10
12
15
18
20
30
35
0
2
5
8
10
20
25
0
3
6
8
18
23
0
3
5
15
20
0
2
12
17
0
10
15
0
5
0
Somme parziali
per riga
0
2
8
17
25
75
105
232
Si ha pertanto che
S =2·
N X
i
X
i=1 j=1
|x(i) − x(j) | = 2 · 232 = 464
e quindi, come volevasi dimostrare:
∆=
464
S
=
= 11.048
N (N − 1)
7·6
1 VARIABILITA’
22
∆R =
464
S
=
= 9.469.
N2
72
Giusto per completezza, viene riportato un ulteriore metodo di calcolo per il numeratore S.
Completando la seguente tabella:
j
1
2
3
4
5
6
7
x(j)
10
12
15
18
20
30
35
2j − N − 1 x(j) (2j − N − 1)
-6
-60
-4
-48
-2
-30
0
0
2
40
4
120
6
210
232
possiamo calcolare S nel seguente modo:
S =2·
7
X
j=1
x(j) (2j − N − 1) = 2 · 232 = 464
e quindi ritrovare gli stessi valori calcolati precedentemente per ∆ e ∆R .
12. La distribuzione del prezzo del pane al chilogrammo nei capoluoghi di 27 province
nel 1970 e nel 1989 è riportata nella seguente tabella:
prezzo lire al kg. 1970
frequenze
prezzo lire al kg. 1989
frequenze
700
1
2100
2
800
4
2500
3
900
2
2600
2
950
3
2950
4
1000
7
3000
6
1200
10
3600
10
tot
27
.
tot
27
a) Determinare la differenza media semplice e con ripetizione del prezzo del pane nel
1970;
b) Si può dire che dal 1970 al 1989 ci sia stato un aumento della variabilità del fenomeno?
Svolgimento
a) Ricordando che in questo caso N = 27, completiamo la seguente tabella che
agevolerà il calcolo delle differenze medie.
1 VARIABILITA’
23
xj
700
800
900
950
1000
1200
Totale
nj
1
4
2
3
7
10
27
Cj
1
5
7
10
17
27
2Cj − N − nj
-26
-21
-15
-10
0
17
nj (2Cj − N − nj )
-26
-84
-30
-30
0
170
xj nj (2Cj − N − nj )
-18200
-67200
-27000
-28500
0
204000
63100
Utilizzando la formula per il calcolo del numeratore S, la differenza media
semplice è quindi data da:
6
X
S
2
2
∆=
=
·
·63100 = 179.77.
xj nj (2Cj −N −nj ) =
N (N − 1)
N (N − 1) j=1
27 · 26
Tale valore indica che i prezzi del pane nei 27 capoluoghi nel 1970 differiscono
mediamente tra loro di 179.77 lire.
La differenza media con ripetizione è data da:
∆R =
6
2 X
2
S
=
·
· 63100 = 173.11.
x
n
(2C
−
N
−
n
)
=
j
j
j
j
N2
N 2 j=1
(27)2
Tale valore indica che i prezzi del pane nei 27 capoluoghi nel 1970 differiscono
mediamente tra loro (e con loro stessi) di 173.11 lire.
b) Osservando i valori del prezzo del pane nei due anni presi in esame, è facile rendersi conto che l’ordine di grandezza è differente, ragion per cui per confrontare
le variabilità dei prezzi del pane nei due anni (1970 e 1989) è necessario ricorrere
a indici relativi di variabilità.
Poichè al punto precedente abbiamo calcolato sulla distribuzione dei prezzi del
1970 gli indici ∆ e ∆R , la scelta più ovvia è quella di confrontare la variabilità
dei prezzi del 1970 e del 1989 con gli indici relativi:
∆
∆R
o
.
M1 M1
Per completezza, tuttavia, calcoliamo anche gli altri indici relativi noti:
σ
SM 1 SM e
,
e
.
M1 M1
M1
Calcoliamo perciò la mediana e la media aritmetica relative all’anno 1970:
M e(1970) = x( N +1 ) = x( 27+1 ) = x(14) = 1000
2
2
(1970)
M1
=
700 · 1 + 800 · 4 + 900 · 2 + 950 · 3 + 1000 · 7 + 1200 · 10
= 1020.37
27
1 VARIABILITA’
24
e la mediana e la media aritmetica relative all’anno 1989:
M e(1989) = x( N +1 ) = x( 27+1 ) = x(14) = 3000
2
2
2100 · 2 + 2500 · 3 + 2600 · 2 + 2950 · 4 + 3000 · 6 + 3600 · 10
= 3062.96
27
Si completa la seguente tabella, relativa all’anno 1970:
(1989)
M1
xj
700
800
900
950
1000
1200
Totale
=
nj
1
4
2
3
7
10
27
|xj − M e|
300
200
100
50
0
200
|xj − M e|nj
300
800
200
150
0
2000
3450
|xj − M1 |
320.37
220.37
120.37
70.37
20.37
179.63
|xj − M1 |nj
320.37
881.48
240.74
211.11
142.59
1796.3
3592.59
(xj − M1 )2
102636.94
48562.93
14488.94
4951.94
414.94
32266.94
(xj − M1 )2 nj
102636.94
194251.72
28977.88
14855.82
2904.58
322669.4
666296.34
grazie alla quale è possibile calcolare
(1970)
SM e
6
1 X
3450
= 127.7̄
=
|xj − M e(1970) | · nj =
N j=1
27
6
1 X
3592.59
(1970)
=
|xj − M1
| · nj =
= 133.059
N j=1
27
v
r
u
6
u1 X
666296.34
(1970) 2
(xj − M1
) · nj =
= 159.07.
=t
N j=1
27
(1970)
SM 1
σ (1970)
Completiamo l’analoga tabella relativa all’anno 1989:
xj
2100
2500
2600
2950
3000
3600
Totale
nj
2
3
2
4
6
10
27
|xj − M e|
900
500
400
50
0
600
|xj − M e|nj
1800
1500
800
200
0
6000
10300
|xj − M1 |
962.96
562.96
462.96
112.96
62.96
537.04
|xj − M1 |nj
1925.92
1688.88
925.92
451.84
377.76
5370.4
10740.72
(xj − M1 )2
927291.96
316923.96
214331.96
12759.96
3963.96
288411.96
grazie alla quale è possibile calcolare
(1989)
6
1 X
10300
= 381.48
|xj − M e(1989) | · nj =
N j=1
27
SM e
=
(1989)
SM 1
6
1 X
10740.72
(1989)
= 397.8
=
|xj − M1
| · nj =
N j=1
27
(xj − M1 )2 nj
1854583.92
950771.88
428663.92
51039.84
23783.76
2884119.6
6192962.92
1 VARIABILITA’
25
σ (1989)
v
r
u
6
u1 X
6192962.92
(1989)
= 478.92.
(xj − M1
)2 · nj =
=t
N j=1
27
Ricordiamo infine di aver calcolato, per l’anno 1970,
∆(1970) = 179.77
e
(1970)
∆R
= 173.11.
Completiamo l’analoga tabella (relativa all’anno 1989):
xj
2100
2500
2600
2950
3000
3600
nj
2
3
2
4
6
10
Cj
2
5
7
11
17
27
2Cj − N − nj
-25
-20
-15
-9
1
17
xj nj · (2Cj − N − nj )
-105000
-150000
-78000
-106200
18000
612000
190800
grazie alla quale possiamo calcolare
∆(1989) =
6
X
1
S
2 · 190800
=
·2
= 543.59
xj nj ·(2Cj −N −nj ) =
N (N − 1)
N (N − 1) j=1
27 · 26
e
(1989)
∆R
6
X
S
1
2 · 190800
= 2 = 2 ·2
= 523.45.
xj nj · (2Cj − N − nj ) =
N
N
272
j=1
Riassumiamo nella seguente tabella i valori calcolati sia per l’anno 1970 che per
l’anno 1989:
Me
M1
SM e
SM 1
σ
∆
∆R
Anno 1970
1000
1020.37
127.7̄
133.059
157.09
179.77
173.11
Anno 1989
3000
3062.96
381.48
397.805
478.92
543.59
523.45
É possibile a questo punto calcolare i seguenti indici relativi di variabilità:
1 VARIABILITA’
26
Anno 1970
Anno 1989
SM e
:
M1
127.7̄
= 0.1252 >
1020.37
381.48
= 0.1245
3062.96
SM 1
:
M1
133.059
= 0.1304 >
1020.37
397.805
= 0.1299
3062.96
157.09
= 0.1540 <
1020.37
478.92
= 0.1564
3062.96
∆
:
M1
179.77
= 0.1762 <
1020.37
543.59
= 0.1774
3062.96
∆R
:
M1
173.11
= 0.1696 <
1020.37
523.45
= 0.1708
3062.96
CV =
σ
:
M1
Il valore 0.1252 indica che lo scostamento dalla mediana del prezzo del pane nel
1970 è pari al 12.52% della media aritmetica.
Il valore 0.1245 indica che lo scostamento dalla mediana del prezzo del pane nel
1989 è pari al 12.45% della media aritmetica.
Il valore 0.1304 indica che lo scostamento dalla media aritmetica del prezzo del
pane nel 1970 è pari al 13.04% della media aritmetica.
Il valore 0.1299 indica che lo scostamento dalla media aritmetica del prezzo del
pane nel 1989 è pari al 12.99% della media aritmetica.
Il valore 0.1540 indica che lo scarto quadratico medio del prezzo del pane nel
1970 è pari al 15.40% della media aritmetica.
Il valore 0.1564 indica che lo scarto quadratico medio del prezzo del pane nel
1989 è pari al 15.64% della media aritmetica.
Il valore 0.1762 indica che la differenza media semplice del prezzo del pane nel
1970 è pari al 17.62% della media aritmetica.
Il valore 0.1774 indica che la differenza media semplice del prezzo del pane nel
1989 è pari al 17.74% della media aritmetica.
Il valore 0.1696 indica che la differenza media con ripetizione del prezzo del pane
nel 1970 è pari al 16.96% della media aritmetica.
Il valore 0.1708 indica che la differenza media con ripetizione del prezzo del pane
nel 1989 è pari al 17.08% della media aritmetica.
Attraverso il confronto dei valori assunti dagli indici relativi di variabilità calcolati, si può concludere che la variabilità del prezzo del pane dei 27 capoluoghi
1 VARIABILITA’
27
presi in esame nel 1989 non è sensibilmente aumentata rispetto al 1970.
13. La classificazione di due gruppi di ditte produttrici di olio d’oliva, che vendono rispettivamente il proprio prodotto a peso (gruppo A) e a volume (gruppo B), ha dato luogo
alle seguenti distribuzioni di frequenze:
gruppo A prezzo euro al kg
n. ditte
gruppo B prezzo euro al litro
n. ditte
2–|3
40
2–|3
100
3–|3,5
90
3–|3,5
80
3,5–|4
200
3,5–|4
70
4–|4,5
110
4–|4,5
30
4,5–|5
60
.
4,5–|5
20
Quale delle due distribuzioni presenta maggiore variabilità? Si effettui il confronto
utilizzando indici basati sullo scostamento medio dalla media aritmetica, sullo scostamento medio dalla mediana, sullo scarto quadratico medio e sulla differenza media
semplice.
Svolgimento
Per prima cosa, completiamo la seguente tabella per agevolare il calcolo della mediaB
na e della media aritmetica per ciascuno dei due gruppi (si indicano con nA
j e nj le
frequenze dei gruppi A e B, inoltre con N A si è indicata la numerosità complessiva del
lj− + lj+
B
gruppo A e con N quella del gruppo B, infine xj =
indica il valore centrale
2
di ogni classe).
classi di prezzo
2–|3
3–|3.5
3.5–|4
4–|4.5
4.5–|5
Totale
xj
2.5
3.25
3.75
4.25
4.75
nA
j
40
90
200
110
60
500
nB
j
100
80
70
30
20
300
CjA
40
130
330
440
500
CjB
100
180
250
280
300
x j nA
j
100
293
750
468
285
1895
x j nB
j
250
260
263
128
95
995
É possibile ora calcolare la mediana per ciascuno dei due gruppi:
0.5
M eA = x N A +1 = x( 500+1 ) = x(250.5) = 3.5 + [250.5 − 130 − 0.5] ·
= 3.8
2
2
200
0.5
M eB = x N B +1 = x( 300+1 ) = x(150.5) = 3 + [150.5 − 130 − 0.5] ·
= 3.3125
2
2
80
e le medie aritmetiche:
M1A
5
1895
1 X
x j nA
= 3.79
= A
j =
N j=1
500
1 VARIABILITA’
28
M1B
5
1 X
995
= B
x j nB
= 3.316̄.
j =
N j=1
300
Completiamo quindi la tabella relativa al gruppo A:
xj
2.5
3.25
3.75
4.25
4.75
Totale
nA
j
40
90
200
110
60
500
|xj − M eA |
1.3
0.55
0.05
0.45
0.95
|xj − M eA |nA
j
52
49.5
10
49.5
57
218
|xj − M1A |
1.29
0.54
0.04
0.46
0.96
|xj − M1A |nA
j
51.6
48.6
8
50.6
57.6
216.4
x2j
6.25
10.5625
14.0625
18.0625
22.5625
x2j nA
j
250
950.625
2812.5
1986.875
1353.75
7353.75
da cui ricaviamo
A
SM
e
5
1 X
218
= A
|xj − M eA | · nA
= 0.436
j =
N j=1
500
A
SM
=
1
5
216.4
1 X
A
A
|x
−
M
|
·
n
=
= 0.4328
j
1
j
N A j=1
500
v
r
u
5
X
u
√
1
7353.75
A 2
2 =
0.3434 = 0.586.
−
[M
]
=
x2j · nA
−
(3.79)
σA = t A
1
j
N j=1
500
Completiamo anche la seguente tabella (sempre relativa al gruppo A):
xj
2.5
3.25
3.75
4.25
4.75
nA
j
40
90
200
110
60
CjA
40
130
330
440
500
2CjA − N A − nA
j
-460
-330
-40
270
440
A
A
A
x j nA
j · (2Cj − N − nj )
-46000
-96525
-30000
126225
125400
79100
grazie alla quale possiamo calcolare
5
X
1
S
2 · 79100
A
A
A
= A A
·2
= 0.6341.
∆ = A A
x j nA
j ·(2Cj −N −nj ) =
N (N − 1)
N (N − 1) j=1
500 · 499
A
Calcoliamo ora le stesse grandezze per il gruppo B:
1 VARIABILITA’
xj
2.5
3.25
3.75
4.25
4.75
Totale
29
nB
j
100
80
70
30
20
500
|xj − M eB |
0.813
0.063
0.438
0.938
1.438
|xj − M eB |nB
j
81.3
5.04
30.66
28.14
28.76
173.9
|xj − M1B |
−0.816̄
0.06̄
0.43̄
0.93̄
1.43̄
|xj − M1B |nB
j
81.6̄
5.3̄
30.3̄
28
28.6̄
174
x2j
6.25
10.5625
14.0625
18.0625
22.5625
x2j nB
j
625
845
984.375
541.875
451.25
3447.5
da cui ricaviamo
B
SM
e
5
173.9
1 X
|xj − M eB | · nB
= 0.579
= B
j =
N j=1
300
B
SM
1
5
174
1 X
|xj − M1B | · nB
= 0.58
= B
j =
N j=1
300
v
r
u
5
X
u
√
1
3447.5
B 2
2 =
x2j · nB
−
[M
]
=
σB = t B
−
(3.31
6̄)
0.4914 = 0.701.
1
j
N j=1
300
Completiamo anche la seguente tabella (sempre relativa al gruppo B):
xj
2.5
3.25
3.75
4.25
4.75
nB
j
100
80
70
30
20
CjB
100
180
250
280
300
2CjB − N B − nB
j
-200
-20
130
230
280
B
B
B
x j nB
j · (2Cj − N − nj )
-50000
-5200
34125
29325
26600
34850
grazie alla quale possiamo calcolare
5
X
S
1
2 · 34850
B
B
B
∆ = B B
= B B
·2
= 0.777.
x j nB
j ·(2Cj −N −nj ) =
N (N − 1)
N (N − 1) j=1
300 · 299
B
É possibile a questo punto calcolare i seguenti indici relativi di variabilità:
1 VARIABILITA’
30
Gruppo A
SM e
:
M1
SM 1
:
M1
CV =
σ
:
M1
∆
:
M1
Gruppo B
<
0.579
= 0.1746
3.316̄
0.4328
= 0.1142 <
3.79
0.58
= 0.1749
3.316̄
0.586
= 0.1546
3.79
<
0.701
= 0.2114
3.316̄
0.6341
= 0.1673 <
3.79
0.777
= 0.2343
3.316̄
0.436
= 0.115
3.79
Confrontando i valori degli indici relativi di variabilità, si può concludere che presenta
maggiore variabilità la distribuzione delle ditte del gruppo B.
14. Nella seguente tabella sono riportate le distribuzioni per destinazione dei viaggi di
vacanza (V ) e dei viaggi di lavoro (W ) effettuati dagli italiani nel 1998 (dati in
migliaia):
Destinazione
V
W
Italia
67682 10944
Paesi UE
7238 1984 .
Resto d’Europa
1989
378
Resto del mondo 2236
501
Si valuti, con un opportuno indice basato sulle differenze medie, quale delle due distribuzioni V e W presenta la variabilità più elevata. Si interpretino i valori assunti
dall’indice per le due distribuzioni.
Svolgimento
Riconosciamo innanzitutto che abbiamo a che fare con una distribuzione di unità e
che la popolazione statistica è costituita da 4 unità (N = 4).
Per calcolare la differenza media per i viaggi di vacanza (V ), completiamo la seguente
tabella, in cui le osservazioni sono state ordinate in modo crescente secondo i valori
del carattere.
Destinazione
Resto d’Europa
Resto del mondo
Paesi EU
Italia
Totale
i
1
2
3
4
v(i)
1989
2236
7238
67682
79145
2i − N − 1 v(i) · (2i − N − 1)
-3
-5967
-1
-2236
1
7238
3
203046
202081
1 VARIABILITA’
31
Possiamo pertanto calcolare la differenza media:
4
X
2
2
·
· 202081 = 33680.17,
v(i) · (2i − N − 1) =
∆(V ) =
N (N − 1) i=1
4·3
la media aritmetica:
4
1X
79145
M1 (V ) =
= 19786.25
vi =
4 i=1
4
e quindi l’indice relativo di variabilità:
∆(V )
33680.17
=
= 1.702
M1 (V )
19786.25
che indica che la differenza media semplice del numero di viaggi di vacanza è il 170.2%
della corrispondente media aritmetica.
Consideriamo ora il carattere W :
Destinazione
Resto d’Europa
Resto del mondo
Paesi EU
Italia
Totale
i
1
2
3
4
w(i)
378
501
1984
10944
13807
2i − N − 1 w(i) · (2i − N − 1)
-3
-1134
-1
-501
1
1984
3
32832
33181
Possiamo pertanto calcolare la differenza media:
∆(W ) =
4
X
2
2
·
· 33181 = 5530.16̄,
w(i) · (2i − N − 1) =
N (N − 1) i=1
4·3
la media aritmetica:
4
1X
13807
M1 (W ) =
= 3451.75
wi =
4 i=1
4
e quindi l’indice relativo di variabilità:
5530.16
∆(W )
=
= 1.602.
M1 (W )
3451.75
che indica che la differenza media semplice del numero di viaggi di lavoro è il 160.2%
della corrispondente media aritmetica.
Riconoscendo che
∆(V )
∆(W )
= 1.702 > 1.602 =
M1 (V )
M1 (W )
si può concludere che la distribuzione V presenta maggiore variabilità.
1 VARIABILITA’
32
15. Una fabbrica produce tubi catodici televisivi di due tipi. Per il tipo A si ha una
durata media di 1495 ore e uno scarto quadratico medio di 280 ore. Per il tipo B si
ha una durata media di 1875 ore ed uno scarto quadratico medio di 310 ore. Fornire
una misura della variabilità relativa e commentare il risultato.
Svolgimento
Un indice di variabilità relativa per i tubi di tipo A è dato da:
280
σA
=
= 0.19
A
1495
M1
e tale valore indica che lo scarto quadratico medio della durata dei tubi del tipo A è
il 19% della corrispondente durata media.
Per quanto riguarda i tubi del tipo B si ha:
σB
310
= 0.17.
=
B
1875
M1
e tale valore indica che lo scarto quadratico medio della durata dei tubi del tipo B è
il 17% della corrispondente durata media.
Riconoscendo che
σB
σA
=
0.19
>
0.17
=
M1A
M1B
si può concludere che la distribuzione delle durate dei tubi catodici del gruppo A
presenta maggiore variabilità rispetto a quella del gruppo B.
Fly UP