Comments
Description
Transcript
Esercizi sulla variabilità
STATISTICA esercizi svolti sulla VARIABILITA’ 1 1 VARIABILITA’ 1 2 VARIABILITA’ 1.1 Esercizi 1. La seguente tabella riporta il tempo (in giorni) impiegato da sei individui per il consumo di una confezione di pasta da 250 grammi: 1 3 5 6 15 30 . Si calcolino: lo scostamento medio dalla mediana, lo scostamento medio dalla media aritmetica e lo scarto quadratico medio, commentando i risultati ottenuti. Svolgimento Per prima cosa, notiamo che i valori forniti dal testo sono già ordinati: per maggiore chiarezza, comunque li riportiamo di seguito: x(1) = 1 x(2) = 3 x(3) = 5 x(4) = 6 x(5) = 15 x(6) = 30. Dato che il loro numero è pari (N = 6), si hanno due posizioni centrali: N =3 2 , N + 1 = 4. 2 La mediana è pertanto: x(3) + x(4) 5+6 = = 5.5. 2 2 Il valore assunto dalla mediana dice che nel 50% dei casi circa, la durata di un pacchetto di pasta è minore di 5.5 giorni. Analogamente, nel 50% dei casi circa, la durata di un pacchetto di pasta è superiore a 5.5 giorni. La media aritmetica è data da 6 1X 1 + 3 + 5 + 6 + 15 + 30 M1 = = 10. xi = 6 i=1 6 Per calcolare lo scostamento medio dalla mediana e dalla media aritmetica e lo scarto quadratico medio, è necessario completare la seguente tabella: xi 1 3 5 6 15 30 Totale |xi − M e| 4.5 2.5 0.5 0.5 9.5 24.5 42 |xi − M1 | (xi − M1 )2 9 81 7 49 5 25 4 16 5 25 20 400 50 596 1 VARIABILITA’ 3 Si ha quindi che lo scostamento medio dalla mediana è 6 SM e 42 1X |xi − M e| = =7 = 6 i=1 6 e indica che mediamente le durate del pacchetto di pasta differiscono (si discostano) dalla durata mediana di 7 giorni. Lo scostamento medio dalla media aritmetica è: 6 SM 1 1X 50 = = 8.3̄ |xi − M1 | = 6 i=1 6 e indica che mediamente le durate del pacchetto di pasta differiscono (si discostano) dalla durata media di 8.3̄ giorni. Lo scarto quadratico medio è: v r u 6 u1 X 596 σ=t = 9.967 (xi − M1 )2 = 6 i=1 6 e indica che mediamente le durate del pacchetto di pasta differiscono dalla durata media di 9.967 giorni. 2. La seguente tabella fornisce il reddito annuo di sette individui: individui A B C D E reddito (in migliaia di euro) 15 20 12 10 18 F 30 G . 35 Calcolare lo scostamento medio dalla mediana, lo scostamento medio dalla media aritmetica, lo scarto quadratico medio, la devianza e la varianza. Svolgimento Per prima cosa, ordiniamo in ordine crescente i valori forniti dal testo: x(1) = 10 x(2) = 12 x(3) = 15 x(4) = 18 x(5) = 20 x(6) = 30 x(7) = 35. Dato che il loro numero è dispari (N = 7), la posizione mediana è data da: N +1 8 = = 4. 2 2 La mediana è pertanto: x(4) = 18. Il valore assunto dalla mediana dice che circa il 50% dei redditi (dei 7 individui presi in esame) è minore di 18 (migliaia di euro). Analogamente, circa il 50% dei redditi 1 VARIABILITA’ 4 (dei 7 individui presi in esame) è maggiore di 18 (migliaia di euro). La media aritmetica è data da 7 1X 15 + 20 + 12 + 10 + 18 + 30 + 35 = 20. M1 = xi = 7 i=1 7 Per calcolare lo scostamento dalla mediana e dalla media aritmetica e lo scarto quadratico medio, è necessario completare la seguente tabella: |xi − M e| 3 2 6 8 0 12 17 48 xi 15 20 12 10 18 30 35 TOTALE |xi − M1 | (xi − M1 )2 5 25 0 0 2 4 10 100 8 64 10 100 15 225 50 518 Si ha quindi che lo scostamento medio dalla mediana è 7 SM e 1X 48 = |xi − M e| = = 6.857 7 i=1 7 e indica che mediamente i redditi (dei 7 individui presi in esame) differiscono (si discostano) dal reddito mediano di 6.857 migliaia di euro. Lo scostamento medio dalla media aritmetica è: 7 SM 1 = 50 1X = 7.143 |xi − M1 | = 7 i=1 7 e indica che mediamente i redditi (dei 7 individui presi in esame) differiscono (si discostano) dal reddito medio di 7.143 migliaia di euro. Lo scarto quadratico medio è: v r u 7 u1 X 518 σ=t = 8.6023 (xi − M1 )2 = 7 i=1 7 e indica che mediamente i redditi (dei 7 individui presi in esame) differiscono dal reddito medio di 8.6023 migliaia di euro. 1 VARIABILITA’ 5 Avendo calcolato lo scarto quadratico medio, è possibile calcolare la varianza elevandolo al quadrato: 7 518 1X 2 (xi − M1 )2 = = 74. σ = 7 i=1 7 Dalla tabella precedente, si ricava immediatamente anche la devianza: Dev = 7 X i=1 (xi − M1 )2 = 518. 3. La seguente tabella fornisce la distribuzione delle 100 famiglie di un quartiere secondo il carattere X = “numero di figli”: numero di figli frequenze assolute 0 30 1 15 2 20 3 12 4 10 5 9 6 . 4 Determinare: a) il campo di variazione; b) la differenza interquartile; c) la varianza con il metodo indiretto; d) lo scostamento medio dalla media aritmetica; e) lo scostamento medio dalla mediana. Svolgimento Come prima cosa, conviene riscrivere la tabella fornita dal testo nel seguente modo, calcolando anche le frequenze cumulate: N umero di f igli (xj ) nj 0 30 1 15 2 20 3 12 4 10 5 9 6 4 Totale 100 Cj 30 45 65 77 87 96 100 É possibile ora calcolare: a) Il campo di variazione x(N ) − x(1) = x(100) − x(1) = 6 − 0 = 6. Tale valore indica che la lunghezza dell’intervallo in cui sono compresi i valori del carattere X (numero di figli) è pari a 6. 1 VARIABILITA’ 6 b) La differenza interquartile Q3 − Q1 = x(3· N +1 ) − x( N +1 ) = x(75.75) − x(25.25) = 3 − 0 = 3. 4 4 Tale valore indica che il 50% delle famiglie analizzate hanno un numero di figli compreso in un intervallo di ampiezza 3. c) La varianza (con il metodo indiretto) 7 1 X 2 σ = x nj − M12 = M22 − M12 . N j=1 j 2 La seguente tabella xj 0 1 2 3 4 5 6 TOT nj 30 15 20 12 10 9 4 100 x j nj 0 15 40 36 40 45 24 200 x2j 0 1 4 9 16 25 36 x2j nj 0 15 80 108 160 225 144 732 permette di calcolare: 7 1 X 200 M1 = =2 x j nj = 100 j=1 100 e 7 M22 732 1 X 2 x j nj = = 7.32. = 100 j=1 100 Quindi σ 2 = 7.32 − (2)2 = 3.32 d) Lo scostamento medio dalla media aritmetica. La seguente tabella xj 0 1 2 3 4 5 6 TOT nj 30 15 20 12 10 9 4 100 |xj − M1 | |xj − M1 | · nj 2 60 1 15 0 0 1 12 2 20 3 27 4 16 150 1 VARIABILITA’ 7 permette di calcolare lo scostamento medio da M1 : SM 1 = 7 150 1 X · = 1.5. |xj − M1 | · nj = 100 j=1 100 Tale valore indica che mediamente il numero di figli (delle 100 famiglie prese in esame) differisce (si discosta) dal loro valore medio di 1.5 figli. e) Lo scostamento medio dalla mediana. Per prima cosa, si calcola la mediana: ricordando che N = 100 e utilizzando le frequenze cumulate precedentemente calcolate, si ha M e = x( N +1 ) = x(50.5) = 2. 2 In questo caso, quindi M e = M1 = 2: si avrà di conseguenza che SM e = SM1 = 1.5. É possibile quindi affermare che mediamente il numero di figli (delle 100 famiglie prese in esame) differisce (si discosta) dal loro valore mediano di 1.5 figli. 4. La seguente tabella riporta la distribuzione del carattere X= “numero di stanze” di 120 abitazioni della provincia di Belluno: N umero di stanze (xj ) 1 nj 5 2 22 3 32 4 35 5 16 6 7 7 8 . 2 1 Calcolare il campo di variazione, la differenza interquartile, lo scarto quadratico medio e lo scostamento medio dalla media aritmetica. Svolgimento Come prima cosa, conviene riscrivere la tabella fornita dal testo nel seguente modo, calcolando anche le frequenze cumulate: xj 1 2 3 4 5 6 7 8 TOTALE nj 5 22 32 35 16 7 2 1 120 Cj 5 27 59 94 110 117 119 120 1 VARIABILITA’ 8 É possibile ora calcolare: a) Il campo di variazione x(N ) − x(1) = x(120) − x(1) = 8 − 1 = 7. Tale valore indica che la lunghezza dell’intervallo in cui sono compresi i valori del carattere X (numero di stanze) è pari a 7. b) La differenza interquartile Q3 − Q1 = x(3· N +1 ) − x( N +1 ) = x(90.75) − x(30.25) = 4 − 3 = 1. 4 4 Tale valore indica che il 50% delle abitazioni prese in esame hanno un numero di stanze compreso in un intervallo di ampiezza pari a 1. c) Lo scarto quadratico medio e lo scostamento medio dalla media aritmetica. Per prima cosa, è necessario calcolare la media aritmetica. Si completa pertanto la seguente tabella. xj 1 2 3 4 5 6 7 8 TOT nj 5 22 32 35 16 7 2 1 120 x j nj 5 44 96 140 80 42 14 8 429 la quale, permette di calcolare: 8 M1 = 1 X 429 = 3.575 x j nj = 120 j=1 120 Completando la seguente tabella xj 1 2 3 4 5 6 7 8 TOT nj 5 22 32 35 16 7 2 1 120 |xj − M1 | 2.575 1.575 0.575 0.425 1.425 2.425 3.425 4.425 (xj − M1 )2 6.63 2.48 0.33 0.18 2.03 5.88 11.73 19.58 |xj − M1 | · nj 12.875 34.65 18.4 14.875 22.8 16.975 6.85 4.425 131.85 (xj − M1 )2 · nj 33.15 54.56 10.56 6.3 32.48 41.16 23.46 19.58 221.25 1 VARIABILITA’ 9 è possibile calcolare lo scostamento medio da M1 : SM 1 8 131.85 1 X · = 1.09875 |xj − M1 | · nj = = 120 j=1 120 (mediamente il numero di stanze delle 120 abitazioni prese in esame differisce dal valore medio di 1.09875 stanze) e lo scarto quadratico medio: v r u 8 u 1 X 221.25 σ=t · = 1.358 (xj − M1 )2 · nj = 120 j=1 120 (mediamente il numero di stanze delle 120 abitazioni prese in esame differisce dal valore medio di 1.358 stanze). 5. La distribuzione del reddito annuo in euro dei 1000 abitanti di un comune è la seguente: classi di reddito redditieri 1000 |– 5000 100 5000 |– 15000 400 . 15000 |– 35000 300 35000 |– 75000 200 Si determini la varianza del reddito dei 1000 abitanti. Si verifichi numericamente la relazione tra lo scarto quadratico medio e lo scostamento medio dalla media aritmetica. Svolgimento Per prima cosa, è necessario calcolare la media aritmetica, completando la seguente lj− + lj+ tabella, dove xj = indica il valore centrale della j-esima classe: 2 classi di reddito 1000|–5000 5000|–15000 15000|– 35000 35000 |– 75000 TOTALE xj 3000 10000 25000 55000 nj 100 400 300 200 1000 x j · nj 300000 4000000 7500000 11000000 22800000 Si ha quindi che: 4 1 X 22800000 M1 = x j · nj = = 22800. N j=1 1000 Per calcolare la varianza, e lo scostamento medio da M1 è necessario completare la seguente tabella: 1 VARIABILITA’ 10 classi di reddito 1000|–5000 5000|–15000 15000|– 35000 35000 |– 75000 TOTALE xj 3000 10000 25000 55000 nj 100 400 300 200 1000 |xj − M1 | 19800 12800 2200 32200 |xj − M1 | · nj 1980000 5120000 660000 6440000 14200000 (xj − M1 )2 392040000 163840000 4840000 1036840000 (xj − M1 )2 · nj 39204000000 65536000000 1452000000 207368000000 313560000000 Quindi lo scostamento medio dalla media aritmetica è pari a SM 1 = 4 X 1 14200000 · = 14200 |xj − M1 | · nj = 1000 j=1 1000 e tale valore indica che mediamente i redditi dei 1000 abitanti si discostano dal loro valore medio di 14200 euro. La varianza è pari a 4 1 X 313560000000 σ = (xj − M1 )2 · nj = = 313560000 1000 j=1 1000 2 e lo scarto quadratico medio è v r u 4 u 1 X 313560000000 (xj − M1 )2 · nj = = 17707.625 σ=t 1000 j=1 1000 e tale valore indica che mediamente i redditi dei 1000 abitanti si discostano dal loro valore medio di 17707.625 euro. É facile notare che i valori ottenuti verificano la relazione 14200 < 17707.625 e pertanto è soddisfatta la seguente relazione tra scarto quadratico medio e scostamento medio da M1 : SM1 ≤ σ. 6. La distribuzione delle fatture di una grande azienda, emesse in un mese, secondo l’importo in migliaia di euro è riportata nella seguente tabella: classi d’importo n. fatture importo totale di classe 0–|50 8 304 50–|100 70 5600 100–|150 71 8946 . 150–|200 62 10540 200–|250 27 6210 250–|300 7 1960 300–|350 3 960 tot 248 1 VARIABILITA’ 11 Calcolare lo scostamento medio dalla mediana; lo scostamento medio dalla media aritmetica; la varianza e lo scarto quadratico medio. Verificare numericamente la relazione esistente tra SMe , SM1 e σ. Svolgimento Per prima cosa, è necessario calcolare la mediana e la media aritmetica della distribuzione. Completiamo perciò la seguente tabella. Classi d’importo 0–|50 50–|100 100–|150 150–|200 200–|250 250–|300 300–|350 TOTALE nj 8 70 71 62 27 7 3 248 T ot. di classe (Tj ) 304 5600 8946 10540 6210 1960 960 34520 Cj 8 78 149 211 238 245 248 La posizione mediana è data da pos(M e) = N +1 248 + 1 = = 124.5. 2 2 Scorrendo la colonna delle frequenze cumulate, riconosciamo che la classe (100; 150] è la classe mediana. Il valore della mediana è pertanto: M e = x(124.5) = 100 + [124.5 − 78 − 0.5] · (150 − 100) = 132.39. 71 Utilizzando l’informazione relativa ai totali di classe, il calcolo della media aritmetica si può effettuare nel seguente modo: M1 = 304 + 5600 + 8946 + 10540 + 6210 + 1960 + 960 34520 = = 139.19. 248 248 Utilizzando l’informazione sui totali di classe, calcoliamo per ciascuna classe un valore rappresentativo x′j , dividendo ciascun totale di classe per la frequenza della classe. Completiamo la seguente tabella. Classi d’importo 0–|50 50–|100 100–|150 150–|200 200–|250 250–|300 300–|350 TOTALE nj 8 70 71 62 27 7 3 248 Tot. di classe 304 5600 8946 10540 6210 1960 960 x′j 38 80 126 170 230 280 320 |x′j − M e| |x′j − M e| · nj 94.4 755.2 52.39 3667.3 6.39 453.69 37.61 2331.82 97.61 2635.47 147.61 1033.27 187.61 562.83 11439.58 1 VARIABILITA’ 12 Lo scostamento medio dalla mediana è quindi SM e = 7 11439.58 1 X ′ · = 46.127 |xj − M e| · nj = 248 j=1 248 e tale valore indica che mediamente gli importi delle fatture si discostano dal loro valore mediano di 46.127 (migliaia di euro). Completando la seguente tabella Classi 0–|50 50–|100 100–|150 150–|200 200–|250 250–|300 300–|350 TOTALE nj 8 70 71 62 27 7 3 248 x′j 38 80 126 170 230 280 320 |x′j − M1 | 101.19 59.19 13.19 30.81 90.81 140.81 180.81 |x′j − M1 | · nj 809.52 4143.3 936.49 1910.22 2451.87 985.67 542.43 11779.50 (x′j − M1 )2 10239.4161 3503.4561 173.9761 949.2561 8246.4561 19827.4561 32692.2561 (x′j − M1 )2 · nj 81915.33 245241.93 12352.30 58853.88 222654.31 138792.19 98076.77 857886.71 calcoliamo agevolmente lo scostamento medio dalla media aritmetica: SM 1 = 7 11779.50 1 X ′ · = 47.498 |xj − M1 | · nj = 248 j=1 248 e tale valore indica che mediamente gli importi delle fatture si discostano dal loro valore medio di 47.498 (migliaia di euro). La varianza è data da: 7 857886.71 1 X ′ = 3459.22, (xj − M1 )2 · nj = σ = 248 j=1 248 2 lo scarto quadratico medio v r u 7 u 1 X 857886.71 σ=t = 58.815 (x′j − M1 )2 · nj = 248 j=1 248 e possiamo interpretare tale valore dicendo che mediamente gli importi delle fatture differiscono dal loro valore medio di 58.815 (migliaia di euro). É possibile verificare infine che vale la relazione infatti SM e ≤ SM 1 ≤ σ 46.127 < 47.498 < 58.815. 1 VARIABILITA’ 13 7. Sia X un carattere quantitativo con media aritmetica M1 (X) = 5 e scarto quadratico medio σ(X) = 1.5. Sia Y un altro carattere quantitativo tale che Y = 0.5 − 2X. Determinare la media aritmetica e la varianza di Y . Svolgimento Dalla proprietà di linearità della media aritmetica, segue immediatamente che M1 (Y ) = 0.5 − 2 · M1 (X) = 0.5 − 2 · 5 = −9.5. A questo punto, calcoliamo la varianza di X σ 2 (X) = (1.5)2 = 2.25 e ricordiamo la proprietà della varianza che afferma che se tra i caratteri X e Y sussiste una relazione del tipo Y =a+b·X allora tra le varianze di X e Y , vale la relazione: σ 2 (Y ) = b2 · σ 2 (X). Applicando tale proprietà, utilizzando i valori a = 0.5 e b = −2 si ricava la varianza di Y : σ 2 (Y ) = 22 · σ 2 (X) = 4 · 2.25 = 9. 8. In un reparto produttivo, vengono impiegate tre macchine alle quali lavorano, rispettivamente, 4, 5 e 3 operai. La seguente tabella riporta i dati relativi alla produzione oraria (per operaio e per macchina): produzione oraria macchina 1 produzione oraria macchina 2 produzione oraria macchina 3 48 56 52 49 56 51 48 57 51 47 57 55 Determinare la varianza della produzione oraria dell’intero sistema col metodo indiretto; determinare inoltre la varianza fra e nei gruppi e verificare la proprietà di scomposizione della varianza totale. Svolgimento Come prima cosa, dividiamo i 12 operai in K = 3 gruppi, a seconda della macchina a cui lavorano: si avrà quindi il primo gruppo (di numerosità N1 pari a 4) composto dagli operai che lavorano alla prima macchina, il secondo gruppo (di numerosità N2 pari a 5) formato dagli operai che lavorano alla seconda macchina e infine il terzo gruppo (di numerosità N3 pari a 3) a cui appartengono gli operai che lavorano alla terza macchina. A ciascun operaio è associato un numero che rappresenta la sua produzione oraria. 1 VARIABILITA’ 14 É possibile a questo punto calcolare, per ciascun gruppo, la produzione oraria media (ovvero le medie parziali): X̄1 = M1 (1a macchina) = 192 48 + 49 + 48 + 47 = = 48 4 4 59 + 59 + 57 + 57 + 55 281 = = 56.2 5 5 154 52 + 51 + 51 = = 51.3̄. X̄3 = M1 (3a macchina) = 3 3 X̄2 = M1 (2a macchina) = La proprietà associativa della media aritmetica permette di calcolare la media aritmetica totale (ovvero la produzione media oraria complessiva): X̄ = 48 · 4 + 56.2 · 5 + 51.3̄ · 3 X̄1 · N1 + X̄2 · N2 + X̄3 · N3 = 52.25. = N1 + N2 + N3 12 Per determinare la varianza della produzione oraria complessiva con il metodo indiretto è necessario applicare la formula: 2 σtot N 1 X 2 = x − M12 = M22 − M12 . N i=1 i Si completa la seguente tabella: Numero macchina 1 2 3 TOT xi x2i 48 49 48 47 56 56 57 57 55 52 51 51 628 2304 2401 2304 2209 3136 3136 3249 3249 3025 2704 2601 2601 32919 Quindi: 12 M22 1 X 2 32919 = 2743.25. x = = 12 i=1 i 12 1 VARIABILITA’ 15 A questo punto si ricava immediatamente la varianza totale: 2 σtot = 2743.25 − (52.25)2 = 13.1875. Calcoliamo ora la varianza fra le produzioni medie delle singole macchine (ovvero la varianza fra i gruppi). Si ha quindi: σF2 = K 1 X [X̄j − X̄]2 · Nj N j=1 3 2 1 X X̄j − X̄ · Nj = 12 j=1 (48 − 52.25)2 · 4 + (56.2 − 52.25)2 · 5 + (51.3̄ − 52.25)2 · 3 12 152.7833 = = 12.732. 12 = Per determinare la varianza nei gruppi, è necessario innanzitutto calcolare le varianze parziali. Si ha quindi (utilizzando il metodo indiretto per il calcolo della varianza), che la varianza del primo gruppo è: σ12 482 + 492 + 482 + 472 − (48)2 = 0.5 = 4 quella del secondo gruppo: σ22 = 562 + 562 + 572 + 572 + 552 − (56.2)2 = 0.56 5 e infine per il terzo gruppo: σ32 = 522 + 512 + 512 − (51.3̄)2 = 0.2̄. 3 Il calcolo della media aritmetica ponderata delle varianze parziali (varianza nei gruppi), è pertanto: 2 σN = K 3 1 X 2 1 X 2 0.5 · 4 + 0.56 · 5 + 0.2̄ · 3 = 0.4556. σj · Nj = σj · Nj = N j=1 N j=1 12 A questo punto è possibile verificare la scomposizione della varianza totale: 1 VARIABILITA’ 16 2 σN + σF2 = 2 σtot 0.4556 + 12.732 = 13.1876 (∼ = 13.1875) Calcolando i rapporti di composizione: • 2 0.4556 σN = 0.0345 (= 3.45%) = 2 σtot 13.1876 • σF2 12.732 = 0.9655 (= 96.55%) = 2 σtot 13.1876 è possibile notare che la varianza nei gruppi è il 3.45% della varianza totale e che la varianza fra i gruppi è il 96.55% della varianza totale. Da tali considerazioni possiamo concludere che la produzione risulta molto omogenea per ogni macchina (cioè operai che lavorano alla stessa macchina hanno più o meno la stessa produttività) ed eterogenea fra le varie macchine (cioè operai lavoranti a macchine diverse hanno produttività differenti). Le differenze di produttività tra gli operai sono dunque principalmente imputabili al fatto che utilizzano diversi macchinari. 9. La seguente tabella riporta la distribuzione del numero di alberghi delle due località turistiche A e B di un comprensorio, secondo le classi di fatturato annuale (in milioni di Euro): classi di fatturato fino a 1 Numero di Alberghi in A 15 Numero di Alberghi in B 25 1 |– 3 24 51 3 |– 5 85 67 5 |– 10 48 59 10 |– 20 40 31 20 |– 40 29 31 Tot 241 264 Si verifichi la scomposizione della varianza del fatturato annuo degli alberghi del comprensorio, commentando il risultato ottenuto. Svolgimento Per prima cosa, dividiamo in K = 2 gruppi gli alberghi del comprensorio: ovviamente avremo un primo gruppo (di numerosità N1 pari a 241) formato dagli alberghi della località A e un secondo gruppo (di numerosità N2 pari a 264) composto dagli alberghi della località B. Completiamo quindi la seguente tabella per agevolare i calcoli successivi (con nA j e con nB si sono indicate rispettivamente le frequenze degli alberghi della località j A e quelle degli alberghi della località B corrispondenti alla j-esima classe, mentre lj− + lj+ xj = (j = 1, ..., 6) indica il valore centrale di ogni classe). 2 1 VARIABILITA’ 17 Classi di fatturato 0 |– 1 1 |– 3 3 |– 5 5 |– 10 10 |– 20 20 |– 40 Totale xj x2j nA j nB j B nA j + nj 0.5 2 4 7.5 15 30 0.25 4 16 56.25 225 900 15 24 85 48 40 29 241 25 51 67 59 31 31 264 40 75 152 107 71 60 505 A questo punto è possibile calcolare la media aritmetica del fatturato per gli alberghi della località A: 6 1 X 0.5 · 15 + 2 · 24 + 4 · 85 + 7.5 · 48 + 15 · 40 + 30 · 29 X̄1 = x j · nA = 9.234 j = N1 j=1 241 e per gli alberghi della località B: 6 1 X 0.5 · 25 + 2 · 51 + 4 · 67 + 7.5 · 59 + 15 · 31 + 30 · 31 X̄2 = x j · nB = 8.409. j = N2 j=1 264 La media aritmetica del fatturato degli alberghi di tutto il comprensorio è quindi, utilizzando la proprietà associativa della media aritmetica: 9.234 · 241 + 8.409 · 264 = 8.803. X̄ = 241 + 264 É possibile ora calcolare la varianza del fatturato degli alberghi di tutto il comprenB sorio, utilizzando le frequenze totali nA j + nj (ed il procedimento indiretto): 2 σtot 6 1 X 2 B 2 = x · [nA j + nj ] − X̄ N j=1 j 0.25 · 40 + 4 · 75 + 16 · 152 + 56.25 · 107 + 225 · 71 + 900 · 60 − (8.803)2 505 = 78.422. = Calcoliamo ora: • la varianza nei gruppi Si deve innanzitutto calcolare la varianza parziale di ciascun gruppo: σ12 6 1 X 2 A = x · n − X̄12 N1 j=1 j j 0.25 · 15 + 4 · 24 + 16 · 85 + 56.25 · 48 + 225 · 40 + 900 · 29 − (9.234)2 241 39259.75 = − 85.267 = 77.64. 241 = 1 VARIABILITA’ σ22 18 6 1 X 2 B x · n − X̄22 = N2 j=1 j j 0.25 · 25 + 4 · 51 + 16 · 67 + 56.25 · 59 + 225 · 31 + 900 · 31 − (8.409)2 264 39475 − 70.711 = 78.81 = 264 = 2 e quindi la varianza nei gruppi (σN ): 2 σN = σ12 · N1 + σ22 · N2 77.64 · 241 + 78.81 · 264 = 78.252; = N1 + N2 505 • la varianza fra gruppi Il calcolo della varianza fra i gruppi è invece: [(X̄1 − X̄)2 · N1 + (X̄2 − X̄)2 · N2 ] N1 + N2 [(9.234 − 8.803)2 · 241 + (8.409 − 8.803)2 · 264] = 505 85.750 = 0.1698. = 505 σF2 = In base ai risultati ottenuti, si verifica la scomposizione: 2 σN + σF2 = 2 σtot 78.252 + 0.1698 = 78.4218 (∼ = 78.422). Calcolando i rapporti di composizione: 2 σN 78.252 = 0.9978 (= 99.78%) = 2 σtot 78.422 0.1698 σ2 = 0.0022 (= 0.22%) • 2F = σtot 78.422 • è possibile notare che la varianza nei gruppi è il 99.78% della varianza totale e che la varianza fra i gruppi è solo lo 0.22% della varianza totale. Da tali considerazioni possiamo concludere che la distribuzione dei fatturati degli alberghi delle località A e B è omogenea (varianza fra i gruppi molto piccola) e che in entrambe le località esistono alberghi con fatturati molto diversi (varianza nei gruppi molto grande). Le differenze tra i fatturati degli alberghi non sono dunque imputabili alla diversa collocazione geografica (località A o B). 1 VARIABILITA’ 19 10. Nel 1981 gli ospedali in Italia erano 1826 ripartiti per tipo come segue: ospedali generali 1345, ospedali specialistici 295, ospedali psichiatrici 186. Per ogni ospedale è stato rilevato il numero di posti letto ottenendo le informazioni seguenti: n. medio di posti letto scarto quadratico medio dei posti letto osp. generali 318,51 445,96 osp. specialist. 215,58 259,54 osp. psichiatr. 407,22 . 477,84 Si determini il numero medio di posti letto per il complesso di ospedali e la varianza della stessa variabile, commentando il risultato. Svolgimento In questo caso, riconosciamo K = 3 gruppi di numerosità N1 = 1345, N2 = 295 e N3 = 186, formati rispettivamente dagli ospedali generali, dagli ospedali specialistici e dagli ospedali psichiatrici. Avendo le medie della variabile “numeri di posti letto” per ciascun gruppo, è possibile calcolare la media aritmetica totale, utilizzando la proprietà associativa della media aritmetica: X̄ = 3 1 X 318.51 · 1345 + 215.58 · 295 + 407.22 · 186 567734.97 X̄j ·Nj = = = 310.917. N j=1 1345 + 295 + 186 1826 Per calcolare la varianza totale, è necessario utilizzare la sua scomposizione in varianza nei gruppi più varianza fra i gruppi. La varianza nei gruppi è perciò (indicando con σj2 la varianza del j-esimo gruppo): 2 σN 3 1 X 2 σ · Nj = N j=1 j (445.96)2 · 1345 + (259.54)2 · 295 + (477.84)2 · 186 1826 329835109.2 = = 180632.59. 1826 = La varianza fra i gruppi è: σF2 = 3 1 X [X̄j − X̄]2 · Ni N j=1 [318.51 − 310.917]2 · 1345 + [215.58 − 310.917]2 · 295 + [407.22 − 310.917]2 · 186 1826 4483855.323 = = 2455.56. 1826 = La varianza totale è quindi pari a: 1 VARIABILITA’ 20 2 σtot = 2 σN 183088.15 = 180632.59 σF2 + + 2455.56. Calcolando i rapporti di composizione: 2 180632.59 σN = 0.9866 (= 98.66%) • 2 = σtot 183088.15 σ2 2455.56 • 2F = = 0.0134 (= 1.34%) σtot 183088.15 è possibile notare che la varianza nei gruppi è il 98.66% della varianza totale e che la varianza fra i gruppi è l’1.34% della varianza totale. Da tali considerazioni possiamo concludere che ogni gruppo è molto eterogeneo al suo interno (varianza nei gruppi alta): nell’ambito di ciascuna tipologia di ospedale (generale, specialistico, psichiatrico) il numero di posti letto è molto variabile da ospedale a ospedale, mentre vi è una forte omogeneità tra le varie tipologie di ospedale (bassa varianza fra i gruppi). Le differenze tra il numero di posti letto degli ospedali non sono dunque imputabili alla diversa tipologia degli ospedali. 11. Il reddito annuo (in migliaia di euro) di sette individui è rispettivamente pari a 15, 20, 12, 10, 18, 30, 35. Determinare e interpretare la differenza media e con ripetizione del reddito. Svolgimento Per agevolare i conti, completiamo la seguente tabella scrivendo nella cella (i, j), la quantità |xi − xj |: xj xi 15 20 12 10 18 30 35 15 20 12 10 18 30 35 0 5 3 5 3 15 20 5 0 8 10 2 10 15 3 8 0 2 6 18 23 5 10 2 0 8 20 25 3 2 6 8 0 12 17 15 10 18 20 12 0 5 20 15 23 25 17 5 0 464 Si ottiene in questo modo che: N X N X S 1 1 ∆= = · · 464 = 11.048 |xi − xj | = N (N − 1) N (N − 1) i=1 j=1 7·6 1 VARIABILITA’ 21 e tale valore indica che mediamente i redditi dei sette individui differiscono tra loro per 11.048 migliaia di euro. Inoltre N N S 1 XX 1 ∆R = 2 = 2 · |xi − xj | = 2 · 464 = 9.469. N N i=1 j=1 7 e tale valore indica che mediamente i redditi dei sette individui differiscono tra loro (e con loro stessi) per 9.469 migliaia di euro. Un ulteriore modo per calcolare il numeratore S delle differenze medie è dato da: S =2· N X i X i=1 j=1 |x(i) − x(j) |. Illustriamo il calcolo del numeratore S attraverso quest’ultima formula. Per prima cosa, è necessario ordinare i valori xj : x(1) = 10 x(2) = 12 x(3) = 15 x(4) = 18 x(5) = 20 x(6) = 30 x(7) = 35 e completare la parte sotto la diagonale principale della seguente tabella, scrivendo nella cella (i, j) la quantità |x(i) − x(j) |. x(j) x(i) 10 12 15 18 20 30 35 10 12 15 18 20 30 35 0 2 5 8 10 20 25 0 3 6 8 18 23 0 3 5 15 20 0 2 12 17 0 10 15 0 5 0 Somme parziali per riga 0 2 8 17 25 75 105 232 Si ha pertanto che S =2· N X i X i=1 j=1 |x(i) − x(j) | = 2 · 232 = 464 e quindi, come volevasi dimostrare: ∆= 464 S = = 11.048 N (N − 1) 7·6 1 VARIABILITA’ 22 ∆R = 464 S = = 9.469. N2 72 Giusto per completezza, viene riportato un ulteriore metodo di calcolo per il numeratore S. Completando la seguente tabella: j 1 2 3 4 5 6 7 x(j) 10 12 15 18 20 30 35 2j − N − 1 x(j) (2j − N − 1) -6 -60 -4 -48 -2 -30 0 0 2 40 4 120 6 210 232 possiamo calcolare S nel seguente modo: S =2· 7 X j=1 x(j) (2j − N − 1) = 2 · 232 = 464 e quindi ritrovare gli stessi valori calcolati precedentemente per ∆ e ∆R . 12. La distribuzione del prezzo del pane al chilogrammo nei capoluoghi di 27 province nel 1970 e nel 1989 è riportata nella seguente tabella: prezzo lire al kg. 1970 frequenze prezzo lire al kg. 1989 frequenze 700 1 2100 2 800 4 2500 3 900 2 2600 2 950 3 2950 4 1000 7 3000 6 1200 10 3600 10 tot 27 . tot 27 a) Determinare la differenza media semplice e con ripetizione del prezzo del pane nel 1970; b) Si può dire che dal 1970 al 1989 ci sia stato un aumento della variabilità del fenomeno? Svolgimento a) Ricordando che in questo caso N = 27, completiamo la seguente tabella che agevolerà il calcolo delle differenze medie. 1 VARIABILITA’ 23 xj 700 800 900 950 1000 1200 Totale nj 1 4 2 3 7 10 27 Cj 1 5 7 10 17 27 2Cj − N − nj -26 -21 -15 -10 0 17 nj (2Cj − N − nj ) -26 -84 -30 -30 0 170 xj nj (2Cj − N − nj ) -18200 -67200 -27000 -28500 0 204000 63100 Utilizzando la formula per il calcolo del numeratore S, la differenza media semplice è quindi data da: 6 X S 2 2 ∆= = · ·63100 = 179.77. xj nj (2Cj −N −nj ) = N (N − 1) N (N − 1) j=1 27 · 26 Tale valore indica che i prezzi del pane nei 27 capoluoghi nel 1970 differiscono mediamente tra loro di 179.77 lire. La differenza media con ripetizione è data da: ∆R = 6 2 X 2 S = · · 63100 = 173.11. x n (2C − N − n ) = j j j j N2 N 2 j=1 (27)2 Tale valore indica che i prezzi del pane nei 27 capoluoghi nel 1970 differiscono mediamente tra loro (e con loro stessi) di 173.11 lire. b) Osservando i valori del prezzo del pane nei due anni presi in esame, è facile rendersi conto che l’ordine di grandezza è differente, ragion per cui per confrontare le variabilità dei prezzi del pane nei due anni (1970 e 1989) è necessario ricorrere a indici relativi di variabilità. Poichè al punto precedente abbiamo calcolato sulla distribuzione dei prezzi del 1970 gli indici ∆ e ∆R , la scelta più ovvia è quella di confrontare la variabilità dei prezzi del 1970 e del 1989 con gli indici relativi: ∆ ∆R o . M1 M1 Per completezza, tuttavia, calcoliamo anche gli altri indici relativi noti: σ SM 1 SM e , e . M1 M1 M1 Calcoliamo perciò la mediana e la media aritmetica relative all’anno 1970: M e(1970) = x( N +1 ) = x( 27+1 ) = x(14) = 1000 2 2 (1970) M1 = 700 · 1 + 800 · 4 + 900 · 2 + 950 · 3 + 1000 · 7 + 1200 · 10 = 1020.37 27 1 VARIABILITA’ 24 e la mediana e la media aritmetica relative all’anno 1989: M e(1989) = x( N +1 ) = x( 27+1 ) = x(14) = 3000 2 2 2100 · 2 + 2500 · 3 + 2600 · 2 + 2950 · 4 + 3000 · 6 + 3600 · 10 = 3062.96 27 Si completa la seguente tabella, relativa all’anno 1970: (1989) M1 xj 700 800 900 950 1000 1200 Totale = nj 1 4 2 3 7 10 27 |xj − M e| 300 200 100 50 0 200 |xj − M e|nj 300 800 200 150 0 2000 3450 |xj − M1 | 320.37 220.37 120.37 70.37 20.37 179.63 |xj − M1 |nj 320.37 881.48 240.74 211.11 142.59 1796.3 3592.59 (xj − M1 )2 102636.94 48562.93 14488.94 4951.94 414.94 32266.94 (xj − M1 )2 nj 102636.94 194251.72 28977.88 14855.82 2904.58 322669.4 666296.34 grazie alla quale è possibile calcolare (1970) SM e 6 1 X 3450 = 127.7̄ = |xj − M e(1970) | · nj = N j=1 27 6 1 X 3592.59 (1970) = |xj − M1 | · nj = = 133.059 N j=1 27 v r u 6 u1 X 666296.34 (1970) 2 (xj − M1 ) · nj = = 159.07. =t N j=1 27 (1970) SM 1 σ (1970) Completiamo l’analoga tabella relativa all’anno 1989: xj 2100 2500 2600 2950 3000 3600 Totale nj 2 3 2 4 6 10 27 |xj − M e| 900 500 400 50 0 600 |xj − M e|nj 1800 1500 800 200 0 6000 10300 |xj − M1 | 962.96 562.96 462.96 112.96 62.96 537.04 |xj − M1 |nj 1925.92 1688.88 925.92 451.84 377.76 5370.4 10740.72 (xj − M1 )2 927291.96 316923.96 214331.96 12759.96 3963.96 288411.96 grazie alla quale è possibile calcolare (1989) 6 1 X 10300 = 381.48 |xj − M e(1989) | · nj = N j=1 27 SM e = (1989) SM 1 6 1 X 10740.72 (1989) = 397.8 = |xj − M1 | · nj = N j=1 27 (xj − M1 )2 nj 1854583.92 950771.88 428663.92 51039.84 23783.76 2884119.6 6192962.92 1 VARIABILITA’ 25 σ (1989) v r u 6 u1 X 6192962.92 (1989) = 478.92. (xj − M1 )2 · nj = =t N j=1 27 Ricordiamo infine di aver calcolato, per l’anno 1970, ∆(1970) = 179.77 e (1970) ∆R = 173.11. Completiamo l’analoga tabella (relativa all’anno 1989): xj 2100 2500 2600 2950 3000 3600 nj 2 3 2 4 6 10 Cj 2 5 7 11 17 27 2Cj − N − nj -25 -20 -15 -9 1 17 xj nj · (2Cj − N − nj ) -105000 -150000 -78000 -106200 18000 612000 190800 grazie alla quale possiamo calcolare ∆(1989) = 6 X 1 S 2 · 190800 = ·2 = 543.59 xj nj ·(2Cj −N −nj ) = N (N − 1) N (N − 1) j=1 27 · 26 e (1989) ∆R 6 X S 1 2 · 190800 = 2 = 2 ·2 = 523.45. xj nj · (2Cj − N − nj ) = N N 272 j=1 Riassumiamo nella seguente tabella i valori calcolati sia per l’anno 1970 che per l’anno 1989: Me M1 SM e SM 1 σ ∆ ∆R Anno 1970 1000 1020.37 127.7̄ 133.059 157.09 179.77 173.11 Anno 1989 3000 3062.96 381.48 397.805 478.92 543.59 523.45 É possibile a questo punto calcolare i seguenti indici relativi di variabilità: 1 VARIABILITA’ 26 Anno 1970 Anno 1989 SM e : M1 127.7̄ = 0.1252 > 1020.37 381.48 = 0.1245 3062.96 SM 1 : M1 133.059 = 0.1304 > 1020.37 397.805 = 0.1299 3062.96 157.09 = 0.1540 < 1020.37 478.92 = 0.1564 3062.96 ∆ : M1 179.77 = 0.1762 < 1020.37 543.59 = 0.1774 3062.96 ∆R : M1 173.11 = 0.1696 < 1020.37 523.45 = 0.1708 3062.96 CV = σ : M1 Il valore 0.1252 indica che lo scostamento dalla mediana del prezzo del pane nel 1970 è pari al 12.52% della media aritmetica. Il valore 0.1245 indica che lo scostamento dalla mediana del prezzo del pane nel 1989 è pari al 12.45% della media aritmetica. Il valore 0.1304 indica che lo scostamento dalla media aritmetica del prezzo del pane nel 1970 è pari al 13.04% della media aritmetica. Il valore 0.1299 indica che lo scostamento dalla media aritmetica del prezzo del pane nel 1989 è pari al 12.99% della media aritmetica. Il valore 0.1540 indica che lo scarto quadratico medio del prezzo del pane nel 1970 è pari al 15.40% della media aritmetica. Il valore 0.1564 indica che lo scarto quadratico medio del prezzo del pane nel 1989 è pari al 15.64% della media aritmetica. Il valore 0.1762 indica che la differenza media semplice del prezzo del pane nel 1970 è pari al 17.62% della media aritmetica. Il valore 0.1774 indica che la differenza media semplice del prezzo del pane nel 1989 è pari al 17.74% della media aritmetica. Il valore 0.1696 indica che la differenza media con ripetizione del prezzo del pane nel 1970 è pari al 16.96% della media aritmetica. Il valore 0.1708 indica che la differenza media con ripetizione del prezzo del pane nel 1989 è pari al 17.08% della media aritmetica. Attraverso il confronto dei valori assunti dagli indici relativi di variabilità calcolati, si può concludere che la variabilità del prezzo del pane dei 27 capoluoghi 1 VARIABILITA’ 27 presi in esame nel 1989 non è sensibilmente aumentata rispetto al 1970. 13. La classificazione di due gruppi di ditte produttrici di olio d’oliva, che vendono rispettivamente il proprio prodotto a peso (gruppo A) e a volume (gruppo B), ha dato luogo alle seguenti distribuzioni di frequenze: gruppo A prezzo euro al kg n. ditte gruppo B prezzo euro al litro n. ditte 2–|3 40 2–|3 100 3–|3,5 90 3–|3,5 80 3,5–|4 200 3,5–|4 70 4–|4,5 110 4–|4,5 30 4,5–|5 60 . 4,5–|5 20 Quale delle due distribuzioni presenta maggiore variabilità? Si effettui il confronto utilizzando indici basati sullo scostamento medio dalla media aritmetica, sullo scostamento medio dalla mediana, sullo scarto quadratico medio e sulla differenza media semplice. Svolgimento Per prima cosa, completiamo la seguente tabella per agevolare il calcolo della mediaB na e della media aritmetica per ciascuno dei due gruppi (si indicano con nA j e nj le frequenze dei gruppi A e B, inoltre con N A si è indicata la numerosità complessiva del lj− + lj+ B gruppo A e con N quella del gruppo B, infine xj = indica il valore centrale 2 di ogni classe). classi di prezzo 2–|3 3–|3.5 3.5–|4 4–|4.5 4.5–|5 Totale xj 2.5 3.25 3.75 4.25 4.75 nA j 40 90 200 110 60 500 nB j 100 80 70 30 20 300 CjA 40 130 330 440 500 CjB 100 180 250 280 300 x j nA j 100 293 750 468 285 1895 x j nB j 250 260 263 128 95 995 É possibile ora calcolare la mediana per ciascuno dei due gruppi: 0.5 M eA = x N A +1 = x( 500+1 ) = x(250.5) = 3.5 + [250.5 − 130 − 0.5] · = 3.8 2 2 200 0.5 M eB = x N B +1 = x( 300+1 ) = x(150.5) = 3 + [150.5 − 130 − 0.5] · = 3.3125 2 2 80 e le medie aritmetiche: M1A 5 1895 1 X x j nA = 3.79 = A j = N j=1 500 1 VARIABILITA’ 28 M1B 5 1 X 995 = B x j nB = 3.316̄. j = N j=1 300 Completiamo quindi la tabella relativa al gruppo A: xj 2.5 3.25 3.75 4.25 4.75 Totale nA j 40 90 200 110 60 500 |xj − M eA | 1.3 0.55 0.05 0.45 0.95 |xj − M eA |nA j 52 49.5 10 49.5 57 218 |xj − M1A | 1.29 0.54 0.04 0.46 0.96 |xj − M1A |nA j 51.6 48.6 8 50.6 57.6 216.4 x2j 6.25 10.5625 14.0625 18.0625 22.5625 x2j nA j 250 950.625 2812.5 1986.875 1353.75 7353.75 da cui ricaviamo A SM e 5 1 X 218 = A |xj − M eA | · nA = 0.436 j = N j=1 500 A SM = 1 5 216.4 1 X A A |x − M | · n = = 0.4328 j 1 j N A j=1 500 v r u 5 X u √ 1 7353.75 A 2 2 = 0.3434 = 0.586. − [M ] = x2j · nA − (3.79) σA = t A 1 j N j=1 500 Completiamo anche la seguente tabella (sempre relativa al gruppo A): xj 2.5 3.25 3.75 4.25 4.75 nA j 40 90 200 110 60 CjA 40 130 330 440 500 2CjA − N A − nA j -460 -330 -40 270 440 A A A x j nA j · (2Cj − N − nj ) -46000 -96525 -30000 126225 125400 79100 grazie alla quale possiamo calcolare 5 X 1 S 2 · 79100 A A A = A A ·2 = 0.6341. ∆ = A A x j nA j ·(2Cj −N −nj ) = N (N − 1) N (N − 1) j=1 500 · 499 A Calcoliamo ora le stesse grandezze per il gruppo B: 1 VARIABILITA’ xj 2.5 3.25 3.75 4.25 4.75 Totale 29 nB j 100 80 70 30 20 500 |xj − M eB | 0.813 0.063 0.438 0.938 1.438 |xj − M eB |nB j 81.3 5.04 30.66 28.14 28.76 173.9 |xj − M1B | −0.816̄ 0.06̄ 0.43̄ 0.93̄ 1.43̄ |xj − M1B |nB j 81.6̄ 5.3̄ 30.3̄ 28 28.6̄ 174 x2j 6.25 10.5625 14.0625 18.0625 22.5625 x2j nB j 625 845 984.375 541.875 451.25 3447.5 da cui ricaviamo B SM e 5 173.9 1 X |xj − M eB | · nB = 0.579 = B j = N j=1 300 B SM 1 5 174 1 X |xj − M1B | · nB = 0.58 = B j = N j=1 300 v r u 5 X u √ 1 3447.5 B 2 2 = x2j · nB − [M ] = σB = t B − (3.31 6̄) 0.4914 = 0.701. 1 j N j=1 300 Completiamo anche la seguente tabella (sempre relativa al gruppo B): xj 2.5 3.25 3.75 4.25 4.75 nB j 100 80 70 30 20 CjB 100 180 250 280 300 2CjB − N B − nB j -200 -20 130 230 280 B B B x j nB j · (2Cj − N − nj ) -50000 -5200 34125 29325 26600 34850 grazie alla quale possiamo calcolare 5 X S 1 2 · 34850 B B B ∆ = B B = B B ·2 = 0.777. x j nB j ·(2Cj −N −nj ) = N (N − 1) N (N − 1) j=1 300 · 299 B É possibile a questo punto calcolare i seguenti indici relativi di variabilità: 1 VARIABILITA’ 30 Gruppo A SM e : M1 SM 1 : M1 CV = σ : M1 ∆ : M1 Gruppo B < 0.579 = 0.1746 3.316̄ 0.4328 = 0.1142 < 3.79 0.58 = 0.1749 3.316̄ 0.586 = 0.1546 3.79 < 0.701 = 0.2114 3.316̄ 0.6341 = 0.1673 < 3.79 0.777 = 0.2343 3.316̄ 0.436 = 0.115 3.79 Confrontando i valori degli indici relativi di variabilità, si può concludere che presenta maggiore variabilità la distribuzione delle ditte del gruppo B. 14. Nella seguente tabella sono riportate le distribuzioni per destinazione dei viaggi di vacanza (V ) e dei viaggi di lavoro (W ) effettuati dagli italiani nel 1998 (dati in migliaia): Destinazione V W Italia 67682 10944 Paesi UE 7238 1984 . Resto d’Europa 1989 378 Resto del mondo 2236 501 Si valuti, con un opportuno indice basato sulle differenze medie, quale delle due distribuzioni V e W presenta la variabilità più elevata. Si interpretino i valori assunti dall’indice per le due distribuzioni. Svolgimento Riconosciamo innanzitutto che abbiamo a che fare con una distribuzione di unità e che la popolazione statistica è costituita da 4 unità (N = 4). Per calcolare la differenza media per i viaggi di vacanza (V ), completiamo la seguente tabella, in cui le osservazioni sono state ordinate in modo crescente secondo i valori del carattere. Destinazione Resto d’Europa Resto del mondo Paesi EU Italia Totale i 1 2 3 4 v(i) 1989 2236 7238 67682 79145 2i − N − 1 v(i) · (2i − N − 1) -3 -5967 -1 -2236 1 7238 3 203046 202081 1 VARIABILITA’ 31 Possiamo pertanto calcolare la differenza media: 4 X 2 2 · · 202081 = 33680.17, v(i) · (2i − N − 1) = ∆(V ) = N (N − 1) i=1 4·3 la media aritmetica: 4 1X 79145 M1 (V ) = = 19786.25 vi = 4 i=1 4 e quindi l’indice relativo di variabilità: ∆(V ) 33680.17 = = 1.702 M1 (V ) 19786.25 che indica che la differenza media semplice del numero di viaggi di vacanza è il 170.2% della corrispondente media aritmetica. Consideriamo ora il carattere W : Destinazione Resto d’Europa Resto del mondo Paesi EU Italia Totale i 1 2 3 4 w(i) 378 501 1984 10944 13807 2i − N − 1 w(i) · (2i − N − 1) -3 -1134 -1 -501 1 1984 3 32832 33181 Possiamo pertanto calcolare la differenza media: ∆(W ) = 4 X 2 2 · · 33181 = 5530.16̄, w(i) · (2i − N − 1) = N (N − 1) i=1 4·3 la media aritmetica: 4 1X 13807 M1 (W ) = = 3451.75 wi = 4 i=1 4 e quindi l’indice relativo di variabilità: 5530.16 ∆(W ) = = 1.602. M1 (W ) 3451.75 che indica che la differenza media semplice del numero di viaggi di lavoro è il 160.2% della corrispondente media aritmetica. Riconoscendo che ∆(V ) ∆(W ) = 1.702 > 1.602 = M1 (V ) M1 (W ) si può concludere che la distribuzione V presenta maggiore variabilità. 1 VARIABILITA’ 32 15. Una fabbrica produce tubi catodici televisivi di due tipi. Per il tipo A si ha una durata media di 1495 ore e uno scarto quadratico medio di 280 ore. Per il tipo B si ha una durata media di 1875 ore ed uno scarto quadratico medio di 310 ore. Fornire una misura della variabilità relativa e commentare il risultato. Svolgimento Un indice di variabilità relativa per i tubi di tipo A è dato da: 280 σA = = 0.19 A 1495 M1 e tale valore indica che lo scarto quadratico medio della durata dei tubi del tipo A è il 19% della corrispondente durata media. Per quanto riguarda i tubi del tipo B si ha: σB 310 = 0.17. = B 1875 M1 e tale valore indica che lo scarto quadratico medio della durata dei tubi del tipo B è il 17% della corrispondente durata media. Riconoscendo che σB σA = 0.19 > 0.17 = M1A M1B si può concludere che la distribuzione delle durate dei tubi catodici del gruppo A presenta maggiore variabilità rispetto a quella del gruppo B.