Comments
Description
Transcript
Statistica descrittiva File
LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri 1 L’INDAGINE STATISTICA Si dice statistica quella scienza che ha come scopo lo studio quantitativo o qualitativo dei fenomeni collettivi Ogni aspetto di un fenomeno collettivo che si vuole analizzare si chiama carattere CARATTERI QUALITATIVI ORDINATI NON ORDINATI QUANTITATIVI DISCRETI CONTINUI 2 STATISTICA STATISTICA DESCRITTIVA STATISTICA INFERENZIALE SI OCCUPA DELLA SI OCCUPA DI estendere i risultati a insiemi più numerosi fornendo strumenti analitici per trarre conclusioni e decisioni successive raccolta – rielaborazione – presentazione - analisi DEI DATI OTTENUTI DALLO STUDIO DEI FENOMENI COLLETTIVI 3 FASI DELL’INDAGINE STATISTICA RILEVAZIONE DEI DATI SPOGLIO E TRASCRIZIONE DEI DATI ELABORAZIONE E ANALISI INTERPRETAZIONE E DIVULGAZIONE 4 RILEVAZIONE DEI DATI RILEVAZIONE TOTALE CAMPIONARIA PRELIMINARE DEFINITIVA OCCASIONALE, PERIODICA O CONTINUA 5 SPOGLIO E TRASCRIZIONE DEI DATI ORGANIZZARE I DATI IN MODO DA AVERE INFORMAZIONI SINTETICHE SUL FENOMENO CHE STIAMO ANALIZZANDO. SI COSTRUISCONO TABELLE DI SPOGLIO, CIOE’ TABELLE CHE RIASSUMANO LE RISPOSTE. LE TABELLE POSSONO ESSERE SEMPLICI, COMPOSTE O A DOPPIA ENTRATA. NELLE TABELLE VA INSERITO, IN UNA APPOSITA COLONNA, IL NUMERO DI QUANTE VOLTE SI PRESENTA UNA CERTA MODALITA’ DEL CARATTERE OSSERVATO; ESSO PRENDE IL NOME DI FREQUENZA. SI DICONO serie LE TABELLE CHE RACCOLGONO CARATTERI QUALITATIVI SI DICONO seriazioni LE TABELLE CHE RACCOLGONO CARATTERI QUANTITATIVI. 6 ELABORAZIONE DEI DATI SI UTILIZZANO STRUMENTI MATEMATICI PER ELABORARE I DATI. GLI STRUMENTI SONO VARI E POSSONO ESSERE IL CALCOLO DI UNA MEDIA O IL CALCOLO DI UN FENOMENO NEL TEMPO. LO SCOPO E’ QUELLO DI ESPRIMERE IN MODO SINTETICO I RISULTATI. 7 DISTRIBUZIONI STATISTICHE E DISTRIBUZIONI PROBABILISTICHE QUANDO TRASCRIVIAMO I DATI IN UNA TABELLA, DOPO AVERLI PONDERATI, POSSIAMO OTTENERE UNA DISTRIBUZIONE STATISTICA O PROBABILISTICA. SE I DATI SONO ESPRESSI IN FREQUENZE ASSOLUTE (quante volte si ripete un termine) SI HA UNA DISTRIBUZIONE STATISTICA. SE I DATI SONO ESPRESSI IN FREQUENZE RELATIVE (quante volte si ripete un termine sul totale delle frequenze) SI HA UNA DISTRIBUZIONE PROBABILISTICA. FRA STATISTICA E PROBALITA’ VI E’ UN PRECISO LEGAME: Quando l’indagine statistica è globale il metodo statistico è sufficiente a fornire una sintesi quantitativa dell’universo statistico; Quando l’indagine statistica campionaria il metodo statistico deve anche fornire gli strumenti per estendere ,cioè di inferire, le informazioni fornite dal campione all’intero universo. 8 RAPPRESENTAZIONI GRAFICHE IN STATISTICA LA RAPPRESENTAZIONE GRAFICA E’ UN MODO SEMPLICE PER ELABORARE I DATI STATISTICI. QUESTO TIPO DI RAPPRESENTAZIONE HA IL VANTAGGIO DI ESSERE FACILMENTE LEGGIBILE E ANCHE IMMEDIATAMENTE COMPRENSIBILE. LE PRINCIPALI RAPPRESENTAZIONE GRAFICHE SONO: ISTOGRAMMI ( distribuzioni per classi o continue) DIAGRAMMI A NASTRI E COLONNE (soprattutto per serie) DIAGRAMMI IN COORDINATE CARTESIANE ( fenomeno che varia al variare di un parametro) DIAGRAMMI A SETTORI CIRCOLARI (evidenzia la suddivisione del fenomeno fra le varie modalità che lo compongono) CARTOGRAMMI (intensità raggiunta da un fenomeno in località diverse) IDEOGRAMMI (disegni di oggetti che richiamano il fenomeno) DIAGRAMMI A TORTA O DI COMPOSIZIONE (rappresenta le parti che compongono un fenomeno) 9 I RAPPORTI STATISTICI COSTITUISCONO LA PIU’ SEMPLICE FORMA DI ELABORAZIONE STATISTICA. SONO RAPPORTI CHE VENGONO INSTAURATI FRA I DATI DI UNA DISTRIBUZIONE. I PIU’ IMPORTANTI SONO: RAPPORTI DI COMPOSIZIONE (percentuali) RAPPORTI DI COESISTENZA (fenomeni diversi rieferiti allo stesso luogo e tempo) RAPPORTI DI DERIVAZIONE (fra due fenomeni di cui uno è presupposto dell’altro:natalità, mortalità, nuzialità, fertilità) RAPPORTI DI FREQUENZA (ciascuna unità statistica su quelle complessivamente osservate) RAPPORTI DI DURATA E RIPETIZIONE (fenomeno con carattere dinamico in un tempo determinato) 10 LE MEDIE STATISTICHE Dicesi MEDIA di n dati disposti in ordine crescente qualunque valore che sia non minore del più piccolo e non maggiore del più grande. La media di una distribuzione deve fornire un’indicazione sintetica dei dati della Distribuzione secondo un criterio stabilito. MISURE DI TENDENZA CENTRALE MEDIE FERME MEDIE DI POSIZIONE ARITMETICA GEOMETRICA QUADRATICA ARMONICA MODA MEDIANA 11 MEDIE FERME a) b) a) b) a) b) Media Aritmetica: data una distribuzione di n valori, si definisce media aritmetica semplice M la loro somma divisa per il loro numero. la media aritmetica ponderata si ottiene sommando i prodotti dei singoli valori per i rispettivi pesi e dividendo per la somma dei pesi. Media Geometrica: si definisce media geometrica semplice G, di n valori positivi, la radice n-esima dei loro prodotti. la media geometrica ponderata si ottiene estraendo la radice n-esima ( dove n indica la somma dei pesi) dei prodotti dei singoli valori elevati ai rispettivi pesi Media Quadratica: si definisce media quadratica Q di n valori, la radice quadrata della media aritmetica dei quadrati dei valori. la media quadratica ponderata è data dalla radice quadrata della media aritmetica ponderata dove i singoli valori sono al quadrato. Media Armonica: a) si dice media armonica A di n valori, tutti maggiori di zero, il reciproco della media aritmetica dei reciproci dei valori. b) se si ha una ponderazione dei valori, la media armonica ponderata si ottiene dal reciproco della media aritmetica ponderata laddove il reciproco dei valori si moltiplica per il peso rispettivo. 12 MEDIE DI POSIZIONE Moda: Si definisce moda di una distribuzione di frequenze, la modalità o il valore a cui corrisponde la frequenza massima. - la moda non esiste quando tutti i valori hanno la stessa frequenza e se esiste può non essere unica. - se si hanno serie o seriazioni discrete la moda è il valore a cui corrisponde la massima frequenza; - se si hanno dati raggruppati per classi si va a guardare la classe modale cui corrisponde la massima frequenza, tenendo conto dell’ampiezza della classe. Mediana: Si definisce mediana di una distribuzione semplice di valori disposti in ordine crescente o decrescente il valore che occupa il posto centrale. - se la distribuzione è ponderata il calcolo è più complesso: si dovranno cumulare le frequenze assolute, fare il totale delle frequenze di cui poi si calcola la semisomma; la prima volta che la frequenza cumulata supera la semisomma delle frequenze totali, in corrispondenza di tale valore si avrà il termine mediano. - se si hanno dati raggruppati per classi si individua la classe a cui appartiene la mediana. 13 INDICI DI VARIABILITA’ Si ha variabilità quando i dati relativi ad un Fenomeno Statistico sono non tutti uguali. Il diagramma a dispersione rappresenta validamente la variabilità. Per avere informazioni sulla variabilità si prendono in considerazione gli scarti dalla media e si fa quindi una opportuna sintesi (media quadratica degli scarti) di questi ultimi. Si dice scarto quadratico medio la media quadratica degli scarti dalla media aritmetica Si dice varianza il quadrato dello scarto quadratico medio. 14 INDICI DI VARIABILITA’ Il campo di variazione, o range, è dato dalla differenza fra il termine più grande e quello più piccolo (massima differenza fra i termini). La differenza media assoluta è la media aritmetica di tutte le possibili differenze, prese in valore assoluto, fra ciascun termine e tutti gli altri. La differenza media relativa è il rapporto fra la differenza media e il suo valore massimo La concentrazione è un aspetto particolare della variabilità; si riferisce a caratteri perfettamente trasferibili. Il rapporto di concentrazione coincide con la differenza media relativa 15