Comments
Description
Transcript
Intervalli di confidenza
Intervallidiconfidenza Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza 1 ⇒ Calcolata la stima puntuale di un parametro incognito, è possibile associare a tale stima una valutazione dell’errore commesso? ⇒ Esiste un intervallo che contiene il vero valore del parametro incognito con alta probabilità? Esempio: se 520 votanti su 1000 hanno risposto sì ad un quesito referendario, è possibile dire, con elevata probabilità, che la percentuale dei votanti che ha risposto sì al quesito referendario è 52% ± 2%? L’intervallo (50%, 54%), o 52% ± 2% è detto intervallo di confidenza. Il livello di confidenza (in genere denotato con 1 - α) è la probabilità che il valore vero del parametro della popolazione cada nell’intervallo. In genere α corrisponde al 10%, 5% o 1% pertanto i livelli di confidenza usati sono 90%, 95% o 99%. Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza 2 Esempio : Un responsabile di ricerche di mercato vuole stimare il numero medio di anni di scuola frequentati dai residenti di una certa città. Seleziona pertanto 90 unità a caso e trova che una stima puntuale di tale numero medio è 8.4 anni. Sapendo che la deviazione campionaria (ossia la precisione della stima) è 1.8 determinare un intervallo di confidenza al 95%. X −µ S n X −µ ⇒ P − 1.96 ≤ ≤ 1.96 = 0.95 S n ≈ N (0,1) ⇓ σ σ P X − 1.96 ≤ µ ≤ X + 1.96 = 0.95 n n ⇒ 8.4 ± 1.96 1.8 90 = 8.4 ± 0.372 = (8.028, 8.772 ) Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza 3 Media campionar ia: var ianz a nota Se X è la media campionari a di un campione casuale di taglia n estratto da una popolazion e con varian za nota σ 2 , un intervallo di confidenza di coefficien te (1 − α ) per la media della popolazion e è dato da : σ σ X − zα / 2 ≤ µ ≤ X + zα / 2 n n α dove zα / 2 è tale che P (Z < zα / 2 ) = 1 − con Z ≈ N (0,1). 2 Esercizio: Si vuole stabilire se il coefficiente di combustione di un propellente solido usato per potenziare un sistema di fuga per un equipaggio aereo è 50 cm al secondo. La deviazione standard di tale coefficiente di combustione è pari a 2 cm/s. E’ stato selezionato un campione casuale di taglia 25 e si è trovato che la media campionaria è 51.3 cm/s. Costruire un intervallo di confidenza del 95% per la media della popolazione ipotizzando che la popolazione sia gaussiana. Esercizio: Nell’esercizio precedente stabilire la taglia del campione casuale da estrarre se si desidera che la media campionaria differisca dalla media della popolazione per meno di 1.5 cm/s con un coefficiente di confidenza del 95%. Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza 4 Media campionar ia: var ianz a incognita Se X è la media campionaria di un campione casuale di taglia n estratto da una popolazione normale con varianza incognita σ 2 , un intervallo di confidenza di coefficien te (1 − α ) per la media della popolazione è dato da : S S X − tα / 2,n−1 ≤ µ ≤ X + tα / 2,n−1 n n dove S è la deviazione standard campionaria, tα / 2 ,n−1 è tale che P (T < tα / 2,n−1 ) = 1 − con T ≈ T − student con gradi di libertà n-1. α 2 Esercizio : Un articolo nel giornale Materials Engineering (1989) descrive i risultati di un test di adesione su 20 campioni di una certa lega. I coefficienti di fallimento dei 20 campioni sono : 19,8 18,5 17,6 16,7 15,8 14,1 13,6 11,9 11,4 11,4 8,8 7,5 15,4 15,4 19,5 12,7 11,9 11,4 10,1 7,9 Si assuma che i campioni provengano da una popolazione normale. Determinare un intervallo di confidenza al 95% per la media della popolazione. Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza 16,7 15,8 15,4 14,1 13,6 11,9 11,4 11,4 8,8 7,5 15,4 19,5 12,7 11,9 11,4 10,1 7,9 10,1 11,4 11,4 11,4 11,9 11,9 12,7 13,6 14,1 15,4 15,4 15,8 16,7 17,6 18,5 19,5 19,8 Analisi dei dati con Excel 8 7 6 Media Errore standard Mediana Moda Deviazione standard Varianza campionaria Curtosi Asimmetria Intervallo Minimo Massimo Somma Conteggio Più grande(7) Più piccolo(7) Livello di confidenza(95,0%) 5 13,57 0,828 13,15 11,4 3,702929 13,71168 -0,8968 0,10699 12,3 7,5 19,8 271,4 20 15,4 11,4 1,733025 5 4 3 2 1 0 7,5 10,575 13,65 16,725 Altro Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza 6 Var ianz a campionar ia: pop. gaussiana Se S 2 è la varianza campionaria di un campione casuale di taglia n estratto da una popolazione normale con varianza incognita σ 2 , un intervallo di confidenza di coefficiente (1 − α ) per la varianza della popolazione è dato da : (n-1 )S 2 2 ≤ 2 ≤ (n-1 )S 2 2 ,n −1 2 1− 2 ,n−1 α dove χα2 / 2 ,n−1 è tale che P (χ 2 < χα2 / 2 ,n−1 ) = 1 − e χ12−α / 2,n−1 è tale che 2 α P (χ 2 < χ12−α / 2 ,n−1 ) = con χ 2 ≈ chi − quadro con gradi di libertà n-1. 2 Esercizio: Si supponga che lo spessore del filamento di una lampadina sia una caratteristica critica. Per controllare il processo di realizzazione vengono periodicamente esaminati lotti di 20 filamenti appena realizzati e per ciascun lotto vengono misurati gli spessori dei filamenti. Si assuma osservata la seguente realizzazione: 1,05 1,07 1,12 0,92 0,98 1,07 1,11 1,02 0,98 0,99 1,02 1,12 1,05 0,99 0,94 1,05 0,99 1,11 0,97 1,12 relativa ad un campione casuale normale. Si determini un intervallo fiduciario di coefficiente 0,95 per la media e la deviazione standard del campione. Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza 1,12 0,92 0,98 1,07 1,11 1,02 0,98 0,99 1,02 1,12 1,05 0,99 0,94 1,05 0,99 1,11 0,97 1,12 0,97 0,98 0,98 0,99 0,99 0,99 1,02 1,02 1,05 1,05 1,05 1,07 1,07 1,11 1,11 1,12 1,12 1,12 Analisi dei dati con Excel 8 Media Errore standard Mediana Moda Deviazione standard Varianza campionaria Curtosi Asimmetria Intervallo Minimo Massimo Somma Conteggio Livello di confidenza(95,0%) 7 1,0335 0,014054 1,035 1,05 0,062851 0,00395 -1,10392 -0,03437 0,2 0,92 1,12 20,67 20 0,029415 7 6 5 4 3 2 1 0 7,5 10,575 13,65 16,725 Altro Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza 8 Per centuale campionar ia Se pˆ è la proporzion e di osservazio ni in un campione casuale di taglia n estratto da una popolazion e di un certo tipo, un intervallo di confidenza di coefficien te (1 − α ) per la proporzion e vera è dato da : pˆ (1 − pˆ ) pˆ (1 − pˆ ) ≤ p ≤ pˆ + zα / 2 n n α è tale che P (Z < zα / 2 ) = 1 − con Z ≈ N (0,1). 2 pˆ − zα / 2 dove zα / 2 Esercizio: In un campione casuale di 85 alberi motori di automobili, 10 hanno la superficie in uscita più ruvida delle specifiche richieste. Si costruisca un intervallo di confidenza al 95% per la percentuale dei motori difettosi. Quanto deve essere largo il campione se si desidera che la percentuale stimata differisca da quella vera per meno di 0.05 con un coefficiente di confidenza pari al 95%? Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza 9 Due campioni casuali Assun zioni 1. Sia X 11 , X 12 ,Κ , X 1n1 un campione casuale estratto dalla popolazion e 1 con distri buzione simile alla variabile aleatoria X 1 ≈ N( µ1 , σ 12 ) 2. Sia X 21 , X 22 , Κ , X 2 n2 un campione casuale estratto dalla popolazion e 2 con distri buzione simile alla variabile aleatoria X 2 ≈ N( µ 2 , σ 22 ). 3. Le variabili X 1 e X 2 sono indipenden ti. 4. Sia X 1 la media campionaria del campione di taglia n1 e X 2 la media campionaria del campione di taglia n 2 . Poichè E ( X 1 − X 2 ) = µ1 − µ 2 e V ( X 1 − X 2 ) = Z= X 1 − X 2 − µ1 − µ 2 σ 12 σ 22 + n1 n2 σ 12 σ 22 + , la quantità n1 n2 ≈ N (0,1) (teorema del limite centrale) Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza 10 Differ enz e medie campionar ie: var ianz e note Sia X 11 , X 12 , Κ , X 1n un campione casuale estratto dalla popolazion e 1 con distri 1 buzione simile alla variabile aleatoria X 1 ≈ N( µ1 , σ 12 ) e sia X 21 , X 22 , Κ , X 2 n un 2 campione casuale estratto dalla popolazion e 2 con distribuzi one simile alla variabile aleatoria X 2 ≈ N( µ 2 , σ 22 ). Si assuma X 1 indipenden te da X 2 e che le varianze σ 12 e σ 22 siano note. Sia X 1 la media campionari a del campione di taglia n1 e X 2 la media campionari a del campione di taglia n2 .Un intervallo di confidenza di coeffi - ciente (1 − α ) per la differenza delle medie µ1 − µ 2 risulta X 1 − X 2 − zα / 2 σ 12 σ 22 σ 12 σ 22 + ≤ µ1 − µ 2 ≤ X 1 − X 2 + zα / 2 + n1 n2 n1 n2 dove zα / 2 è tale che P (Z < zα / 2 ) = 1 − α con Z ≈ N (0,1). 2 Esercizio: Una ditta produce due differenti tipi di lampadine che vengono sottoposte a un test. Un campione di 35 lampadine della I specie ha funzionato per 408 ore in media mentre un campione di 45 lampadine della II specie ha funzionato per 396 ore in media. Si costruisca un intervallo di confidenza al 95% per la differenza delle medie sapendo che le rispettive varianze delle due popolazioni (normali) sono 25 e 20 ore. Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza 11 Assun zioni 1. Sia X 11 , X 12 , Κ , X 1n1 un campione casuale estratto dalla popolazion e 1 con distribuzi one simile alla variabile aleatoria X 1 ≈ N( µ 1 , σ 12 ) , σ 12 = σ 2 incognita. 2. Sia X 21 , X 22 , Κ , X 2 n2 un campione casuale estratto dalla popolazion e 2 con distribuzi one simile alla variabile aleatoria X 2 ≈ N( µ 2 , σ 22 ) , σ 22 = σ 2 incognita. 3. Le variabili X 1 e X 2 sono indipenden ti. 4. Sia X 1 la media campionari a del campione di taglia n1 e X 2 la media campionaria del campio ne di taglia n 2 . 1 1 Poichè E ( X 1 − X 2 ) = µ1 − µ 2 e V ( X 1 − X 2 ) = σ 2 + n1 n 2 X − X 2 − ( µ1 − µ 2 ) ≈ N (0,1) Z= 1 1 1 + σ n1 n2 , la quantità Se si combinano le varianze campionarie S12 e S 22 , si ottiene uno stimatore di σ 2 S p2 = e la variabile aleatoria T = (n1 − 1) S12 + (n 2 − 1) S 22 n1 + n 2 − 2 X 1 − X 2 − (µ1 − µ 2 ) Sp 1 1 + n1 n 2 ha distribuzi one T - Student con gradi di libertà n1 + n 2 − 2 Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza 12 Differ enz e medie campionar ie: var ianz e incognite e uguali Sia X 11 , X 12 , Κ , X 1n un campione casuale estratto dalla popolazione 1 con distribuzio 1 ne simile alla variabile aleatoria X 1 ≈ N( µ1 , σ 2 ) e sia X 21 , X 22 , Κ , X 2 n un campione 2 casuale estratto dalla popolazione 2 con distribuzione simile alla variabile aleatoria X 2 ≈ N( µ 2 , σ 2 ). Si assuma X 1 indipendente da X 2 e che la varianzaσ 2sia incognita. Sia no X 1 e S12 rispettivamente la media e la varianza campionaria del campione di taglia n1 e X 2 e S 22 rispettivamente la media e la varianza campionaria del campione di taglia n2 .Un intervallo di confidenza di coefficiente (1 − α ) per la differenza delle medie µ1 − µ 2 risulta X 1 − X 2 − tα / 2 ,n + n − 2 S p 1 2 1 1 1 1 + ≤ µ1 − µ 2 ≤ X 1 − X 2 + tα / 2 ,n + n −2 S p + n1 n2 n1 n2 1 ( ) dove tα / 2 ,n + n −2 è tale che P T < tα / 2 ,n + n −2 = 1 − 1 2 1 2 student con n1 + n2 − 2 gradi di libertà e Sp = α , con T variabile aleatoria di T 2 [(n − 1)S + (n 1 − 1)S 22 n1 + n2 − 2 2 1 2 2 ] Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza 13 Esercizio: Si stanno analizzando due catalizzatori per determinare come influenzano il prodotto medio di un processo chimico. Il primo catalizzatore è quello in uso, ma anche il secondo potrebbe essere impiegato, soprattutto perché è più economico, specialmente se non modifica il prodotto medio del processo in esame. Viene effettuato un test e i risultati sono I cataliz. II cataliz. 91,5 89,19 94,18 90,95 91,18 90.46.00 95,39 93,21 91,79 97,19 89,07 97,04 94,72 91,07 89,21 92,75 C’è una differenza significativa? I catalizzatore II Catalizzatore Media Errore standard Mediana Moda Deviazione standard Varianza campionaria Curtosi Asimmetria Intervallo Minimo Massimo Somma Conteggio Livello di confidenza(95,0%) 92,13 0,854016 91,645 #N/D 2,415521 5,834743 -1,50642 0,080259 6,32 89,07 95,39 737,04 8 2,019425 Media Errore standard Mediana Moda Deviazione standard Varianza campionaria Curtosi Asimmetria Intervallo Minimo Massimo Somma Conteggio Livello di confidenza(95,0%) Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza 81,89774 11,20444 91,91 #N/D 31,69094 1004,315 7,809321 -2,7828 93,40806 3,781944 97,19 655,1819 8 26,49427 14 Rappor ti tr a var ianz e campionar ie DISTRIBUZIONE DI FISHER Definizione SianoW e Y due variabilialeatorieindipendenti con distribuzione chi - quadrodi gradi di libertà W/w w e u. Allorail rapporto F = ha funzionedensità della seguenteforma : Y/u w+u Γ 2 f F (x ) = w u Γ Γ 2 2 w/ 2 w (w )− x /2 1 u ,x >0 ( u+w) / 2 w u x + 1 e si dice che la variabilealeatoria F ha distribuzione di Fischer con gradi di libertà w e u. f1−α ,w,u = 1 f α ,u , w , dove fα ,u ,w è tale che P( F > fα ,u ,w ) = α Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza 15 Assun zioni 1. Sia X 11 , X 12 , Κ , X 1n1 un campione casuale estratto dalla popolazion e 1 con distribuzi one simile alla variabile aleatoria X 1 ≈ N( µ 1 , σ 12 ) , σ 12 incognita. 2. Sia X 21 , X 22 , Κ , X 2 n2 un campione casuale estratto dalla popolazion e 2 con distribuzi one simile alla variabile aleatoria X 2 ≈ N( µ 2 , σ 22 ) , σ 22 incognita 3. Le variabili X 1 e X 2 sono indipenden ti. 4. Sia X 1 la media campionaria del campione di taglia n1 e X 2 la media campionari a del campio ne di taglia n 2 . Poichè la variabile aleatoria (n1 − 1) S12 è chi - quadro con gradi di libertà (n1 − 1) e la variabile aleatoria σ 12 (n 2 − 1) S 22 è chi - quadro con gradi di libertà ( n2 − 1), allora la variabile aleatoria σ 22 (n1 − 1) S12 / (n1 − 1) σ 12 = F≈ (n2 − 1)S 22 / (n − 1) 2 σ 22 S12 σ 12 S12 σ 22 = 2 2 S 22 S2 σ1 σ 22 ha distribuzi one F - Fisher con gradi di libertà n1 − 1, n 2 − 1. Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza 16 Rappor ti tr a var ianz e campionar ie Sia X 11 , X 12 , Κ , X 1n un campione casuale estratto dalla popolazion e 1 con distri 1 buzione simile alla variabile aleatoria X 1 ≈ N( µ1 , σ 12 ) e sia X 21 , X 22 , Κ , X 2 n un 2 campione casuale estratto dalla popolazion e 2 con distribuzi one simile alla variabile aleatoria X 2 ≈ N( µ 2 , σ 22 ). Si assuma X 1 indipenden te da X 2 e che le varianze σ 12 e σ 22 siano incognite. Sia S12 la varianza campionari a del campione di taglia n1 e S 22 la varianza campionari a del campione di taglia n2 .Un intervallo di confidenza di coefficien te (1 − α ) per il rapporto tra le varianze σ 12 / σ 22 risulta σ 2 S2 S12 f1−α / 2 ,n −1,n −1 ≤ 12 ≤ 12 f α / 2 ,n −1,n −1 2 σ 2 S2 S2 2 ( 1 2 ) dove f1−α / 2 ,n −1,n −1 è tale che P F < f1−α / 2 ,n −1,n −1 = 2 ( 1 ) P F < f α / 2 ,n −1,n −1 = 1 − 2 1 n2 − 1 e n1 − 1. 2 1 1 α e fα / 2 ,n −1,n −1 è tale che 2 2 1 α e F ha distribuzi one di Fischer con gradi di libertà 2 Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza 17 Esercizio: Sono state condotte delle analisi sulla quantità di calcio presente in un ce- mento standard e in un cemento drogato con piombo. I risultati hanno mostrato che livelli ridotti di calcio indicano una diminuzione del meccanismo di idratazione nel cemento. In tal caso bisognerebbe intervenire con iniezioni di acqua in vari punti della struttura di cemento. In 10 campioni di cemento standard si è registrata una percentuale media di calcio pari al 90%, con deviazione standard stimata del 5%, mentre in 15 campioni di cemento trattato con piombo la percentuale media di calcio è stata stimata pari al 87.0% con una deviazione standard stimata del 4.0%. Assumendo che la distribuzione di calcio nel cemento standard e in quello drogato sia normale con stessa deviazione standard, costruire un intervallo di confidenza del 95% per la differenza delle medie delle due popolazioni. Esercizio: Una compagnia produce motori per turbine. Una delle operazioni consiste nella smerigliatura di una particolare superficie che termina su un componente in lega al titanio. Possono essere impiegate due differenti procedure per la smerigliatura e in media esse producono lo stesso coefficiente di rugosità delle superfici. L’ingegnere responsabile del progetto vuole selezionare la procedura che produce meno variabilità nella rugosità delle superfici trattate. Per questo motivo valuta per 11 campioni ottenuti dal primo processo la deviazione standard del coefficiente di rugosità (5.1 mm) e fa lo stesso per 16 campioni ottenuti dal secondo processo (4.7mm). Cosa può dedurre l’ingegnere? Probabilità e Statistica I - a.a. 04/05 - Intervalli di confidenza 18