Comments
Description
Transcript
Censura
Distribuzioni censurate Troncamento: y<a esiste ma ma non è osservabile Censura: y<a è osservabile come un valore unico Esempi: Acquisto di beni durevoli “Salario di riserva” Posti a teatro Esempio: Siamo interessati alla domanda di biglietti per uno stadio che ha 20.000 posti. Ciò che possiamo osservare sono i biglietti venduti, quindi, quando lo stadio si riempie totalmente ciò che sappiamo è che la domanda di biglietti è SUPERIORE al numero di biglietti venduti. Misurare la domanda di biglietti con il numero di biglietti venduta provoca una CENSURA La teoria per le distribuzioni Censurate è simile (non identica) a quella per le distribuzioni troncate: Se y* è distribuita come una N(,²) Definiamo una variabile y=a se y* <= a y=y* se y* > a La distribuzione di y è una mistura di una parte discreta e di una continua f ( x) densità f ( x / x a) Prob(x a) ripartizio ne infatti: per ya a Pr ob( y a) Pr ob( y* a ) 1 per y a f ( y ) f ( y*) Nel troncamento la densità dei non osservati viene “spalmata” sulla parte non osservata del dominio di y Nella censura la densità non osservata si “concentra” tutta nel punto di troncamento 0,45 0,4 0,35 0,3 y* 0,25 0,2 0,15 0,1 0,05 0 -4 -3 -2 -1 0 1 2 3 4 0,45 0,4 0,35 0,3 y 0,25 0,2 0,15 0,1 0,05 0 -3,5 -3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3 I parametri della distribuzione censurata E ( y ) Pr ob( y a ) E ( y / y a ) Pr ob( y a) E ( y / y a ) Pr ob( y* a ) a Pr ob( y* a ) E ( y * / y* a ) ( ) a 1 ( )( ) Per a 0 E ( y ) dove Media “troncata In maniera più complessa si ottiene la varianza: Var ( y) 2 1 ( ) 1 2 ( ) (si sfrutta la relazione: V(y)=E(var.condiz.)+V(media condiz.) Nel caso di censura a destra y*<a: Si sostituisce con 1- e diventa = -()/() Torniamo all’esempio: Siamo interessati alla domanda di biglietti per uno stadio che ha 20.000 posti. Lo stadio risulta esaurito per il 25% degli eventi sportivi In media (compresi gli esauriti) si vendono 18.000 biglietti per evento Qual è la media e lo scarto della domanda di biglietti? Ovviamente qui y*=domanda di biglietti y= biglietti venduti y=20.000 y=y* per y*>20.000 per y*<=20.000 La censura è a “destra” Esempio continua: E (vendite) 1 ( ) a ( ) ( ) 20000 ( ) ( ) ( ) 0.75 0.675 0.318 0.675 ( ) 0.318 0.424 0.75 quindi 18000 0.25(20000) 0.75( 0.424 ) 0.675 20000 18362 2426 Confronto con il troncamento: 18000 = è media delle vendite quando non c’è il tutto esaurito Il tutto esaurito si verifica il 25% delle volte E (troncata) a ( ) ( ) ( ) 0.75 0.675 0.675 ( ) 0.318 quindi 18000 0.424 0.675 20000 18772 1820 0.318 0.424 0.75