...

Intervalli di confidenza Bootstrap: una veduta dkinsieme e una

by user

on
Category: Documents
64

views

Report

Comments

Transcript

Intervalli di confidenza Bootstrap: una veduta dkinsieme e una
Intervalli di con…denza Bootstrap:
una veduta d’insieme e una proposta per un indice di
cograduazione
ANDREA BONANOMI
Dipartimento di Scienze Statistiche
Università Cattolica S.C., Milano
ABSTRACT: This paper gathers the di¤erent bootstrap methodologies
used to determine non-standard con…dence intervals. The di¤erent formulations seem to result very useful and e¢ cient both when standard intervals
cannot be calculated and because of the advantages in robustness recorded
in the estimation phase. The di¤erent methods (Bootstrap-t, Bootstrap Percentile, BCa, ABC) are presented in detail, considering both their parametric
and non-parametric structure and evaluating the inferential properties. Finally, the di¤erent approaches to determine bootstrap con…dence intervals
were examined for a cograduation index in order to evaluate the propensity
of a measurement scale (generally an ordinal scale) to assign a mainly positive
or negative judgment compared to another scale having the same number of
response alternatives.
Keywords: Bootstrap Con…dence Intervals, Bootstrap-t, Bootstrap percentile, BCa, ABC, Cograduation Index.
1
Introduzione
Gli Intervalli di Con…denza (IC) sono strumenti abitualmente utilizzati nella
statistica metodologica ed applicata in quanto combinano la teoria puntuale
della stima e la veri…ca d’ipotesi in un singolo strumento inferenziale di
grande impatto intuitivo.
Questo lavoro si propone di discutere la costruzione di IC con tecniche
alternative di ricampionamento, tipicamente bootstrap, sia quando è noto
il modello probabilistico sottostante (caso parametrico) sia quando non lo
è (caso non parametrico). Vengono inoltre confrontate tali tecniche nella
1
costruzione di un IC di un indice di cograduazione proposto per la valutazione della propensione di una scala psicometrica ad assegnare giudizi maggiormente positivi oppure negativi rispetto ad un’altra caratterizzata dallo
stesso numero di passi di risposta.
Siano X1 ; X2 ; :::; Xn variabili casuali (v.c.) indipendenti e identicamente
distribuite alla variabile casuale di campionamento X, con incognita funzione
di ripartizione F . Sia bn = b (x1 ; :::; xn ) uno stimatore del parametro di
interesse = (F ), con varianza 2n = var bn e b2n una sua stima. Se Cn =
Cn (x1 ; x2 ; :::; xn ) è un sottoinsieme di < dipendente solo da (x1 ; x2 ; :::; xn ) e
Pr ( 2 Cn )
1
(1)
dove
(0 <
< 1) è una pre…ssata costante, allora Cn è un intervallo
di con…denza per ad un livello 1 – . Pr ( 2 Cn ) è detta “probabilità di
copertura” di Cn . La maggior parte degli IC sono approssimabili, seppur
esistano un ristretto gruppo di intervalli esatti per situazioni particolari;
l’approssimazione tipicamente più utilizzata è rappresentata dall’intervallo
standard.
Se la variabile casuale standard
bn
n
si distribuisce come una variabile casuale Y
N (0; 1), allora l’intervallo di
con…denza standard per ad un livello di con…denza 1 –2 è dato da
bn
z(
)
n
(2)
con z ( ) 100 –mo percentile della v.c. normale standardizzata.
Qualora non si conosca il vero valore n , ma solamente un suo stimatore
bn , allora
bn
(3)
bn
si distribuisce asintoticamente come una v.c. normale standardizzata (e più
in generale come una v.c. t di Student, da cui il nome di (3) di variabile
casuale studentizzata) e l’intervallo
bn
z ( ) bn
2
(4)
rappresenta l’IC approssimato di con livello di con…denza nominale 1 –2
e probabilità di copertura determinata dalla (1).
Gli intervalli standard, implementati solitamente con l’utilizzo della teoria della massima verosimiglianza, hanno indubbi vantaggi, dettati da una
metodologia semplice e completamente automatica, per lo più in ambito parametrico. I problemi con l’utilizzo di IC standard derivano dal fatto che sono
basati su approssimazioni asintotiche che nella pratica, sovente, possono rivelarsi inappropriate. In Di Ciccio –Efron (1996) si dimostra che l’intervallo
(4) può essere anche sensibilmente di¤erente dall’intervallo esatto, in quei
casi nei quali l’intervallo esatto esiste.
Gli intervalli di con…denza bootstrap1 , presentati nelle loro diverse formulazioni nel seguito, appaiono particolarmente utili per ovviare ai problemi
tipici dell’analisi statistica “tradizionale”, in particolare in assenza di distribuzione parametrica nota e nel caso in cui si abbia a disposizione un
campione di numerosità limitata, tenuto comunque presente il fatto che anche in situazioni comunemente parametriche i vantaggi di robustezza delle
stime sono evidenti.
Un confronto con gli IC standard mostra che gli intervalli bootstrap sono
non solo asintoticamente più accurati, ma anche più corretti2 . In quei problemi nei quali esistono gli esatti limiti di con…denza, essi sono tipicamente
espressi nella forma
bn
A(
bn z ( ) + p
)
n
+
B( )
+ :::
n
(5)
dove n indica la dimensione campionaria. Gli IC standard sono corretti
del primo ordine, nel senso che (5) è dominata asintoticamente dal termine
bn bn z ( ) . Tuttavia, il termine del secondo ordine bn Ap( ) ha e¤etto rilevante
n
nelle situazioni di dimensioni campionarie ridotte. Gli IC bootstrap, come
verrà mostrato nel seguito, generano automaticamente una correttezza del
( )
secondo ordine, nel senso che sono espressi nella forma bn bn z ( ) + An
e, con particolari correzioni ed accorgimenti, anche una correttezza del terzo
ordine.
Nel seguito vengono illustrati, nel dettaglio, le più importanti tipologie
di costruzione di intervalli di con…denza bootstrap.
1
Per una veduta d’insieme della tecnica bootstrap si veda Efron B, Tibshirani R. (1993),
An Introduction to the Bootstrap, Chapman and Hall, New York.
2
Per la de…nizione di correttezza di un IC si veda Piccolo (1985), pp. 755-757
3
2
Intervalli di con…denza Bootstrap–t
L’uso di tecniche di ricampionamento di tipo bootstrap porta alla costruzione
di intervalli accurati (dal punto di vista statistico) senza l’assunzione di normalità distributiva, tipica degli intervalli di con…denza tradizionali. In questo
paragrafo viene presentato un primo approccio per la determinazione di IC
bootstrap, estremamente semplice, ma che gode di proprietà ottimali di e¢ cienza.
Sia X = (x1 ; x2 ; :::; xn ) una realizzazione campionaria dall’incognita distribuzione F con componenti i.i.d.. Sia Fb una stima di F (sia parametrica
che empirica); sia, quindi, b (X) uno stimatore dell’incognito parametro di
interesse e b (X) della deviazione standard di b.
Per analogia con la statistica t-student, si de…nisca
T =
b
(6)
b
e sia T ( ) il 100 –mo percentile di T . Il limite superiore di un intervallo di
con…denza ad una coda di livello per è dato da
b
b T (1
)
:
Tale formulazione assume l’ipotesi che il percentile di T sia noto, come nel
caso t-student usuale, dove T ( ) è il percentile di una distribuzione t. Tuttavia
i percentili di T non sono noti nella maggior parte delle situazioni.
L’idea dell’approccio Bootstrap–t è di stimare i percentili di T attraverso
una procedura di ricampionamento bootstrap.
Il primo passo consiste nella stima della distribuzione di campionamento
X e della generazione di B campioni bootstrap X = (X1 ; X2 ; :::; XB ). Ogni
Xb conduce in maniera naturale alla versione bootstrap dello stimatore b ,
con deviazione standard b , portando alla quantità pivotale
T =
b
b
b
replicazione bootstrap di (6). Un elevato numero B di replicazioni (in genere
maggiore di 1000) portano alla stima dei percentili Tb( ) = B –mo valore
ordinato di fT (b) ; b = 1; 2; :::; Bg. Il percentile –mo di T (b) è quindi
4
determinato dal valore Tb(
)
tale che
n
# T (b)
Tb(
B
)
o
= :
[Es: se B=2000, =0.95, allora Tb(0:95) è il 1900–mo percentile delle quantità
pivotali T (b) ordinate].
L’intervallo di con…denza Bootstrap–t è perciò determinato
h
i
b Tb(1 ) b; b Tb( ) b
con < 21 : La procedura di determinazione degli IC bootstrap–t è semplice e
completamente automatizzata con i software statistici di programmazione più
comuni, e di intuitiva interpretazione. Presenta però una serie di problemi:
Per utilizzare tale metodo, si necessita di uno stimatore b2n della varianza. Se non è disponibile alcuno stimatore, è possibile utilizzare uno
stimatore bootstrap vbB per b. Tuttavia se sia Tb( ) che vbB devono essere
approssimati attraverso simulazione Monte Carlo, occorre concatenare
le due simulazioni bootstrap; in sostanza, se si generano B1 campioni
bootstrap per approssimare Tb, per ogni replicazione occorre generare
B2 campioni bootstrap per vbB . Il totale di replicazioni cresce pertanto
velocemente, risultando pari a B1 B2 . Il linguaggio di programmazione
scienti…co R.2.3.1 ha implementato, nei suoi pacchetti, una procedura
per la determinazione di IC bootstrap–t con stabilizzazione della varianza incognita.
L’approccio non è invariante per trasformazione, eccetto per la traslazione. Tale problema risulta, però, comune a tutti quei metodi di stima
intervallare che utilizzano quantità pivotali standardizzate o studentizzate.
I vantaggi sono comunque notevoli: gli IC standard, così come tutti
tradizionali quelli fondati su quantità pivotali studentizzate, sono simmetrici
intorno al valore stimato b. Essendo i percentili derivanti da procedura
bootstrap–t non necessariamente simmetrici, gli intervalli di con…denza ri‡ettono naturalmente tale eventuale asimmetria, particolarmente e¢ cace nel
caso di distribuzioni tendenzialmente lontane dalla Normale. Più speci…catamente, nel caso non parametrico l’approccio tradizionale si basa su
5
un’approssimazione normale della distribuzione; il bootstrap–t utilizza la generazione di data–set della distribuzione empirica Fn e il calcolo di una quantità Tb(1 ) . In questa situazione il metodo porta ad una soluzione migliore
dell’approssimazione normale, in particolare in presenza di una numerosità
campionaria ridotta, e per la determinazione di intervalli di statistiche di
locazione (media, mediana, media troncata e percentili campionari).
Un ultimo, ma non per importanza, indubbio vantaggio riguarda la proprietà di accuratezza di cui godono gli intervalli bootstrap–t.
Si supponga di avere un parametro di interesse per il quale si costruisce
un intervallo di con…denza. Per comodità si consideri un IC ad una coda
e quindi un singolo valore limite b [ ]. Un estremo dell’intervallo si dice
accurato del primo ordine se
h
i
b [ ] = + O n 1=2
Pr
e del secondo ordine se
Pr
h
i
b[ ] =
1
+O n
:
Mentre gli IC standard godono solo dell’accuratezza del primo ordine se la
distribuzione non è normale, gli intervalli bootstrap–t, come si vedrà per tutte
le procedure di determinazione di intervalli e regioni con tecniche di ricampionamento, sono accurati almeno del secondo ordine.
La nozione di correttezza si riferisce, invece, a quanto un “possibile”limite
di un intervallo si avvicina ad un “ideale” (o, qualora esista, ad un esatto)
punto estremante di con…denza.
Sia bESAT T O [ ] un limite di con…denza esatto tale che
h
i
bESAT T O [ ] = .
Pr
Un intervallo di con…denza viene detto corretto del primo ordine se
b [ ] = bESAT T O [ ] + o n 1=2 b
e del secondo ordine se
b [ ] = bESAT T O [ ] + o n
1
b:
Si può agevolmente veri…care che la correttezza di un dato ordine implica
l’accuratezza dello stesso ordine.
Gli intervalli bootstrap–t (si veda per le dimostrazioni analitiche nel dettaglio Hall, 1988 e Di Ciccio & Efron, 1992) sono corretti, e quindi accurati,
del secondo ordine.
6
3
Intervalli di con…denza bootstrap percentile
In una serie di lavori e articoli, Efron [1981, 1985, 1987, 1996] ha introdotto
e de…nito una procedura, denominata Bootstrap percentile, per determinare
intervalli di con…denza per un parametro scalare (estendibile anche nel caso
multiparametrico) utilizzando approssimazioni bootstrap. Verrà ora esaminata la versione più semplice di tale metodo, denominata Intervallo di con…denza Bootstrap percentile. Nei successivi paragra… verranno illustrati gli
ulteriori sviluppi e perfezionamenti metodologici e computazionali.
L’approccio caratteristico del metodo percentile viene naturalmente sviluppato nel contesto più semplice di un modello parametrico dipendente da
un parametro scalare e di fatto adattato con buoni risultati per applicazioni
a famiglie multiparametriche e situazioni tipicamente non parametriche.
Sia X = (x1 ; x2 ; :::; xn ) un campione da una distribuzione avente funzione
di densità f dipendente da un parametro scalare . Sia b uno stimatore di
ottenuto da X con funzione di ripartizione G (k) = Pr b k . Il limite
superiore di con…denza di livello 1 –
che soddisfa la condizione
G
(1
di
è determinato dal valore
(1
)
b =
)
con G distribuzione bootstrap per b.
Si supponga ora che esista una trasformazione monotona crescente h e
una costante tale che, 8 ;
n
o
h b
h( )
Z
(7)
dove Z è simmetricamente distribuita attorno alla media nulla con funzione
di ripartizione H.
Allora
G (s) = H f [h (s) h ( )]g ;
di conseguenza, essendo z (
G
1
(1
G
1
)
=H
1
( )
)=h
e
( )=h
1
1
z (1
h b +
z(
h b +
7
)
)
:
Dal momento che (1 ) = G 1 (1
), l’IC di può essere ottenuto direttamente dalla funzione di ripartizione bootstrap di b senza esplicita conoscenza
della trasformazione h, supponendone esclusivamente l’esistenza. La quantità Gb 1 (1
) è detta il limite di con…denza bootstrap percentile.
Tipicamente non esiste alcuna trasformazione h tale per cui si ottenga
esattamente (7), e la di¤erenza tra Gb 1 (1
) e (1
) è nell’ordine di
1
o (n ); perciò il metodo percentile, senza ulteriori accorgimenti e modi…che, può risultare debole con dimensioni campionarie ridotte. In sostanza
il metodo è facilmente riassumibile nei seguenti passi.
Sia X un campione bootstrap generato da Fb ! X , dove Fb è la stima
di F , funzione di ripartizione della variabile X di campionamento, e sia
b = s (X ) una replicazione bootstrap della stima del parametro scalare
b
di interesse, con funzione di ripartizione pari a G.
L’intervallo percentile di livello nominale 1 2 è de…nito dai percentili
b
di livello e 1 – di G.
h
i
i h
b% inf ; b% sup = G
b 1( );G
b 1 (1
) :
b
Dalla de…nizione G
( ) = b ( ) si giunge a
h
i h
b% inf ; b% sup = b ( ) ; b (1
1
i
) :
[Es: si e¤ettuano 1000 replicazioni della stima di un parametro b , si …ssa
= 0:05; l’intervallo è semplicemente de…nito ordinando le 1000 stime e
considerando il 50-mo e il 950-mo valore delle replicazioni].
Se la distribuzione bootstrap di b è tendenzialmente normale, allora la
determinazione degli IC standard e con il metodo bootstrap percentile è pressoché la medesima. Di¤erenze, anche importanti, si hanno per campioni non
numerosi con distribuzioni fortemente asimmetriche (e quindi lontane dalla
situazione di normalità). In tale situazione la discrepanza tra IC standard
e IC bootstrap percentile è notevole, ad ovvio vantaggio del metodo bootstrap che più naturalmente asseconda la non simmetria distributiva. Ciò non
consegue che tale metodo sia ottimale, in special modo se n non è “su¢ cientemente”grande, e necessita di un’importante correzione, che nella letteratura
ha portato alla determinazione di intervalli di con…denza bootstrap percentile
corretti. Data la natura approssimata degli IC bootstrap percentile, se ne
discuteranno le proprietà di accuratezza e correttezza solo per le più precise
versioni corrette.
8
4
Intervalli di con…denza bootstrap percentile
corretti e accelerati
In questa sezione del lavoro vengono presentati i metodi di determinazione
di IC bootstrap derivanti dal metodo percentile, apportati con una sorta di
“correzione”.
L’intervallo di con…denza bootstrap corretto (BC) deriva sostanzialmente
dal metodo percentile precedentemente illustrato, e da un modello che generalizza ed estende le proposte del semplice metodo bootstrap percentile.
L’approccio migliorativo considera la distorsione in (7).
Si assume l’esistenza di una trasformazione monotona crescente h, e due
costanti e z0 tali che, 8 ;
n
o
h b
h ( ) + z0 Z
dove Z è presentata nella sezione precedente. In tale contesto
G (s) = H f [h (s)
h ( )] + z0 g
con le notazioni già utilizzate, da cui segue che
G
1
(1
G
1
)=h
e
( )=h
1
1
z (1
h b +
)
+ z0
z ( ) + z0
h b +
:
Dal momento che, per costruzione, (1
) = G 1 H z (1 ) + 2z0 , quindi
l’intervallo per il parametro scalare incognito può essere ottenuto dalla
distribuzione bootstrap di b. La correzione della distorsione z0 può essere
ottenuta in via del tutto analoga da
h
i
1
b
z0 = H
G
:
In luogo della funzione H, Efron (1982) suggerisce la distribuzione normale
standardizzata e de…nisce così
b !G
1
z (1
9
)
+ 2z0
il limite di con…denza bootstrap percentile corretto (BC). E’ evidente che,
qualora z0 sia pari esattamente a zero, l’approccio BC coincide con il bootstrap percentile.
Come per il caso del bootstrap percentile, tipicamente anche i limiti
del BC di¤eriscono dai limiti esatti, qualora essi esistano, per un valore
dell’ordine di grandezza pari a o (n 1 ). Nel caso, però, di un campione ridotto
o della stima di parametri in particolari situazioni, (si veda Schenker, 1985),
il metodo BC produce approssimazioni non su¢ cientemente accurate. Nonostante sia possibile mostrare il miglioramento rispetto al metodo percentile
più semplice, tale approccio risulta in parte non adeguato. Schenker (1985)
mostra infatti che la probabilità di copertura dell’IC BC è sostanzialmente
inferiore al suo livello nominale per piccoli campioni.
Per migliorare il bootstrap corretto e ovviare i problemi emersi, Efron e
altri hanno sviluppato un’ulteriore correzione, aggiungendo una costante a
detta accelerazione.
Utilizzando le medesime notazioni, si supponga l’esistenza di una trasformazione monotona crescente h, e di tre costanti, e z0 e a tali che, 8
8
9
<h b
h ( )=
+ z0 Z
(8)
: 1 + a h( ) ;
dove Z è precedentemente descritta.
Con questa assunzione
h (s) h ( )
+ z0 ;
1 + a h( )
G (s) = H
cui segue che
G
1
(1
)=h
e
G
1
( )=h
I limiti di con…denza di
momento che
(1
)
1
1
"
"
z (1 ) + z0 [1 + a h ( )]
h b +
f1 a (z (1 ) + z0 )g
h b +
z (1
)
+ z0 [1 + a h ( )]
#
#
:
si ottengono dalla distribuzione bootstrap di b, dal
=G
1
"
H
(
z0 +
10
1
z (1 ) + z0
a (z (1 ) + z0 )
)#
h
i
e z0 = H 1 G b . Sostituendo a H la distribuzione normale standard,
si ottengono i limiti di con…denza bootstrap percentile corretti accelerati BCa
(9)
" (
)#
(1
)
z
+
z
0
(1
)
=G 1
z0 +
:
(9)
(1
)
1 a (z
+ z0 )
Se a = 0 il metodo BCa coincide con il metodo BC.
Sia un parametro di interesse; siano b una stima di basata sui dati
osservati X , generalmente stima di massima verosimiglianza, e b = b (X ) è
una replicazione bootstrap di b ottenuta ricampionando X con procedimento
bootstrap da una stima della distribuzione originaria X .
b (s) la funzione di ripartizione delle B replicazioni bootstrap delle
Sia G
stime b (b) con b = 1; :::; B,
n
o
# b (b) < s
b (s) =
:
(10)
G
B
Il limite superiore di in un intervallo ad una coda BCa di livello è de…nito
b e dalle costanti z0 (correzione di distorsione) e a (accelerazione). La
da G
de…nizione del limite BCa è quindi
" (
)#
( )
z
+
z
0
1
z0 +
BCa ( ) = G
1 a (z ( ) + z0 )
funzione di ripartizione della v.c. normale standardizzata, con z ( ) =
1
( ).
Nel caso classico della ricerca di un intervallo di con…denza a due code ad
un livello di con…denza nominale di 1 2 , l’intervallo BCa è ottenuto da
h
i h
i
bBCa inf ; bBCa sup = b
b
(
)
;
(1
)
BCa
BCa
con
dove
BCa
( )=G
1
e
BCa
(1
)=G
1
" (
z0 +
" (
z0 +
11
)#
1
z ( ) + z0
a (z ( ) + z0 )
1
z (1 ) + z0
a (z (1 ) + z0 )
)#
:
Il problema diventa pertanto ora la stima delle due costanti a e z0 caratterizzanti il modello. Si noti, in prima istanza, che se entrambe sono nulle,
allora
1
( )
BCa ( ) = G
e l’intervallo BCa coincide con l’intervallo percentile. Nel caso ulteriore in
cui G è perfettamente Normale, allora l’IC BCa coincide con l’intervallo
standard.
In generale, evidentemente, a e z0 di¤eriscono da zero (anche se tipicamente hanno un campo di variazione ridotto), producendo di fatto IC anche fortemente asimmetrici intorno al valore stimato b. Gli intervalli BCa
b e le due costanti a e z0 .
richiedono di calcolare la distribuzione bootstrap G
La distribuzione bootstrap è ottenuta direttamente da (9). Tale calcolo, come
b (s), non richiede esplicita conoscenza della funsi ricava dalla de…nizione di G
zione monotona crescente h (8), ma esclusivamente di supporne l’esistenza.
Le due costanti possono essere ottenute direttamente dalla funzione di
distribuzione bootstrap delle stime b : La correzione di distorsione z0 è facilmente calcolabile e interpretabile: alla luce della costruzione attraverso l’impiego della funzione monotona crescente h, si de…nisce la costante z0 come
h
i
1 b b
z0 =
G
(11)
b b , funzione di ripartizione delle
e può essere calcolata direttamente da G
replicazioni bootstrap della stima del parametro. Quindi, nella sua formulazione più semplice, risulta
o3
2 n
# b (b) < b
14
5;
zb0 =
(12)
B
1
funzione inversa della normale standard
della proporzione di replicazioni
bootstrap strettamente minori del valore stimato b.
La seconda costante, detta accelerazione a, misura la velocità di propagazione dell’errore standard sulla scala normalizzata dei valori. La stima di a,
seppur più complessa di quella di z0 , è facilitata da una semplice relazione
che coinvolge la score function di Fisher.
Si supponga di avere una famiglia monoparametrica con funzione di ripartizione G b , con b stimatore almeno asintoticamente di massima verosimiglianza. La costante a, con buona approssimazione, è de…nita in termini di
12
asimmetria della score function:
dove
1
a = SKEW =b l b
6
n
@
b
=
log g
l
@
b
(13)
o
@G (b)
con g b densità di frequenza de…nita @b .
In Efron (1987), Section 10, si trova la dimostrazione completa del risultato (13). Viene di seguito riportata solo una traccia della stessa dimostrazione,
seguendo l’approccio di Shao et al.
Shao, discutendo il controesempio di Schenker riguardo all’ine¢ cacia del
metodo Bootstrap percentile corretto nella sua versione più semplice, introduce un’assunzione più generale che coinvolge l’asimmetria. Con le notazione
già utilizzate nel lavoro, si de…nisce Z
2
3
h b
h( )
Z = Pr 4
+ z0 x5
(14)
1 + a h( )
Si consideri il caso parametrico in cui F = Fp ; 2 <. Si supponga che
2
n(b )
var bn = n e i primi tre cumulanti 3 di tn =
soddis…no le seguenti
condizioni, per qualche funzione j :
( )
k1 (tn ) = p1
+O n
n
k2 (tn ) = 1 + O n
1
1
( )
k3 (tn ) = p3 3 + O n
n
1
Si supponga che esistano continue le derivate almeno …no al secondo ordine
della funzione monotona crescente h. E’possibile (Pfanzagl 1985), ottenere
3
1 , 2 , 3 , indicano i coe¢ cienti rispettivamente del I, II e III termine nell’espansione
di Edgeworth del logaritmo della funzione caratteristica di tn .
13
dalla (14) l’espansione
Pr
p
n[h(b) h( )]
h0 ( )
(x)
(x2 p1)'(x)
Se h soddisfa (14), allora
n
h
p1
n
3(
6
h
)
3
1(
+
)
+
h00 ( )
2h0 ( )
h00 ( )
2h0 ( )
i
i
x =
(15)
1
+ O (n )
h0 ( )
p
= 1 + a h( );
n
poiché h(x) genericamente può essere espresso come
82 x
9
3
Z p
<
=
1
a n 5
h (x) = exp 4
d
1 :
:
;
a
0
E’possibile determinare a tale che
2
h b
h( )
Pr 4
+ z0
1 + a h( )
3
x5 =
(x) + O n
1
(16)
Ora, ponendo il secondo termine di (15) uguale a zero, si ottiene, dopo alcuni
passaggi algebrici,
1 d
3( )
a = a( ) = p
3 3
n d
e
1
h00 ( )
1
1( )
1( )
3( )
z0 = z0 ( ) = p
+
=p
:
0
2h ( )
6 3
n
n
Se b è stimatore MLE di
a=
1
@3l ( )
E
6
@ 3
e l ( ) la funzione di log-verosimiglianza, allora
@2l ( )
E
@ 2
3=2
1
@l ( )
= SKEW
6
@
(17)
.
E’possibile altresì dimostrare che gli intervalli BCa godono delle proprietà
di accuratezza e correttezza del secondo ordine.
14
La dimostrazione, molto complessa e tecnica (si veda per i dettagli Efron,
1996), si basa sostanzialmente sulla prova che la distribuzione cumulata bootb b
b b
strap di T = b di¤erisce da T = b per una quantità pari a o n 3=2 ;
analogamente la correttezza si dimostra con medesimo procedimento, confrontando i limiti di con…denza bBCa ( ) con i limiti di con…denza esatti.
La complessità dei passaggi matematici (sostanzialmente connessi allo
studio dei primi tre cumulanti di ogni distribuzione) non suggerisce in questo
lavoro un’analisi più approfondita.
Uno sguardo d’insieme dei metodi …no ad ora proposti mostra che, mentre in particolari situazioni (ad esempio, determinazione di IC ad una coda)
il bootstrap percentile e il bootstrap percentile corretto sono accurati solo del
primo ordine, il metodo bootstrap–t e bootstrap corretto accelerato sono sempre accurati …no al secondo ordine. A fronte però di una maggiore accuratezza, l’utilizzo degli ultimi due approcci è talora complesso dal punto di
vista computazionale (il bootstrap–t richiede necessariamente un valido stimatore della varianza e una trasformazione per stabilizzare la stessa, il BCa
uno stimatore del parametro d’accelerazione), mentre gli altri appaiono di
utilizzo più immediato. Lo sviluppo, però, di linguaggi di programmazione
speci…ci (in particolare il software free R) ha reso però possibile semplicemente l’utilizzo di tutti i metodi qui descritti.
5
Intervalli di con…denza ABC
In…ne viene presentata un’approssimazione del metodo BCa, detto ABC (Approximate Bootstrap Con…dence). In molte situazioni, infatti, è possibile approssimare il BCa analiticamente, senza ricorrere all’utilizzo di replicazioni
Monte Carlo, portando, ovviamente, ad un dispendio computazionale fortemente ridotto.
Il metodo ABC trova naturale impiego come versione analitica del BCa
per determinati parametri di distribuzioni appartenenti alla famiglia esponenziale, anche se l’utilizzo maggiore si ha per particolari problemi di natura
non parametrica.
L’approccio ABC richiede un ulteriore parametro da stimare rispetto ai
due tipici del BCa (zb0 e b
a), detto parametro di non linearità cq , ma non
b
richiede la stima di G, funzione di ripartizione bootstrap del parametro b.
Generalmente la funzione di densità di una famiglia esponenziale k-parame15
trica può essere scritta come
g
(X )
= exp [ 0 y
( )] ;
dove X sono i dati campionari, y = Y (X ) è un vettore k-dimensionale di
statistiche su¢ cienti, è un vettore k-dimensionale di parametri naturali,
= M (y) e ( ) è una funzione dipendente solamente dai parametri. I
vettori e sono in corrispondenza biunivoca uno-a-uno; l’algoritmo ABC
sfrutta proprio la relazione tra e
=f( )
che fortunatamente ha semplice formulazione per tutte le più comuni distribuzioni appartenenti alla famiglia esponenziale.
Lo stimatore di massima verosimiglianza (MLE) di è b = y, cosicché lo
stimatore MLE di un parametro reale = t ( ) è
b = t (b) = t (y) :
Sia ( ) = cov (y) la matrice di varianze-covarianze k k di y e sia b =
(b) la stima di massima verosimiglianza di . La stima dell’errore standard
di b = t (b) dipende da b . Sia t il vettore gradiente di = t ( ) nel punto
=b
0
@t
; :::
:
t = :::;
@ i
=b
Allora
b = t 0b t
1=2
(18)
è la stima parametrica dell’errore standard.
I valori stimati di b utilizzati negli IC standard sono trovati per di¤erenziazione numerica
@t
@ i
=
t (b + "ei )
t (b
2"
b
"ei )
(19)
per valori di " piccoli a piacere.
In genere b è semplice da calcolare per la maggior parte delle distribuzioni
più comuni della famiglia esponenziale.
16
Il primo passo dell’algoritmo ABC avviene stimando b da (18) e (19).
Quindi i parametri a, z0 e cq sono stimati con k + 2 derivate seconde.
Le prime k derivate determinano b
a:
h
i
@2
0
f
(b
+
"t)
@"2 t
"=0
b
a=
;
(20)
6b3
con b stimatore MLE del vettore di parametri naturali (nel caso di famiglia
esponenziale monoparametrica (20) è identica alla stima di b
a nell’approccio
BCa (13)).
Quindi
b
@2
t b + "b t
@"2
"=0
cbq =
2b
e cq misura la “non linearità”del parametro in funzione di .
Le k derivate …nali sono richieste per la determinazione del parametro
di correzione di distorsione z0 . La stima dell’errore di b = t (b) può essere
espressa come
k
X
@2
1=2
bb = 1
t b + "di i
2 i=1 @"2
"=0
dove di è l’i-mo autovalore e
quindi
zb0 =
1
i
l’i-mo autovettore di b . La stima di zb0 risulta
2 (b
a)
cbq
bb
b
!!
=b
a + cbq
bb
.
b
La formulazione più semplice degli intervalli ABC, denominata ABC quadratico (ABCq ), fornisce limiti di con…denza di livello come funzione di cinque
valori:
! ! = zb0 + z ( )
= (1 !ba!)2 ! = + cq 2
! bABC ( ) = b + b
o espresso nella forma esplicita
8
"
#2 9
<
=
( )
( )
zb0 + z
zb0 + z
b
b+b
(
)
=
+
c
:
q
2
ABC
: 1 a (zb0 + z ( ) )2
1 a (zb0 + z ( ) ) ;
17
L’approccio ABC, in tutte le sue di¤erenti espressioni, è completamente automatizzato in algoritmi elettronici che ne rendono estremamente semplice
la determinazione computazionale. Come il metodo BCa, dal quale in parte
deriva, gode di ottime proprietà di accuratezza e correttezza …no al secondo
ordine.
6
Intervalli di con…denza Bootstrap – Caso
non parametrico
L’estensione dei metodi di costruzione degli intervalli di con…denza bootstrap
è facilmente adattabile in ambito non parametrico, dove le tecniche di ricampionamento trovano la loro naturale applicazione. In particolare, nel seguito,
si vedrà l’adattamento degli approcci bootstrap–t, BCa e ABC in tale nuovo
contesto.
Sia X = (x1 ; x2 ; :::; xn ) un campione osservato da un’incognita distribuzione di probabilità F
x1 ; x2 ; :::; xn
F:
i:i:d:
Sia Fb la distribuzione empirica di X , che assegna probabilità pari a n1 ad
ogni determinazione xi di X . Sia, quindi, = t (F ) un parametro scalare
di interesse e b = t Fb la sua stima non parametrica (stima di massima
verosimiglianza non parametrica).
Sia X = (x1 ; x2 ; :::; xn ) un campione bootstrap non parametrico casuale
di dimensione n estratto da Fb
x1 ; x2 ; :::; xn
Fb:
X è un campione casuale di dimensione n estratto con riposizione da X =
(x1 ; x2 ; :::; xn ). Il campione bootstrap X fornisce una replicazione bootstrap
di b,
b = t Fb ;
dove Fb è la distribuzione empirica bootstrap di X pari a n1 ad ogni deterb b (s) è la probabilità che
minazione xi . La funzione cumulativa bootstrap G
F
una replicazione bootstrap sia minore di s
b b (s) = Pr b < s :
G
F
Fb
18
b b è calcolabile tipicamente con simulazione Monte Carlo; in genere è possiG
F
b b è ricostruibile mostrare che, con almeno B=2000 replicazioni bootstrap, G
F
ta ottimamente.
I limiti di con…denza nel metodo percentile e BC sono facilmente determinabili: i limiti superiori di con…denza di livello 1 – per ottenuti dai
metodi percentile e BC sono, rispettivamente,
e
b 1
G
Fb
dove
z0 =
b 1 (1
G
Fb
z (1
n
o
1
bb b
G
=
F
)
)
1
+ 2z0
i9
8 h
< # b (b) < b =
:
B
;
:
(21)
L’implementazione del metodo BCa è meno diretta dal momento che richiede
la stima non parametrica dei due parametri a e z0 .
La formula (21) fornisce la stima di zb0 , mentre la stima dell’accelerazione
b
a è ottenuta utilizzando la “funzione empirica”Ui della statistica b = t Fb
t (1
Ui = lim
"!0
") Fb + "
i
"
t Fb
, i = 1; 2; :::; n
(22)
con i che indica il punto di massa su xi ; (1 ") Fb + " i è la versione di Fb
ponderando maggiormente i punti xi e meno gli altri punti. Ui risulta quindi
essere la derivata della stima b rispetto alla massa su xi . (22) presuppone
che t Fb sia di¤erenziabile in un intorno di Fb.
La formula dell’accelerazione a è
2
3
n
P
3
Ui
7
16
7
6 i=1
a= 6
(23)
7
3=2
n
64 P
5
2
Ui
i=1
relativamente semplice da utilizzare dal momento che Ui può essere valutata
facilmente usando le di¤erenze …nite in (22).
(23) appare completamente diversa rispetto a (17); di fatto si tratta della
stessa formulazione, in ambito non parametrico, di un’appropriata situazione
multinomiale (si veda Efron, 1987, Section 8).
19
6.1
Esempio: La Media
Sia F una distribuzione de…nita nel supporto reale, = t (F ) è il valore
atteso EF (X). La funzione Ui è de…nita come (xi x) e (23) diventa
8
9
8
9
n
n
P
P
>
>
>
>
>
>
>
>
>
>
(xi x)3 >
(xi x)3 n >
<
=
<
=
i=1
i=1
1
1
= 6p n
=
a= 6
3=2 >
3=2 >
n
n
>
>
P
P
>
>
>
>
>
>
>
>
:
;
:
;
(xi x)2
(xi x)2 n
i=1
i=1
!
1
b
b3
1
b3
= p
= p
= p
3=2
3=2
6 n b2
6 n b
6 n
dove bk è il k-momento centrale campionario e b l’indice di asimmetria (skewness) di Fisher campionario.
Nel caso più generale, il metodo più semplice per la stima di b
a è data
b
sfruttando le quantità jacknife della statistica di interesse = s (X ). Sia
X(i) il campione originario di dati privo del punto i-mo xi ; sia b(i) = s X (i)
n b
P
(i)
la statistica di interesse stimata nel campione x(i) . Sia in…ne b( ) =
.
n
i=1
La più semplice formulazione dell’accelerazione in ambito non parametrico è
data da
n
3
P
b( ) b(i)
b
a=
i=1
n
P
b( )
6
i=1
b(i)
2
3=2
:
Gli intervalli di con…denza BCa non parametrici sono corretti del secondo
ordine per ogni tipologia di parametro di interesse. L’estensione del criterio ABC nel caso non parametrico è decisamente semplice e vantaggiosa in
quanto riduce sensibilmente il “peso”computazionale dell’approccio BCa. La
procedura, che richiede in tale ambito di un numero ridotto di rivalutazioni,
segue strettamente quella parametrica già presentata, ed è quindi adattata
in un contesto non parametrico.
20
7
Confronto delle tecniche per la determinazione di un intervallo di con…denza per
un indice di cograduazione
Sono stati, in…ne, confrontati i diversi approcci per la determinazione degli
intervalli di con…denza bootstrap per un indice di cograduazione per valutare
la propensione di una scala di misurazione (comunemente categoriale ordinale) ad assegnare giudizi maggiormente positivi ovvero negativi rispetto ad
un’altra caratterizzata da uno stesso numero di passi di risposta.
Un problema tipico nella statistica psicometrica è infatti la determinazione della scelta di scala di risposta ottimale. Parecchi studi (si veda
in particolare Bonanomi, 2004) hanno dimostrato che l’utilizzo di scale di
misurazione di¤erenti, pur con lo stesso numero di passi di risposta, porta
a “valutazioni” anche sensibilmente di¤erenti. In Bonanomi (2004) viene
proposto un indice di cograduazione o di propensione per misurare la tendenza ad attribuire giudizi maggiormente positivi ovvero negativi utilizzando
di¤erenti scale di risposta.
Siano S1 e S2 due scale di risposta ordinate caratterizzata da m passi
di risposta, rispettivamente s1i e s2j , i=1,. . . ,m, j=1,. . . ,m. Ad uno stesso
gruppo di n soggetti viene proposto uno stesso stimolo (o item) in un questionario di valutazione di un particolare bene/servizio. Lo scopo dell’indice
proposto è quello di valutare la propensione ad attribuire punteggi maggiormente positivi o negativi nell’utilizzo di una scala.
Determinata la tabella di contingenza (Tab 1) che raccoglie le risposte
degli soggetti all’item proposto valutato nelle due scale
Tab.1: Tabella di contingenza delle frequenze assolute delle risposte dei
soggetti con Scala 1 e Scala 2
Scala 2
Scala 1 s21
s1j
s1m Tot
s11
n 11
n 1j
n 1m n 1
..
..
..
..
..
..
..
.
.
.
.
.
.
.
s1i
..
.
n i1
..
.
s1m
Tot
n m1
n1
..
.
n ij
..
.
n mj
nj
21
..
.
n im
..
.
ni
..
.
n mm
nm
nm
n
si de…nisce l’indice di propensione rapportando la di¤erenza tra la somma
delle frequenze presenti nel triangolo superiore alla diagonale principale e la
somma delle frequenze collocate nel triangolo inferiore e per il totale delle
frequenze n.
In termini formali, si indichi tale indice di propensione con Ip
Ip =
I
J
P
P
nij
i=1 j=i+1
J
I
P
P
j=1 i=j+1
n
nij
1
Ip
1:
(24)
Un valore positivo dell’indice evidenzia la propensione sistematica ad attribuire valori più elevati quando si utilizza la scala i cui termini sono posti
per colonna della tabella (Scala 2); viceversa un valore negativo dell’indice
evidenzia la propensione sistematica ad attribuire valori più elevati quando si
utilizza la scala i cui termini sono posti per riga (Scala 1): Qualora tale indice
assume il valore esatto di 0, siamo in situazione di indi¤erenza, cioè non si
evidenziano propensioni né per una scala né per l’altra. Quando si veri…ca
perfetta concordanza tra le scale, cioè che tutte le frequenze sono concentrate sulla diagonale principale (corrispondenza perfetta tra i diversi ranghi
della scala), allora l’indice assume esattamente il valore 0. Se le discordanze
(cioè le frequenze tendono a concentrarsi sopra la diagonale principale ovvero
sotto) sono a favore della scala in colonna, allora signi…ca che è presente una
propensione all’attribuzione di ranghi maggiormente elevati per tale scala.
Il valore massimo che tale indice assume è pari a 1, quando tutte le frequenze sono concentrate nel triangolo superiore della tabella; viceversa il
valore minimo che tale indice assume è pari a 1, quando tutte le frequenze
sono concentrate nel triangolo inferiore della tabella. Tale indice risulta pertanto normalizzato (in senso improprio) tra gli estremi –1 e 1.
L’utilizzo di intervalli di con…denza bootstrap non parametrici va visto,
quindi, nell’ottica della costruzione di un test, evidentemente non parametrico, del tipo
H0 : Ip = 0
H1 : Ip 6= 0
per saggiare l’ipotesi nulla che l’indice di propensione sia uguale a zero, cioè
che sia indi¤erente valutare un item con una scala ovvero con l’altra.
A tal proposito è stato calcolato l’indice di propensione (24) per alcuni
item di un questionario sulla didattica universitaria. Sono stati confrontati gli
approcci di costruzione di intervalli di con…denza bootstrap con l’approccio
22
classico degli intervalli standard, al variare della numerosità campionaria,
per valutare l’accettazione di H0 , e valutati i miglioramenti in termini di
“ampiezza dell’intervallo” passando dall’approccio standard ai metodi non
parametrici di ricampionamento bootstrap. L’applicazione è realizzata confrontando due scale psicometriche di misurazione, una gra…ca a 5 intervalli
(Scala 1 –punteggio minimo 1, punteggio massimo 5) e una verbale a cinque
passi (Scala 2, esplicitata nelle modalità ordinate insu¢ ciente, mediocre, suf…ciente, buono, ottimo). E’stato chiesto di valutare l’aspetto didattico generale di un’università prima da 250 studenti, poi da solo 45 studenti della
facoltà di giurisprudenza, in…ne da 12 studenti di una facoltà economicobancaria.
Le tre successive tabelle di contingenza riportano le distribuzioni di frequenze congiunte rispettivamente nel caso di n=250 (Tab.2), n=45 (Tab.3),
n=12 (Tab.4).
Scala 1 insu¤
1
2
2
2
3
4
5
Tot
4
Tab. 2 : n=250, Ip=0,176
Scala 2
mediocre
su¤
buono
13
3
14
18
3
10
61
38
2
9
59
1
8
39
92
108
Scala 1 insu¤
1
3
2
3
4
5
Tot
3
Tab. 3 : n=45, Ip=0,177
Scala 2
mediocre su¤
buono
2
1
6
5
2
11
3
3
4
1
10
20
8
23
ottimo
1
6
7
ottimo
1
2
1
4
Tot
18
37
109
71
15
250
Tot
6
11
17
9
2
45
Scala 1 insu¤
1
2
3
4
5
Tot
0
Tab. 4 : n=12, Ip=0,333
Scala 2
mediocre su¤
buono
1
1
1
2
2
1
2
2
4
4
ottimo
1
1
2
Tot
1
2
4
4
1
12
Seguono poi i risultati della costruzione degli intervalli di con…denza standard e bootstrap relativi all’indice di propensione Ip ; le applicazioni sono
state sviluppate in ambiente Microsoft Excel 2000 e R 2.3.1, (free version).
Tutte le simulazioni bootstrap sono state realizzate con un numero di replicazioni pari a B=2000.
Nel caso di numerosità campionaria ridotta si può notare un comportamento eterogeneo dei metodi bootstrap rispetto all’approccio standard (che
non ha, in tale situazione, ragione d’esistenza). Al crescere della numerosità
campionaria i metodi bootstrap appaiono sistematicamente migliori in termini di ampiezza dell’intervallo), al di là delle già enunciate maggiori proprietà di accuratezza e correttezza. In particolare il Bootstrap –t con varianza
stabilizzata sembra essere il migliore. Nelle successive tabelle i risultati delle
elaborazioni nelle tre situazioni.
Tab. 5: Confronto degli IC, n=250, Ip=0,177
Lim sup Lim inf Ampiezza A da Standard
Standard
0,097
0,255
0,158
-
Boot-t
0,099
0,255
0,157
-0,69%
Boot-t varianza stabilizzata
0,107
0,247
0,140
-13,18%
Boot percentile
0,095
0,252
0,157
-0,69%
Bca
0,096
0,248
0,152
-4,00%
ABC
0,098
0,254
0,156
-1,07%
24
Tab. 6: Confronto degli IC, n=45, Ip=0,177
Lim sup Lim inf Ampiezza A da Standard
Standard
-0,017
0,373
0,390
-
Boot-t
-0,012
0,366
0,378
-3,22%
Boot-t varianza stabilizzata
-0,022
0,356
0,378
-3.37%
Boot percentile
-0,022
0,356
0,378
-3,35%
Bca
-0,022
0,333
0,356
-9,81%
ABC
-0,014
0,366
0,379
-2,95%
Tab. 7: Confronto degli IC, n=12, Ip=0,333
Lim sup Lim inf Ampiezza A da Standard
Standard
-0,035
0,702
0,737
-
Boot-t
-0,108
0,693
0,801
+7,98%
Boot-t varianza stabilizzata
0,031
0,623
0,592
-24,47%
Boot percentile
0,000
0,667
0,667
-10,58%
Bca
-0,167
0,583
0,750
+1,73%
ABC
-0,050
0,659
0,709
-3,90%
Bibliogra…a
1. Bonanomi A. (2004), Variabili ordinali e trasformazioni di scala, con
particolare riferimento alla stima dei parametri dei modelli interpretativi con variabili latenti, Tesi di dottorato di Ricerca in Statistica
Metodologica ed Applicata, sede amministrativa Università degli Studi
di Milano - Bicocca
2. Diciccio T.J., Efron B. (1996), Bootstrap Con…dence Intervals, Statistical Science, Vol. 11, No. 3, pp 189-212
25
3. Diciccio T.J., Efron B. (1992), More Accurate Con…dence Intervals in
Exponential Families, Biometrika, Vol. 79, No. 2, pp 231-245
4. DiCiccio, T.J., Romano J.P. (1988), A Review of Bootstrap Con…dence
Intervals, Journal of the Royal Statistical Society, Series B, Vol. 50,
No. 3., pp 338-354
5. Efron B. (1981), Nonparametric Standard Errors and Con…dence Intervals, The Canadian Journal of Statistics / La Revue Canadienne de
Statistique, Vol. 9, No. 2, pp. 139-158
6. Efron B. (1985), Bootstrap Con…dence Intervals for a Class of Parametric Problems, Biometrika, Vol. 72, No. 1 (Apr., 1985), pp. 45-58
7. Efron B. (1987), Better Bootstrap Con…dence Intervals, Journal of the
American Statistical Association, Vol. 82, No. 397., pp 171-185
8. Efron B, Tibshirani R. (1993), An Introduction to the Bootstrap, Chapman and Hall, New York.
9. Hall P. (1986), On the Bootstrap and Con…dence Intervals, The Annals
of Statistics, Vol. 14, No. 4, pp 1431-1452
10. Pfanzagl J. (1985), Asymptotic Expansions for General Statistical Models, Springer-Verlag, Berlin.
11. Quatto P., Salini S., Zambon A. (2002), Intervalli di Con…denza Bootstrap nel campionamento per cattura e ricattura, Studi in Onore di
Angelo Zanella, Vita e Pensiero, Milano
12. Schenker N. (1985), Qualms about Bootstrap Con…dence Intervals,
Journal of the American Statistical Association, Vol. 80, pp360-361
13. Shao J., Tu D. (1995), The Jacknife and Bootstrap, Springer, New York
26
Fly UP