Econometria Applicata Analisi dei residui

by user

on 06 июля 2016

Category: Documents

>> Downloads: 6

views

Report

Comments

Description

Download Econometria Applicata Analisi dei residui

Transcript

Econometria Applicata Analisi dei residui

Econometria Applicata
Analisi dei residui
Roberto Casarin
Università Ca’ Foscari
Venice, December 5, 2012
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
1 / 63
Introduzione
Analisi dei residui
Abbiamo discusso delle assunzioni alla base del modello di regressione e delle
proprietà di cui godono gli stimatori OLS sotto queste assunzioni. In questa
lezione vediamo come verificare che le ipotesi sui termini di errore siano rispettate
nel campione di dati in esame.
Normalità dei residui (test JB)
Eteroschedasticità (Goldfeld-Quandt, Breusch-Pagan, White, ARCH-LM)
Autocorrelazione (Breusch-Godfrey, Durbin-Watson, Box-Pierce, Lijung-Box)
Corretta specificazione (AIC, BIC, RESET)
Stabilità del modello (Chow, CUSUM)
Capitoli 6 ed 8.
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
2 / 63
Eteroschedasticità
Eteroschedasticità
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
3 / 63
Eteroschedasticità
Motivazioni
• Quando è presente eteroschedasticità nelle serie gli stimatori ML e FWLS sono
più efficienti rispetto allo stimatore OLS. Ma si perde efficienza se applichiamo
ML e FWLS quando in realtà la serie è omoschedastica.
• Vediamo quindi alcuni test diagnostici per verficare l’ipotesi di omoschedasticità:
Goldfeld-Quandt, ARCH, Breusch-Pagan e White.
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
4 / 63
Eteroschedasticità-GQ
Goldfeld-Quandt test
Richiede che i dati siano ordinati in modo che la varianza dei termini di errore sia
non descrescente. L’ipotesi nulla è varianza costante per tutte le osservazioni
contro l’alternativa che la varianza cresca. Per verificare questa ipotesi il campione
ordinato è diviso in tree gruppi. Il primo costitutito dalla prime T1 osservazioni ha
varianza σ12 il secondo costituito dalle ultime T2 osservazioni ha varianza σ22 ed il
sottocampione rimanente di dimensione T3 = T − T1 − T2 escluso dall’analisi.
H0 : σ22 = σ12
H0 : σ22 > σ12
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
(1)
(2)
Venice, December 5, 2012
5 / 63
Eteroschedasticità-GQ
Siano RSS1 ed RSS2 la somma del quadrato dei residui della regressione OLS
rispettivamente nel primo e nel secondo sottocampione e s12 = RSS1 /(T1 − k) ed
s22 = RSS2 /(T2 − k) le corrispondenti varianze. Allora la seguente statistica test
F =
RSS2 /((T2 − k)σ22 )
s 2 /σ 2
= 22 22
2
RSS1 /((T1 − k)σ1 )
s1 /σ1
(3)
sotto l’ipotesi nulla H0 (e sotto le ipotesi OLS) diventa F = s22 /s12 e si distribuisce
come una FT2 −k,T1 −k . L’ipotesi nulla è rifiutata in favore dell’alternativa per valori
elevati di F. Non esiste una regola generale per la scelta del numero di osservazioni
T3 da escludere, ma osserviamo che se il cambiamento di varianza è in
corrispondenza di una punto di rottura strutturale allora è ottimale scegliere due
sottocampioni e quindi T3 = 0. Se c’e’ una variazione non improvvisa si esclude
generalmente T3 = n/5 per campioni piccoli e T3 = n/3 per campioni grandi.
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
6 / 63
Eteroschedasticità-LR
Likelihood-ratio test
Alcune volte i dati possono essere separati in più gruppi dove la varianza è assunta
costante nei gruppi e diversa tra gruppi distinti. Se ci sono G gruppi con varianza
σj2 , e numerosità campionaria nj , con j = 1, . . . , G , sotto l’ipotesi nulla
H0 : σ12 = σ22 = . . . = σG2
(4)
con alternativa che la statistica test
2
LR = T log(sML
)−
G
X
2
Tj log(sj,ML
)
(5)
j=1
2
si distribuisce asintoticamente come χ2 (G − 1), dove sML
= u′ u/n è la varianza
2
′
stimata su tutto il campione di dati e sj,ML = uj uj /nj è la varianza stimata sul
gruppo j-esimo.
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
7 / 63
Eteroschedasticità-BP
Breusch-Pagan (LM) test
Il test Breusch-Pagan è basato su un modello di eteroschedasticità del tipo
σt2 = h(z′t γ) con zt = (1, z2t , . . . , zpt )′ set di variabili che spiegano le differenze di
varianza tra le osservazioni. L’ipotesi nulla di varianza costante corrisponde a
p − 1 restrizioni sui parametri, il test corrisponde al test LM
LM =
∂L
∂θ
′ −1 ∂L
∂L
−E
∂θ∂θ′
∂θ
(6)
con θ = (β, γ ′ )′ e
T
T
n
1X
1 X (yt − x′t β)2
L(β, γ) = − log(2π) −
log(h(z′t γ)) −
2
2 t=1
2 t=1 h(z′t γ)
(7)
(Nota 1: legame con ML, WLS e 2SFWLS o FWLS iterati. Nota 2: modelli
moltiplicativi e additivi per σt2 ).
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
8 / 63
Eteroschedasticità-BP
Per valutare il test dovremmo calcolare il gradiente e l’Hessiano della
verosimiglianza del modello senza vincoli e poi valutare la statistica LM in
corrispondenza dei parametri stimati sotto l’ipotesi nulla. Si può dimostrare che
questo equivale alla seguente costruzione del test
1 : stima OLS: y = X β + u e calcolo dei residui û = y − X β̂
2 : Regressione ausiliaria: ût2 = γ0 + γ1 z2t + . . . + γp−1 zpt + et e calcolo di R 2
3 : LM = TR 2 . LM è distribuito asintoticamente come una χ2 (p − 1) sotto
l’ipotesi nulla di omoschedasticità
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
9 / 63
Eteroschedasticità-W
White test
Il vantaggio del test Breusch-Pagan è che la funzione h sulla forma funzionale
della varianza può essere non specificata. Comunque è necessario conoscere quali
sono le variabili zt che influenzano la varianza. Se le variabili sono non note allora
2
2
si possono utilizzare le variabili esplicative: x2t , . . . , xkt e x2t
, . . . , xkt
, in tal caso
p = 2k − 2. Il test LM con questa particolare scelta delle variabili esplicative è
detto test di White (senza ”cross term”). Una estensione è il test di White con
termini incrociati: xjt xis con j 6= i.
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
10 / 63
Eteroschedasticità-ARCH
Test ARCH LM
Anche il test ARCH è un test LM che è fondato su una struttura di
eteroschedasticità del tipo ARCH(q) (Autoregressive Conditional
2
2
Heteroschedasticity di ordine q): σt2 = γ0 + γ1 ut−1
+ . . . + γq ut−q
. Il test LM si
costruisce con i seguenti passi
1 : stima OLS: y = X β + u e calcolo dei residui û = y − X β̂
2
2
2 : Regressione ausiliaria: ût2 = γ0 + γ1 ût−1
+ . . . + γq ût−q
+ et e calcolo di R 2
3 : LM = TR 2 . LM è distribuito asintoticamente come una χ2 (q) sotto
l’ipotesi nulla di omoschedasticità
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
11 / 63
Eteroschedasticità - Esempio 1
Esempio 1
Consideriamo dati cross section sul salario dei dipendenti di 474 banche. Ci sono
tre categorie di lavoratori: custodi, manager e amministrativi. Consideriamo il
seguente modello di regressione
yi = β1 + β2 x2i + β3 x3i + β4 x4i + β5 D2i + β6 D3i + ui
(8)
yi : log of the salary
x2i : education
x3i : gender (dummy, 1 se maschio, 0 femmina)
x4i : minority (dummy, 1 se minoranza e 0 altrimenti)
D2i : dummy (1 lavoro come custode, 0 altrimenti)
D3i : dummy (1 lavoro come manager, 0 altrimenti)
con i = 1, . . . , n.
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
12 / 63
Eteroschedasticità - Esempio 1
Model 1: OLS, using observations 1–474
Dependent variable: LOGSALARY
const
EDUC
GENDER
MINORITY
DUMJCAT2
DUMJCAT3
Coefficient
Std. Error
t-ratio
p-value
9.57469
0.0441917
0.178340
−0.0748581
0.170360
0.539075
0.0542179
0.00428498
0.0209623
0.0224588
0.0434936
0.0302130
176.5965
10.3132
8.5077
−3.3331
3.9169
17.8425
0.0000
0.0000
0.0000
0.0009
0.0001
0.0000
Mean dependent var
Sum squared resid
R2
F (5, 468)
Log-likelihood
Schwarz criterion
R. Casarin (Università Ca’ Foscari)
10.35679
17.86407
0.760775
297.6627
104.4077
−171.8481
S.D. dependent var
S.E. of regression
Adjusted R 2
P-value(F )
Akaike criterion
Hannan–Quinn
Econometria Applicata Analisi dei residui
0.397334
0.195374
0.758219
7.9e–143
−196.8154
−186.9961
Venice, December 5, 2012
13 / 63
Eteroschedasticità - Esempio 1
LOGSALARY versus JOBCAT (with least squares fit)
12
Y = 9.80 + 0.398X
LOGSALARY
11.5
11
10.5
10
9.5
1
R. Casarin (Università Ca’ Foscari)
1.5
2
JOBCAT
Econometria Applicata Analisi dei residui
2.5
3
Venice, December 5, 2012
14 / 63
Eteroschedasticità - Esempio 1
1
0.8
0.6
resid
0.4
0.2
0
-0.2
-0.4
-0.6
1
R. Casarin (Università Ca’ Foscari)
1.5
2
JOBCAT
Econometria Applicata Analisi dei residui
2.5
3
Venice, December 5, 2012
15 / 63
Eteroschedasticità - Esempio 1
Test Goldfeld-Quandt
• Dallo scatter plot dei residui contro la variabile di comodo JOBCAT osserviamo
che la varianza dei residui varia a seconda della categoria. Osserviamo che i tre
sottocampioni sono: 363 JOBCAT=1, 27 JOBCAT=2 e 84 JOBCAT=3. Ora
consideriamo tre modelli di regressione distinti per i tre sottocampioni.
Ovviamente esclusiamo le due varibili dummy D2i e D3i . Per il sottocampione in
cui JOBCAT=2 escludiamo GENDER dato che nel sottocampione ci sono solo
maschi. Osserviamo dai seguenti risultati che la seconda regressione non è
significativa (test F), probabilmente anche a causa dei pochi dati.
• Quindi escludiamo il secondo sottocampione e testiamo l’ipotesi che σ12 = σ22
contro l’alternativa σ22 > σ12 utilizzando la satistica
F = (s22 /s12 ) = (0.227476/0.188190)2 = 1.457 che ha distribuzione F84−4,363−4 . Il
p-value è pari a 0.011186 quindi rifiutiamo l’ipotesi nulla.
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
16 / 63
Eteroschedasticità - Esempio 1
Test Goldfeld-Quandt
Utilizziamo Sample>Restrict, based on criterion... per determinare
i diversi sottocampioni
Utilizziamo Tools>p-value finder>F... per trovare il p-value associato al
valore della statistica test
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
17 / 63
Eteroschedasticità - Esempio 1
Model 3: OLS, using observations 1–363
Dependent variable: LOGSALARY
const
EDUC
GENDER
MINORITY
Coefficient
Std. Error
t-ratio
p-value
9.55642
0.0463597
0.169221
−0.0985574
0.0565441
0.00449408
0.0212746
0.0233131
169.0083
10.3157
7.9541
−4.2276
0.0000
0.0000
0.0000
0.0000
Mean dependent var
Sum squared resid
R2
F (3, 359)
Log-likelihood
Schwarz criterion
R. Casarin (Università Ca’ Foscari)
10.20254
12.71420
0.418977
86.29199
93.25585
−162.9341
S.D. dependent var
S.E. of regression
Adjusted R 2
P-value(F )
Akaike criterion
Hannan–Quinn
Econometria Applicata Analisi dei residui
0.245863
0.188190
0.414122
4.63e–42
−178.5117
−172.3197
Venice, December 5, 2012
18 / 63
Eteroschedasticità - Esempio 1
Model 4: OLS, using observations 1–27
Dependent variable: LOGSALARY
const
EDUC
MINORITY
Coefficient
Std. Error
t-ratio
p-value
10.3939
−0.00463417
−0.0191656
0.0677387
0.00631878
0.0275429
153.4409
−0.7334
−0.6958
0.0000
0.4704
0.4932
Mean dependent var
Sum squared resid
R2
F (2, 24)
Log-likelihood
Schwarz criterion
R. Casarin (Università Ca’ Foscari)
10.33745
0.122445
0.039055
0.487710
34.53372
−59.17994
S.D. dependent var
S.E. of regression
Adjusted R 2
P-value(F )
Akaike criterion
Hannan–Quinn
Econometria Applicata Analisi dei residui
0.070006
0.071427
-0.041024
0.619985
−63.06745
−61.91149
Venice, December 5, 2012
19 / 63
Eteroschedasticità - Esempio 1
Model 5: OLS, using observations 1–84
Dependent variable: LOGSALARY
const
EDUC
GENDER
MINORITY
Coefficient
Std. Error
t-ratio
p-value
9.67598
0.0669673
0.211185
0.260611
0.274004
0.0165246
0.0807968
0.119540
35.3133
4.0526
2.6138
2.1801
0.0000
0.0001
0.0107
0.0322
Mean dependent var
Sum squared resid
R2
F (3, 80)
Log-likelihood
Schwarz criterion
R. Casarin (Università Ca’ Foscari)
11.02962
4.139612
0.308942
11.92153
7.238179
3.246909
S.D. dependent var
S.E. of regression
Adjusted R 2
P-value(F )
Akaike criterion
Hannan–Quinn
Econometria Applicata Analisi dei residui
0.268648
0.227476
0.283028
1.56e–06
−6.476359
−2.567687
Venice, December 5, 2012
20 / 63
Eteroschedasticità - Esempio 1
Model 9: OLS, using observations 1–474
Dependent variable: sq resid
const
DUMJCAT2
DUMJCAT3
Coefficient
Std. Error
t-ratio
p-value
0.0351658
−0.0182647
0.0201025
0.00342653
0.0130228
0.00790440
10.2628
−1.4025
2.5432
0.0000
0.1614
0.0113
Mean dependent var
Sum squared resid
R2
F (2, 471)
Log-likelihood
Schwarz criterion
R. Casarin (Università Ca’ Foscari)
0.037688
2.007417
0.019507
4.685268
622.4761
−1226.469
S.D. dependent var
S.E. of regression
Adjusted R 2
P-value(F )
Akaike criterion
Hannan–Quinn
Econometria Applicata Analisi dei residui
0.065791
0.065284
0.015343
0.009665
−1238.952
−1234.043
Venice, December 5, 2012
21 / 63
Eteroschedasticità - Esempio 1
Breusch-Pagan
Vogliamo verificare la seguente struttura di eteroschedasticità (modello
moltiplicativo): σi2 = e γ0 +γ1 D2i +γ2 D3i . Il primo passo della procedura consiste nel
regredire il guadrato dei residui (attenzione non il logaritmo del quadrato!) sulle
due varibili dummy ottenendo R 2 = 0.021333 (vedi figura pagina precedente). Da
cui LM = 474 · 0.021333 = 10.111 che sotto l’ipotesi nulla γ1 = γ2 = 0 ha
distribuzione χ2 (3 − 1). Il p-value è pari a 0.006. Quindi rifiutiamo l’ipotesi nulla.
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
22 / 63
Eteroschedasticità - Esempio 1
Test LR
Dividendo il campione in tre gruppi in funzione del valore dalla variabile JOBCAT
otteniamo per i tre sottocampioni: s12 = 0.1881902, s22 = 0.0714272 e
2
s32 = 0.2274762. Da cui otteniamo s1,ML
= 0.1881902 · 363−4
363 = 0.0350,
2
2
2 27−3
s2,ML = 0.071427 27 = 0.0045 e s3,ML = 0.2274762 84−4
84 = 0.0493. Osserviamo
2
inoltre che s12 = 0.1953742 e quindi sML
= 0.1953742 · 474−6
474 = 0.0377. La
statistica test:
LR = 474 log(0.0377) − 363 log(0.0350) − 27 log(0.0045) − 84 log(0.0493) = 61.2,
sotto l’ipotesi nulla, ha distribuzione asintotica χ2 (3 − 1). Il p-value è pari a 0.
Quindi l’ipotesi di omoschedasticità è rifiutata.
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
23 / 63
Eteroschedasticità - Esempio 1
White
Il test di White senza cross-products e con cross-products porta a rifiutare l’ipotesi
nulla di omoschedasticità con p-values pari a 0.041678 e 0.011285 rispettivamente
(vedi figure seguenti).
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
24 / 63
Eteroschedasticità - Esempio 1
Dependent variable: uhat 2
Coefficient
Std. Error
t-ratio
const
0.0169722
0.0534069
0.3178
EDUC
0.000632237 0.00835041
0.07571
GENDER
-0.00104331 0.00704285
-0.1481
MINORITY -0.00674886 0.00750964
-0.8987
DUMJCAT2 -0.00991070 0.0145921
-0.6792
DUMJCAT3 0.00734671
0.0116268
0.6319
sqEDUC
7.09153e-05 0.000326738 0.2170
Unadjusted R-squared = 0.027609 Test statistic: TR 2 =
= P(Chi − square(6) > 13.086833) = 0.041678
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
p-value
0.7508
0.9397
0.8823
0.3693
0.4974
0.5278
0.8283
13.086833, with p-value
Venice, December 5, 2012
25 / 63
Eteroschedasticità - Esempio 1
Dependent variable: uhat 2 Omitted due to exact collinearity: X 3 − X 5
Coefficient
Std. Error
t-ratio
p-value
const
0.131454
0.0718267
1.830
EDUC
-0.0188857
0.0118901
-1.588
GENDER
-0.0374905
0.0448115
-0.8366
MINORITY
0.0215931
0.0448275
0.4817
DUMJCAT2 -0.0627389
0.0746543
-0.8404
DUMJCAT3 0.273542
0.109895
2.489
sqEDUC
0.000884387 0.000491919 1.798
X2 − X3
0.00248857
0.00333562
0.7461
X2 − X4
-0.00253195
0.00348105
-0.7274
X2 − X5
0.00482944
0.00665341
0.7259
X2 − X6
-0.0183418
0.00695796
-2.636
X3 − X4
-0.00282086
0.0166238
-0.1697
X3 − X6
0.0215932
0.0262545
0.8225
X4 − X5
0.0224349
0.0298916
0.7505
X4 − X6
0.0812140
0.0370309
2.193
Unadjusted R-squared = 0.060660 Test statistic: TR 2 =
P(Chi − square(14) > 28.752679) = 0.011285
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
0.0679
0.1129
0.4032
0.6303
0.4011
0.0132
0.0729
0.4560
0.4674
0.4683
0.0087
0.8653
0.4112
0.4533
0.0288
28.752679, with p-value =
Venice, December 5, 2012
26 / 63
Eteroschedasticità - Esempio 2
Esempio 2
Sia yt il tasso di rendimento delle obbligazioni con rating AAA e sia xt il tasso di
rendimento dei titoli di stato (Treasury Bill) a 3-mesi, rilevati mensilemente tra
gennaio 1950 e dicembre 1999. Vogliamo stimare
∆yt = α + β∆xt + ut
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
(9)
Venice, December 5, 2012
27 / 63
Eteroschedasticità - Esempio 2
Model 1: OLS, using observations 1948:02–1999:12 (T = 623)
Dependent variable: DAAA
const
DUS3MT
Coefficient
Std. Error
t-ratio
p-value
0.00565089
0.274529
0.00672904
0.0143765
0.8398
19.0957
0.4014
0.0000
Mean dependent var
Sum squared resid
R2
F (1, 621)
Log-likelihood
Schwarz criterion
ρ̂
R. Casarin (Università Ca’ Foscari)
0.007528
17.51432
0.369957
364.6465
228.5322
−444.1953
0.276686
S.D. dependent var
S.E. of regression
Adjusted R 2
P-value(F )
Akaike criterion
Hannan–Quinn
Durbin–Watson
Econometria Applicata Analisi dei residui
0.211405
0.167939
0.368942
2.66e–64
−453.0644
−449.6177
1.446100
Venice, December 5, 2012
28 / 63
Eteroschedasticità - Esempio 2
Regression residuals (= observed - fitted DAAA)
1.2
1
0.8
residual
0.6
0.4
0.2
0
-0.2
-0.4
-0.6
-0.8
1950
1960
R. Casarin (Università Ca’ Foscari)
1970
1980
Econometria Applicata Analisi dei residui
1990
2000
Venice, December 5, 2012
29 / 63
Eteroschedasticità - Esempio 2
1.2
1
usq1
0.8
0.6
0.4
0.2
0
1950
1960
R. Casarin (Università Ca’ Foscari)
1970
1980
Econometria Applicata Analisi dei residui
1990
2000
Venice, December 5, 2012
30 / 63
Eteroschedasticità - Esempio 2
DUS3MT versus DAAA (with least squares fit), sub-sample: 1948:01-1974:12
1
Y = -0.00294 + 1.19X
DUS3MT
0.5
0
-0.5
-1
-1.5
-0.4
-0.3
R. Casarin (Università Ca’ Foscari)
-0.2
-0.1
0
DAAA
0.1
Econometria Applicata Analisi dei residui
0.2
0.3
Venice, December 5, 2012
31 / 63
Eteroschedasticità - Esempio 2
DUS3MT versus DAAA (with least squares fit), sub-sample 1975:01-1999:12
3
Y = -0.000394 + 1.37X
2
DUS3MT
1
0
-1
-2
-3
-4
-5
-1
R. Casarin (Università Ca’ Foscari)
-0.5
0
DAAA
0.5
Econometria Applicata Analisi dei residui
1
Venice, December 5, 2012
32 / 63
Eteroschedasticità - Esempio 2
Vogliamo verificare l’ipotesi di omoschedasticità, utilizzando i seguenti modelli di
eteroschedasticità
i σt2 = σ 2 (∆xt )2
(White)
ii σt2 = γ1 + γ2 ut2
(ARCH LM)
iii σt2 = γ1 + γ2 ∆xt
(Breusch-Pagan LM)
iv σt2 = γ1 + γ2 Dt , (Dt = 1 se t > 1974 : 12)
(Breusch-Pagan LM)
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
33 / 63
Eteroschedasticità - Esempio 2
White’s test for heteroskedasticity OLS, using observations 1948:02-1999:12 (T =
623)
Dependent variable: uhat 2
Coefficient
Std. Error
t-ratio
p-value
const
0.0266391
0.00313198 8.506
1.36e-016
DUS3MT -7.22712e-05 0.00695667 -0.01039 0.9917
sqDUS3MT 0.00672943
0.00275691 2.441
0.0149
Unadjusted R-squared = 0.010725
Test statistic: TR 2 = 6.681598,
with p-value = P(Chi − square(2) > 6.681598) = 0.035409
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
34 / 63
Eteroschedasticità - Esempio 2
Test for ARCH of order 2
Coefficient
Std. Error
t-ratio
alpha(0) 0.0171892 0.00325323 5.284
alpha(1) 0.166183
0.0391886
4.241
alpha(2) 0.225508
0.0391904
5.754
Null hypothesis: no ARCH effect is present
Test statistic: LM = 58.742
with p-value = P(Chi − square(2) > 58.742) =
R. Casarin (Università Ca’ Foscari)
p-value
1.76e-07
2.57e-05
1.37e-08
1.75523e-013
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
35 / 63
Eteroschedasticità - Esempio 2
Breusch-Pagan test for heteroskedasticity OLS, using observations
1948:02-1999:12 (T = 623)
Dependent variable: scaled uhat 2
Coefficient Std. Error t-ratio
p-value
const
1.00139
0.109639
9.134
9.25e-019
DUS3MT -0.203847 0.234242
-0.8702 0.3845
Explained sum of squares = 5.67032
Test statistic: LM = 2.835158,
with p-value = P(Chi − square(1) > 2.835158) = 0.092222
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
36 / 63
Eteroschedasticità - Esempio 2
Breusch-Pagan test for heteroskedasticity
Model 2: OLS, using observations 1948:02–1999:12 (T = 623)
Dependent variable: usq1a
const
du74
Coefficient
Std. Error
t-ratio
p-value
0.00912376
0.0394340
0.00413967
0.00596553
2.2040
6.6103
0.0279
0.0000
Mean dependent var
Sum squared resid
R2
F (1, 621)
Log-likelihood
Schwarz criterion
ρ̂
R. Casarin (Università Ca’ Foscari)
0.028113
3.437360
0.065739
43.69633
735.7523
−1458.636
0.159407
S.D. dependent var
S.E. of regression
Adjusted R 2
P-value(F )
Akaike criterion
Hannan–Quinn
Durbin–Watson
Econometria Applicata Analisi dei residui
0.076910
0.074399
0.064234
8.27e–11
−1467.505
−1464.058
1.681000
Venice, December 5, 2012
37 / 63
Eteroschedasticità - Esempio 2
• Il test White, ARCH-LM e Breusch-Pagan (iii) portanto a rigettare l’ipotesi
nulla di omoschedasticità (vedi p-value). Per il test di Breusch-Pagan (iv)
osserviamo che LM = nR 2 = 623 · 0.065739 = 40.95539 che sotto l’ipotesi nulla si
distribuisce come una χ2 (1). Il p-value è pari a 0. Quindi rigettiamo l’ipotesi nulla
di omoschedasticità.
• Confrontiamo ora gli effetti dei tre modelli di eteroschedasticità sui residui e
vediamo come utilizzare uno dei modelli di eteroschedasticità per ottenere una
stima 2SFWLS.
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
38 / 63
Eteroschedasticità - Esempio 2
Esempio: regimi di volatilità (variabile dummy) e stima 2SFWLS
stima OLS ∆yt = α + β∆xt + ut
generiamo la serie σt2 = ût2 (denominata usq1)
costruiamo il modello di regressione ausiliario: σt2 = γ1 + γ2 Dt + εt ,
(Add>time trend e poi Add>define new variable> du80=time>380)
determiniamo i fitted σ̂t2 e li salviamo con nome yhat8
Definiamo i pesi 1/σ̂t
Add>define new variable> sigmainv=1/sqrt(yhat8)
stima WLS con pesi 1/σ̂t
Models>Other Linear Models>Weighted Least Squares...
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
39 / 63
Eteroschedasticità - Esempio 2
Model 8: OLS, using observations 1948:02–1999:12 (T = 623)
Dependent variable: usq1
const
du80
Coefficient
Std. Error
t-ratio
p-value
0.00989738
0.0472844
0.00375262
0.00604607
2.6375
7.8207
0.0086
0.0000
Mean dependent var
Sum squared resid
R2
F (1, 621)
Log-likelihood
Schwarz criterion
ρ̂
R. Casarin (Università Ca’ Foscari)
0.028113
3.349347
0.089660
61.16299
743.8321
−1474.795
0.138765
S.D. dependent var
S.E. of regression
Adjusted R 2
P-value(F )
Akaike criterion
Hannan–Quinn
Durbin–Watson
Econometria Applicata Analisi dei residui
0.076910
0.073440
0.088194
2.26e–14
−1483.664
−1480.217
1.722141
Venice, December 5, 2012
40 / 63
Eteroschedasticità - Esempio 2
Actual and fitted usq1
1.2
fitted
actual
1
usq1
0.8
0.6
0.4
0.2
0
1950
1960
R. Casarin (Università Ca’ Foscari)
1970
1980
Econometria Applicata Analisi dei residui
1990
2000
Venice, December 5, 2012
41 / 63
Eteroschedasticità - Esempio 2
Model 9: WLS, using observations 1948:02–1999:12 (T = 623)
Dependent variable: DAAA
Variable used as weight: sigmainv
const
DUS3MT
Coefficient
Std. Error
t-ratio
p-value
0.00931597
0.248917
0.00561751
0.0140703
1.6584
17.6910
0.0977
0.0000
Statistics based on the weighted data:
Sum squared resid
R2
F (1, 621)
Log-likelihood
Schwarz criterion
ρ̂
94.93639
0.335097
312.9709
−297.9615
608.7920
0.291173
S.E. of regression
Adjusted R 2
P-value(F )
Akaike criterion
Hannan–Quinn
Durbin–Watson
0.390994
0.334026
5.10e–57
599.9229
603.3697
1.417149
Statistics based on the original data:
Mean dependent var
R. Casarin (Università Ca’ Foscari)
0.007528
S.D. dependent var
Econometria Applicata Analisi dei residui
0.211405
Venice, December 5, 2012
42 / 63
Eteroschedasticità - Esempio 2
Confronto: WLS è più efficiente di OLS quando gli errori sono eteroschedastici. Si
veda anche il p-value dell’intercetta.
WLS
const
DUS3MT
Coefficient
Std. Error
t-ratio
p-value
0.00931597
0.248917
0.00561751
0.0140703
1.6584
17.6910
0.0977
0.0000
OLS
const
DUS3MT
R. Casarin (Università Ca’ Foscari)
Coefficient
Std. Error
t-ratio
p-value
0.00565089
0.274529
0.00672904
0.0143765
0.8398
19.0957
0.4014
0.0000
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
43 / 63
Autocorrelazione
Autocorrelazione
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
44 / 63
Autocorrelazione
• Una delle assunzioni del modello di regressione è che i termini di errore siano
indipendenti. E’quindi necessario verificare che i residui di una regressione siano
indipendenti attraverso dei test (Durbin-Watson, Bresusch-Godfrey, Box-Pierce e
Ljiung-Box).
• In particolare diremo che i termini di disturbo del modello di regressione
yt = x′t β + ut
(10)
sono serialmente correlati se esistono s 6= t tali che E(ut , us ) 6= 0. In questo caso
la matrice di varianza covarianze di u non è diagonale. Questo significa che yt ed
ys oltre ai regressori hanno in comune altri elementi e che il modello di regressione
dato sopra con le ipotesi OLS viste a lezione non è soddisfacente.
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
45 / 63
Autocorrelazione
• Potrebbe trattarsi di problemi di omissione di variabili, non corretta
specificazione della forma funzionale, mancata inclusione di variabili dipendenti (o
indipedenti) ritardate.
• Primi a di presentare questi test vediamo se è possibile intuire anche
graficamente la presenza di correlazione seriale (autocorrelazione) e che in alcuni
casi è possibile dare un interpretazione economica.
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
46 / 63
Autocorrelazione
Tassi di Interesse
• Consideriamo il dataset xm722ibr.wk1 relativo a tassi su obbligazioni con
rating AAA yt e dei tassi su obbligazioni pubbliche (Treasury Bill a 3 mesi), xt .
Consideriamo le differenze prime di tali variabili: ∆xt e ∆yt .
• dal modello di regressione ∆yt = α + β∆xt + ut otteniamo i residui ût . Il
coefficiente di correlazione tra ût e ût−1 è pari a 0.276543. Dal diagramma di
dispersione si può osservare la presenza di una relazione lineare tra le due variabili.
• E’ ragionevole pensare che a seguito di una deviazione da una relazione di
equilibrio tra yt e xt l’aggiustamento di yt non sia immediato, ma sia progressivo
nel tempo. Per questo motivo una relazione statica tra ∆yt e ∆xt può non essere
adeguata con conseguente evidenza di correlazione seriale nei residui.
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
47 / 63
Autocorrelazione
uhat versus uhat1 (with least squares fit)
1.2
Y = 9.65e-005 + 0.277X
1
0.8
0.6
uhat
0.4
0.2
0
-0.2
-0.4
-0.6
-0.8
-0.6
-0.4
R. Casarin (Università Ca’ Foscari)
-0.2
0
0.2
uhat1
0.4
Econometria Applicata Analisi dei residui
0.6
0.8
1
Venice, December 5, 2012
48 / 63
Autocorrelazione
Coefficienti di autocorrelazione
Test sulla correlazione seriale richiedono che le osservazioni possano essere
naturalmente ordinate. Per series storiche l’ordine è dato dall’indice temporale.
Nei dati cross-section le osservazioni possono essere ordinate in base ad una delle
variabili esplicative. L’indice di correlazione è
PT
ût ût−1
r = qP t=2 P
T −1 2
T
2
t=1 ût
t=2 ût
(11)
di cui si utilizza una versione asintoticamente equivalente
r1 =
PT
t=2
PT
ût ût−1
t=1
(12)
ût2
Elevati valordi di r1 possono indicare errata specificazioine nella dinamica per dati
di tipo timeseries oppure errata forma funzionale per dati cross-section.
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
49 / 63
Autocorrelazione
Si può costruire l’autocorrelogramma valutando per ogni ritardo k con
k = . . . , K il seguente coefficente di correlazione di ordine k
rk =
PT
t=k+1 ût ût−k
PT
2
t=1 ût
(13)
Il grafico generato da (k, rk ) può dare un’idea della presenza di autocorrelazione
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
50 / 63
Autocorrelazione
Test Durbin-Watson Il test DW è basato sulla seguente idea. Siano σ 2 e ̺ la
varianza dei termini di disturbo ed la correlazione tra ut e ut−1 allora
E(ut − ut−1 )2 = 2σ 2 (1 − ̺). Cosı̀ se i due termini di errore consecutivi sono
correlati la differenza (ut − ut−1 tenderà ad essere piccola. La statistica DW è
definita come segue
T
P
(ut − ut−1 )2
t=2
(14)
d=
T
P
ut2
t=1
La statistica soddisfa: 0 ≤ d ≤ 4 e d ≈ 2(1 − r1 ). Valori di d vicini allo zero
indicano autocorrelazione positiva mentre valori prossimi a 4 indicano
autocorrelazione negativa. I valori critici della statistica test dipendono dalla
matrice X di regressori. Le bande di confidenza esistono per regressori
deterministici e termini di errore gaussiani. DW è utilizzata in modo informale
come strumento di diagnosi per indicare la presenza di autocorrelazione
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
51 / 63
Autocorrelazione
Test Breusch-Godfrey LM Il modello di riferimento è
yt = x′t β + ut
(15)
ut = γ1 ut−1 + . . . + γp ut−p + ηt
(16)
con ηt iid e gaussiano con varianza ση2 per ogni t. Considerando il caso AR(1),
cioè p = 1 segue che
yt = γ1 yt−1 + x′t β − γx′t−1 β + ηt
(17)
in cui si vuole valutare l’ipotesi che γ1 = 0. Si può dimostrare che il test è
equivalente alla seguente procedura a due passi in cui si utilizza un modello di
regressione ausiliario.
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
52 / 63
Autocorrelazione
stima OLS y = X β + u
generiamo i residui û = y − X β̂
regressione ausiliaria (stima OLS): ût = x′t δ + γ1 ût−1 + . . . + γp ût−p + ωt
determinare LM = TR 2 che è distribuita asintoticamente come χ2 (p) sotto
l’ipotesi nulla di assenza di correlazione seriale H0 = γ1 = . . . = γp = 0
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
53 / 63
Autocorrelazione
Tests Box-Pierce e Ljiung-Box Le statistiche test sono
BP = T
LB = T
p
X
k=1
p
X
k=1
rk2
(18)
T +2 2
r
T −k k
(19)
Sotto l’ipotesi nulla di assenza di autocorrelazione la statistica BP ha distribuzione
asintotica χ2 (p) mentre la statistica LB (detta anche Q-test) ha distribuzione
asintotica χ2 (p) (sotto l’ipotesi aggiuntiva che i regressori siano deterministici, nel
caso siano stocastici è consigliabile utilizzare il test Breusch-Godfrey).
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
54 / 63
Autocorrelazione
Rimedi Possibili
• Per dati cross-section è necessario variare le forma funzionale.
• Per dati timeseries è necessario considerare le proprietà dinamiche dei dati. Per
esempio considerando
yt = β1 + β2 xt + ut
(20)
la correlazione tra ut = yt − β1 − β2 xt e ut−1 = yt−1 − β1 − β2 xt−1 può essere
dovuta al legame tra yt e xt−1 e yt−1 che può essere considerata con il modello
yt = γ1 + γ2 xt + γ3 xt−1 + γ4 yt−1 + ηt
(21)
con ηt iid. (Si veda nota su modelli ADL).
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
55 / 63
Autocorrelazione
Rimedi Possibili
• Modello di regressione con errori AR(1).
ut = γut−1 + ηt
(22)
ut = yt − β1 − β2 xt
(23)
da cui segue
yt = β1 (1 − γ) + β2 xt − β2 γxt−1 + γyt−1 + ηt
(24)
yt = γ1 + γ2 xt + γ3 xt−1 + γ4 yt−1 + ηt
(25)
che corrisponde a
con γ1 = β1 (1 − γ), γ2 = β2 , γ3 = −β2 γ e γ4 = γ e con il vincolo
γ2 γ4 + γ3 = 0
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
(26)
Venice, December 5, 2012
56 / 63
Autocorrelazione
Rimedi Possibili
• Se i termini di errore ηt sono distribuiti normalmente è possibile stimare i
parametri γ e β1 e β2 utilizzando NLS (nonlinear least square) altrimenti si può
utilizzare una procedura a due passi (procedura di Cochrane-Orcutt). Si osserva
che:
yt − γyt−1 = β1 (1 − γ) + β2 (xt − γxt−1 ) + ηt
(27)
da cui:
Consideriamo γ = 0 e stimiamo con OLS β1 e β2 : yt = β1 + β2 xt + ut . Lo
stimatore sarà consistente (se −1 < γ < 1) ma non efficiente.
Regrediamo ût su ût−1 ottenendo γ̂
e yt − γ̂yt−1 su xt − γ̂xt−1 ottenendo dei nuovi residui η̃t .
Una nuova stima di γ può essere ottenuta utilizzando i nuovi residui.
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
57 / 63
Autocorrelazione
Esempio
Consideriamo l’esempio sui tassi di interesse
• La statistica DW = 1.446 quindi r1 ≈ 0.277
• Il coefficiente di autocorrelazione del primo ordine è significativo (Q-test)
• Il test Breusch-Godfrey con p = 1 e p = 2 ritardi indica la presenza di
autocorrelazione
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
58 / 63
Autocorrelazione
OLS, using observations 1948:02–1999:12 (T = 623)
Dependent variable: DAAA
const
DUS3MT
Coefficient
Std. Error
t-ratio
p-value
0.00565089
0.274529
0.00672904
0.0143765
0.8398
19.0957
0.4014
0.0000
Mean dependent var
Sum squared resid
R2
F (1, 621)
Log-likelihood
Schwarz criterion
ρ̂
R. Casarin (Università Ca’ Foscari)
0.007528
17.51432
0.369957
364.6465
228.5322
−444.1953
0.276686
S.D. dependent var
S.E. of regression
Adjusted R 2
P-value(F )
Akaike criterion
Hannan–Quinn
Durbin–Watson
Econometria Applicata Analisi dei residui
0.211405
0.167939
0.368942
2.66e–64
−453.0644
−449.6177
1.446100
Venice, December 5, 2012
59 / 63
Autocorrelazione
Residual ACF
0.3
0.2
0.1
0
-0.1
-0.2
-0.3
+- 1.96/T0.5
0
2
4
6
8
10
12
lag
Residual PACF
0.3
0.2
0.1
0
-0.1
-0.2
-0.3
0
+- 1.96/T .5
0
2
4
6
8
10
12
lag
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
60 / 63
Autocorrelazione
Residual autocorrelation function
LAG
ACF
PACF
Q-stat
1
2
3
4
5
6
7
8
9
10
11
12
0.2764
-0.0754
0.0086
0.0337
0.0546
0.1012
0.0354
0.0499
0.0449
0.0079
0.0329
-0.0611
0.2764
-0.1643
0.0871
-0.0087
0.0606
0.0785
-0.0110
0.0705
0.0034
0.0011
0.0317
-0.1074
R. Casarin (Università Ca’ Foscari)
47.8159
51.3775
51.4240
52.1380
54.0139
60.4804
61.2716
62.8484
64.1241
64.1639
64.8526
67.2286
[p-value]
[0.000]
[0.000]
[0.000]
[0.000]
[0.000]
[0.000]
[0.000]
[0.000]
[0.000]
[0.000]
[0.000]
[0.000]
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
61 / 63
Autocorrelazione
Breusch-Godfrey test for autocorrelation up to order 12 OLS, using observations
1948:02-1999:12 (T = 623) Dependent variable: uhat
Coefficient
Std. Error
t-ratio
p-value
const
0.000292938 0.00630670 0.04645 0.9630
DUS3MT -0.0279546
0.0143213
-1.952
0.0514
uhat1
0.358428
0.0414183
8.654
4.44e-017
uhat2
-0.214417
0.0428149
-5.008
7.21e-07
uhat3
0.0900817
0.0435623
2.068
0.0391
uhat4
-0.00895890 0.0438469
-0.2043 0.8382
uhat5
0.0232144
0.0438376
0.5296
0.5966
Unadjusted R-squared = 0.138853, Test statistic: LMF = 8.182996, with p-value
= P(F (12, 609) > 8.183) = 2.24e-014
Alternative statistic: TR 2 = 86.505134, with p-value =
P(Chi − square(12) > 86.5051) = 2.34e-013
Ljung-Box Q’ = 67.2286, with p-value = P(Chi − square(12) > 67.2286) =
1.05e-009
R. Casarin (Università Ca’ Foscari)
Econometria Applicata Analisi dei residui
Venice, December 5, 2012
62 / 63
Autocorrelazione
Cochrane–Orcutt, using observations 1948:03–1999:12 (T = 622)
Dependent variable: DAAA
ρ = 0.289012
ρ̂ = 0.289012
const
DUS3MT
Coefficient
Std. Error
t-ratio
p-value
0.00594436
0.252253
0.00909245
0.0143429
0.6538
17.5873
0.5135
0.0000
Statistics based on the
Mean dependent var 0.007556
Sum squared resid
16.11453
R2
0.420317
F (1, 620)
309.3128
ρ̂
0.050437
R. Casarin (Università Ca’ Foscari)
rho-differenced data:
S.D. dependent var
S.E. of regression
Adjusted R 2
P-value(F )
Durbin–Watson
Econometria Applicata Analisi dei residui
0.211574
0.161218
0.419382
1.80e–56
1.896534
Venice, December 5, 2012
63 / 63