Gretl Lab2 - Ca` Foscari

by user

on 06 июля 2016

Category: Documents

>> Downloads: 6

views

Report

Comments

Description

Download Gretl Lab2 - Ca` Foscari

Transcript

Gretl Lab2 - Ca` Foscari

Introduction to Econometrics - (Gretl Lab 2)
Roberto Casarin
Ca’ Foscari Summer School
Venice, July 11, 2012
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Introduzione
Analisi dei residui
Abbiamo discusso delle assunzioni alla base del modello di
regressione e delle proprietà di cui godono gli stimatori OLS sotto
queste assunzioni. In questa lezione vediamo come verificare che le
ipotesi sui termini di errore siano rispettate nel campione di dati in
esame.
◮
Normalità dei residui (test JB)
◮
Eteroschedasticità (Goldfeld-Quandt, Breusch-Pagan, White,
ARCH-LM)
◮
Autocorrelazione (Breusch-Godfrey, Durbin-Watson,
Box-Pierce, Lijung-Box)
◮
Corretta specificazione (AIC, BIC, RESET)
◮
Stabilità del modello (Chow, CUSUM)
Capitoli 6 ed 8.
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità
Eteroschedasticità
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità
Motivazioni
• Quando è presente eteroschedasticità nelle serie gli stimatori ML
e FWLS sono più efficienti rispetto allo stimatore OLS. Ma si
perde efficienza se applichiamo ML e FWLS quando in realtà la
serie è omoschedastica.
• Vediamo quindi alcuni test diagnostici per verficare l’ipotesi di
omoschedasticità: Goldfeld-Quandt, ARCH, Breusch-Pagan e
White.
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità-GQ
Goldfeld-Quandt test
Richiede che i dati siano ordinati in modo che la varianza dei
termini di errore sia non descrescente. L’ipotesi nulla è varianza
costante per tutte le osservazioni contro l’alternativa che la
varianza cresca. Per verificare questa ipotesi il campione ordinato è
diviso in tree gruppi. Il primo costitutito dalla prime T1
osservazioni ha varianza σ12 il secondo costituito dalle ultime T2
osservazioni ha varianza σ22 ed il sottocampione rimanente di
dimensione T3 = T − T1 − T2 escluso dall’analisi.
H0 : σ22 = σ12
(1)
σ22
(2)
H0 :
Roberto Casarin
>
σ12
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità-GQ
Siano RSS1 ed RSS2 la somma del quadrato dei residui della
regressione OLS rispettivamente nel primo e nel secondo
sottocampione e s12 = RSS1 /(T1 − k) ed s22 = RSS2 /(T2 − k) le
corrispondenti varianze. Allora la seguente statistica test
F =
s22 /σ22
RSS2 /((T2 − k)σ22 )
=
RSS1 /((T1 − k)σ12 )
s12 /σ12
(3)
sotto l’ipotesi nulla H0 (e sotto le ipotesi OLS) diventa F = s22 /s12
e si distribuisce come una FT2 −k,T1 −k . L’ipotesi nulla è rifiutata in
favore dell’alternativa per valori elevati di F. Non esiste una regola
generale per la scelta del numero di osservazioni T3 da escludere,
ma osserviamo che se il cambiamento di varianza è in
corrispondenza di una punto di rottura strutturale allora è ottimale
scegliere due sottocampioni e quindi T3 = 0. Se c’e’ una variazione
non improvvisa si esclude generalmente T3 = n/5 per campioni
piccoli e T3 = n/3 per campioni grandi.
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità-LR
Likelihood-ratio test
Alcune volte i dati possono essere separati in più gruppi dove la
varianza è assunta costante nei gruppi e diversa tra gruppi distinti.
Se ci sono G gruppi con varianza σj2 , e numerosità campionaria nj ,
con j = 1, . . . , G , sotto l’ipotesi nulla
H0 : σ12 = σ22 = . . . = σG2
(4)
con alternativa che la statistica test
LR = T
2
)
log(sML
−
G
X
2
)
Tj log(sj,ML
(5)
j=1
2 = u′ u/n
si distribuisce asintoticamente come χ2 (G − 1), dove sML
2
è la varianza stimata su tutto il campione di dati e sj,ML = u′j uj /nj
è la varianza stimata sul gruppo j-esimo.
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità-BP
Breusch-Pagan (LM) test
Il test Breusch-Pagan è basato su un modello di eteroschedasticità
del tipo σt2 = h(z′t γ) con zt = (1, z2t , . . . , zpt )′ set di variabili che
spiegano le differenze di varianza tra le osservazioni. L’ipotesi nulla
di varianza costante corrisponde a p − 1 restrizioni sui parametri, il
test corrisponde al test LM
−1 ′ ∂L
∂L
∂L
−E
(6)
LM =
′
∂θ
∂θ∂θ
∂θ
con θ = (β, γ ′ )′ e
T
T
t=1
t=1
1 X (yt − x′t β)2
1X
n
log(h(z′t γ))−
(7)
L(β, γ) = − log(2π)−
2
2
2
h(z′t γ)
(Nota 1: legame con ML, WLS e 2SFWLS o FWLS iterati. Nota
2: modelli moltiplicativi e additivi per σt2 ).
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità-BP
Per valutare il test dovremmo calcolare il gradiente e l’Hessiano
della verosimiglianza del modello senza vincoli e poi valutare la
statistica LM in corrispondenza dei parametri stimati sotto l’ipotesi
nulla. Si può dimostrare che questo equivale alla seguente
costruzione del test
1 : stima OLS: y = X β + u e calcolo dei residui û = y − X β̂
2 : Regressione ausiliaria: ût2 = γ0 + γ1 z2t + . . . + γp−1 zpt + et
e calcolo di R 2
3 : LM = TR 2 . LM è distribuito asintoticamente come una
χ2 (p − 1) sotto l’ipotesi nulla di omoschedasticità
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità-W
White test
Il vantaggio del test Breusch-Pagan è che la funzione h sulla forma
funzionale della varianza può essere non specificata. Comunque è
necessario conoscere quali sono le variabili zt che influenzano la
varianza. Se le variabili sono non note allora si possono utilizzare le
2 , . . . , x 2 , in tal caso
variabili esplicative: x2t , . . . , xkt e x2t
kt
p = 2k − 2. Il test LM con questa particolare scelta delle variabili
esplicative è detto test di White (senza ”cross term”). Una
estensione è il test di White con termini incrociati: xjt xis con j 6= i .
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità-ARCH
Test ARCH LM
Anche il test ARCH è un test LM che è fondato su una struttura di
eteroschedasticità del tipo ARCH(q) (Autoregressive Conditional
2
2 .
+ . . . + γq ut−q
Heteroschedasticity di ordine q): σt2 = γ0 + γ1 ut−1
Il test LM si costruisce con i seguenti passi
1 : stima OLS: y = X β + u e calcolo dei residui û = y − X β̂
2
2
2 : Regressione ausiliaria: ût2 = γ0 + γ1 ût−1
+ . . . + γq ût−q
+ et
2
e calcolo di R
3 : LM = TR 2 . LM è distribuito asintoticamente come una
χ2 (q) sotto l’ipotesi nulla di omoschedasticità
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 1
Esempio 1
Consideriamo dati cross section sul salario dei dipendenti di 474
banche. Ci sono tre categorie di lavoratori: custodi, manager e
amministrativi. Consideriamo il seguente modello di regressione
yi = β1 + β2 x2i + β3 x3i + β4 x4i + β5 D2i + β6 D3i + ui
yi : log of the salary
x2i : education
x3i : gender (dummy, 1 se maschio, 0 femmina)
x4i : minority (dummy, 1 se minoranza e 0 altrimenti)
D2i : dummy (1 lavoro come custode, 0 altrimenti)
D3i : dummy (1 lavoro come manager, 0 altrimenti)
con i = 1, . . . , n.
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
(8)
Eteroschedasticità - Esempio 1
Model 1: OLS, using observations 1–474
Dependent variable: LOGSALARY
const
EDUC
GENDER
MINORITY
DUMJCAT2
DUMJCAT3
Coefficient
Std. Error
t-ratio
p-value
9.57469
0.0441917
0.178340
−0.0748581
0.170360
0.539075
0.0542179
0.00428498
0.0209623
0.0224588
0.0434936
0.0302130
176.5965
10.3132
8.5077
−3.3331
3.9169
17.8425
0.0000
0.0000
0.0000
0.0009
0.0001
0.0000
Mean dependent var
Sum squared resid
R2
F (5, 468)
Log-likelihood
Schwarz criterion
10.35679
17.86407
0.760775
297.6627
104.4077
−171.8481
Roberto Casarin
S.D. dependent var
S.E. of regression
Adjusted R 2
P-value(F )
Akaike criterion
Hannan–Quinn
0.397334
0.195374
0.758219
7.9e–143
−196.8154
−186.9961
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 1
LOGSALARY versus JOBCAT (with least squares fit)
12
Y = 9.80 + 0.398X
LOGSALARY
11.5
11
10.5
10
9.5
1
1.5
Roberto Casarin
2
JOBCAT
2.5
Introduction to Econometrics - (Gretl Lab 2)
3
Eteroschedasticità - Esempio 1
1
0.8
0.6
resid
0.4
0.2
0
-0.2
-0.4
-0.6
1
1.5
Roberto Casarin
2
JOBCAT
2.5
Introduction to Econometrics - (Gretl Lab 2)
3
Eteroschedasticità - Esempio 1
Test Goldfeld-Quandt
• Dallo scatter plot dei residui contro la variabile di comodo
JOBCAT osserviamo che la varianza dei residui varia a seconda
della categoria. Osserviamo che i tre sottocampioni sono: 363
JOBCAT=1, 27 JOBCAT=2 e 84 JOBCAT=3. Ora consideriamo
tre modelli di regressione distinti per i tre sottocampioni.
Ovviamente esclusiamo le due varibili dummy D2i e D3i . Per il
sottocampione in cui JOBCAT=2 escludiamo GENDER dato che
nel sottocampione ci sono solo maschi. Osserviamo dai seguenti
risultati che la seconda regressione non è significativa (test F),
probabilmente anche a causa dei pochi dati.
• Quindi escludiamo il secondo sottocampione e testiamo l’ipotesi
che σ12 = σ22 contro l’alternativa σ22 > σ12 utilizzando la satistica
F = (s22 /s12 ) = (0.227476/0.188190)2 = 1.457 che ha distribuzione
F84−4,363−4 . Il p-value è pari a 0.011186 quindi rifiutiamo l’ipotesi
nulla.
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 1
Test Goldfeld-Quandt
◮
Utilizziamo Sample>Restrict, based on criterion...
per determinare i diversi sottocampioni
◮
Utilizziamo Tools>p-value finder>F... per trovare il
p-value associato al valore della statistica test
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 1
Model 3: OLS, using observations 1–363
Dependent variable: LOGSALARY
const
EDUC
GENDER
MINORITY
Coefficient
Std. Error
t-ratio
p-value
9.55642
0.0463597
0.169221
−0.0985574
0.0565441
0.00449408
0.0212746
0.0233131
169.0083
10.3157
7.9541
−4.2276
0.0000
0.0000
0.0000
0.0000
Mean dependent var
Sum squared resid
R2
F (3, 359)
Log-likelihood
Schwarz criterion
10.20254
12.71420
0.418977
86.29199
93.25585
−162.9341
Roberto Casarin
S.D. dependent var
S.E. of regression
Adjusted R 2
P-value(F )
Akaike criterion
Hannan–Quinn
0.245863
0.188190
0.414122
4.63e–42
−178.5117
−172.3197
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 1
Model 4: OLS, using observations 1–27
Dependent variable: LOGSALARY
const
EDUC
MINORITY
Coefficient
Std. Error
t-ratio
p-value
10.3939
−0.00463417
−0.0191656
0.0677387
0.00631878
0.0275429
153.4409
−0.7334
−0.6958
0.0000
0.4704
0.4932
Mean dependent var
Sum squared resid
R2
F (2, 24)
Log-likelihood
Schwarz criterion
10.33745
0.122445
0.039055
0.487710
34.53372
−59.17994
Roberto Casarin
S.D. dependent var
S.E. of regression
Adjusted R 2
P-value(F )
Akaike criterion
Hannan–Quinn
0.070006
0.071427
-0.041024
0.619985
−63.06745
−61.91149
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 1
Model 5: OLS, using observations 1–84
Dependent variable: LOGSALARY
const
EDUC
GENDER
MINORITY
Coefficient
Std. Error
t-ratio
p-value
9.67598
0.0669673
0.211185
0.260611
0.274004
0.0165246
0.0807968
0.119540
35.3133
4.0526
2.6138
2.1801
0.0000
0.0001
0.0107
0.0322
Mean dependent var
Sum squared resid
R2
F (3, 80)
Log-likelihood
Schwarz criterion
11.02962
4.139612
0.308942
11.92153
7.238179
3.246909
Roberto Casarin
S.D. dependent var
S.E. of regression
Adjusted R 2
P-value(F )
Akaike criterion
Hannan–Quinn
0.268648
0.227476
0.283028
1.56e–06
−6.476359
−2.567687
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 1
Model 9: OLS, using observations 1–474
Dependent variable: sq resid
const
DUMJCAT2
DUMJCAT3
Coefficient
Std. Error
t-ratio
p-value
0.0351658
−0.0182647
0.0201025
0.00342653
0.0130228
0.00790440
10.2628
−1.4025
2.5432
0.0000
0.1614
0.0113
Mean dependent var
Sum squared resid
R2
F (2, 471)
Log-likelihood
Schwarz criterion
0.037688
2.007417
0.019507
4.685268
622.4761
−1226.469
Roberto Casarin
S.D. dependent var
S.E. of regression
Adjusted R 2
P-value(F )
Akaike criterion
Hannan–Quinn
0.065791
0.065284
0.015343
0.009665
−1238.952
−1234.043
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 1
Breusch-Pagan
Vogliamo verificare la seguente struttura di eteroschedasticità
(modello moltiplicativo): σi2 = e γ0 +γ1 D2i +γ2 D3i . Il primo passo della
procedura consiste nel regredire il guadrato dei residui (attenzione
non il logaritmo del quadrato!) sulle due varibili dummy ottenendo
R 2 = 0.021333 (vedi figura pagina precedente). Da cui
LM = 474 · 0.021333 = 10.111 che sotto l’ipotesi nulla
γ1 = γ2 = 0 ha distribuzione χ2 (3 − 1). Il p-value è pari a 0.006.
Quindi rifiutiamo l’ipotesi nulla.
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 1
Test LR
Dividendo il campione in tre gruppi in funzione del valore dalla
variabile JOBCAT otteniamo per i tre sottocampioni:
s12 = 0.1881902 , s22 = 0.0714272 e s32 = 0.2274762 . Da cui
2
= 0.1881902 · 363−4
otteniamo s1,ML
363 = 0.0350,
27−3
2
2
s2,ML = 0.071427 27 = 0.0045 e
2
s3,ML
= 0.2274762 84−4
84 = 0.0493. Osserviamo inoltre che
2
2
2 = 0.1953742 · 474−6 = 0.0377. La
s1 = 0.195374 e quindi sML
474
statistica test: LR = 474 log(0.0377) − 363 log(0.0350) −
27 log(0.0045) − 84 log(0.0493) = 61.2, sotto l’ipotesi nulla, ha
distribuzione asintotica χ2 (3 − 1). Il p-value è pari a 0. Quindi
l’ipotesi di omoschedasticità è rifiutata.
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 1
White
Il test di White senza cross-products e con cross-products porta a
rifiutare l’ipotesi nulla di omoschedasticità con p-values pari a
0.041678 e 0.011285 rispettivamente (vedi figure seguenti).
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 1
Dependent variable: uhat 2
Coefficient
Std. Error
t-ratio
p-value
const
0.0169722
0.0534069
0.3178
0.7508
EDUC
0.000632237 0.00835041
0.07571 0.9397
GENDER
-0.00104331 0.00704285
-0.1481 0.8823
MINORITY -0.00674886 0.00750964
-0.8987 0.3693
DUMJCAT2 -0.00991070 0.0145921
-0.6792 0.4974
DUMJCAT3 0.00734671
0.0116268
0.6319
0.5278
sqEDUC
7.09153e-05 0.000326738 0.2170
0.8283
Unadjusted R-squared = 0.027609 Test statistic: TR 2 =
13.086833, with p-value = P(Chi − square(6) > 13.086833) =
0.041678
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 1
Dependent variable: uhat 2 Omitted due to exact collinearity: X 3 − X 5
Coefficient
Std. Error
t-ratio p-value
const
0.131454
0.0718267
1.830
0.0679
EDUC
-0.0188857
0.0118901
-1.588
0.1129
GENDER
-0.0374905
0.0448115
-0.8366 0.4032
MINORITY 0.0215931
0.0448275
0.4817
0.6303
DUMJCAT2 -0.0627389
0.0746543
-0.8404 0.4011
DUMJCAT3 0.273542
0.109895
2.489
0.0132
sqEDUC
0.000884387 0.000491919 1.798
0.0729
X2 − X3
0.00248857
0.00333562
0.7461
0.4560
X2 − X4
-0.00253195 0.00348105
-0.7274 0.4674
X2 − X5
0.00482944
0.00665341
0.7259
0.4683
X2 − X6
-0.0183418
0.00695796
-2.636
0.0087
X3 − X4
-0.00282086 0.0166238
-0.1697 0.8653
X3 − X6
0.0215932
0.0262545
0.8225
0.4112
X4 − X5
0.0224349
0.0298916
0.7505
0.4533
X4 − X6
0.0812140
0.0370309
2.193
0.0288
Unadjusted R-squared = 0.060660 Test statistic: TR 2 = 28.752679, with
p-value = P(Chi − square(14) > 28.752679) = 0.011285
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 2
Esempio 2
Sia yt il tasso di rendimento delle obbligazioni con rating AAA e
sia xt il tasso di rendimento dei titoli di stato (Treasury Bill) a
3-mesi, rilevati mensilemente tra gennaio 1950 e dicembre 1999.
Vogliamo stimare
∆yt = α + β∆xt + ut
(9)
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 2
Model 1: OLS, using observations 1948:02–1999:12 (T = 623)
Dependent variable: DAAA
const
DUS3MT
Coefficient
Std. Error
t-ratio
p-value
0.00565089
0.274529
0.00672904
0.0143765
0.8398
19.0957
0.4014
0.0000
Mean dependent var
Sum squared resid
R2
F (1, 621)
Log-likelihood
Schwarz criterion
ρ̂
0.007528
17.51432
0.369957
364.6465
228.5322
−444.1953
0.276686
Roberto Casarin
S.D. dependent var
S.E. of regression
Adjusted R 2
P-value(F )
Akaike criterion
Hannan–Quinn
Durbin–Watson
0.211405
0.167939
0.368942
2.66e–64
−453.0644
−449.6177
1.446100
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 2
Regression residuals (= observed - fitted DAAA)
1.2
1
0.8
residual
0.6
0.4
0.2
0
-0.2
-0.4
-0.6
-0.8
1950
1960
1970
Roberto Casarin
1980
1990
2000
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 2
1.2
1
usq1
0.8
0.6
0.4
0.2
0
1950
1960
1970
Roberto Casarin
1980
1990
2000
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 2
DUS3MT versus DAAA (with least squares fit), sub-sample: 1948:01-1974:12
1
Y = -0.00294 + 1.19X
DUS3MT
0.5
0
-0.5
-1
-1.5
-0.4
-0.3
-0.2
-0.1
Roberto Casarin
0
DAAA
0.1
0.2
0.3
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 2
DUS3MT versus DAAA (with least squares fit), sub-sample 1975:01-1999:12
3
Y = -0.000394 + 1.37X
2
DUS3MT
1
0
-1
-2
-3
-4
-5
-1
-0.5
Roberto Casarin
0
DAAA
0.5
1
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 2
Vogliamo verificare l’ipotesi di omoschedasticità, utilizzando i
seguenti modelli di eteroschedasticità
i σt2 = σ 2 (∆xt )2
(White)
ii σt2 = γ1 + γ2 ut2
(ARCH LM)
iii σt2 = γ1 + γ2 ∆xt
(Breusch-Pagan LM)
iv σt2 = γ1 + γ2 Dt , (Dt = 1 se t > 1974 : 12)
(Breusch-Pagan LM)
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 2
White’s test for heteroskedasticity OLS, using observations
1948:02-1999:12 (T = 623)
Dependent variable: uhat 2
Coefficient
Std. Error
t-ratio
p-value
const
0.0266391
0.00313198 8.506
1.36e-016
DUS3MT -7.22712e-05 0.00695667 -0.01039 0.9917
sqDUS3MT 0.00672943
0.00275691 2.441
0.0149
Unadjusted R-squared = 0.010725
Test statistic: TR 2 = 6.681598,
with p-value = P(Chi − square(2) > 6.681598) = 0.035409
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 2
Test for ARCH of order 2
Coefficient Std. Error
t-ratio
alpha(0) 0.0171892 0.00325323 5.284
alpha(1) 0.166183
0.0391886
4.241
alpha(2) 0.225508
0.0391904
5.754
Null hypothesis: no ARCH effect is present
Test statistic: LM = 58.742
with p-value = P(Chi − square(2) > 58.742) =
Roberto Casarin
p-value
1.76e-07
2.57e-05
1.37e-08
1.75523e-013
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 2
Breusch-Pagan test for heteroskedasticity OLS, using observations
1948:02-1999:12 (T = 623)
Dependent variable: scaled uhat 2
Coefficient Std. Error t-ratio
p-value
const
1.00139
0.109639 9.134
9.25e-019
DUS3MT -0.203847 0.234242 -0.8702 0.3845
Explained sum of squares = 5.67032
Test statistic: LM = 2.835158,
with p-value = P(Chi − square(1) > 2.835158) = 0.092222
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 2
Breusch-Pagan test for heteroskedasticity
Model 2: OLS, using observations 1948:02–1999:12 (T = 623)
Dependent variable: usq1a
const
du74
Coefficient
Std. Error
t-ratio
p-value
0.00912376
0.0394340
0.00413967
0.00596553
2.2040
6.6103
0.0279
0.0000
Mean dependent var
Sum squared resid
R2
F (1, 621)
Log-likelihood
Schwarz criterion
ρ̂
0.028113
3.437360
0.065739
43.69633
735.7523
−1458.636
0.159407
Roberto Casarin
S.D. dependent var
S.E. of regression
Adjusted R 2
P-value(F )
Akaike criterion
Hannan–Quinn
Durbin–Watson
0.076910
0.074399
0.064234
8.27e–11
−1467.505
−1464.058
1.681000
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 2
• Il test White, ARCH-LM e Breusch-Pagan (iii) portanto a
rigettare l’ipotesi nulla di omoschedasticità (vedi p-value). Per il
test di Breusch-Pagan (iv) osserviamo che
LM = nR 2 = 623 · 0.065739 = 40.95539 che sotto l’ipotesi nulla si
distribuisce come una χ2 (1). Il p-value è pari a 0. Quindi
rigettiamo l’ipotesi nulla di omoschedasticità.
• Confrontiamo ora gli effetti dei tre modelli di eteroschedasticità
sui residui e vediamo come utilizzare uno dei modelli di
eteroschedasticità per ottenere una stima 2SFWLS.
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 2
Esempio: regimi di volatilità (variabile dummy) e stima
2SFWLS
◮
stima OLS ∆yt = α + β∆xt + ut
◮
generiamo la serie σt2 = ût2 (denominata usq1)
◮
◮
costruiamo il modello di regressione ausiliario:
σt2 = γ1 + γ2 Dt + εt , (Add>time trend e poi Add>define
new variable> du80=time>380)
determiniamo i fitted σ̂t2 e li salviamo con nome yhat8
◮
Definiamo i pesi 1/σ̂t
Add>define new variable> sigmainv=1/sqrt(yhat8)
◮
stima WLS con pesi 1/σ̂t
Models>Other Linear Models>Weighted Least
Squares...
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 2
Model 8: OLS, using observations 1948:02–1999:12 (T = 623)
Dependent variable: usq1
const
du80
Coefficient
Std. Error
t-ratio
p-value
0.00989738
0.0472844
0.00375262
0.00604607
2.6375
7.8207
0.0086
0.0000
Mean dependent var
Sum squared resid
R2
F (1, 621)
Log-likelihood
Schwarz criterion
ρ̂
0.028113
3.349347
0.089660
61.16299
743.8321
−1474.795
0.138765
Roberto Casarin
S.D. dependent var
S.E. of regression
Adjusted R 2
P-value(F )
Akaike criterion
Hannan–Quinn
Durbin–Watson
0.076910
0.073440
0.088194
2.26e–14
−1483.664
−1480.217
1.722141
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 2
Actual and fitted usq1
1.2
fitted
actual
1
usq1
0.8
0.6
0.4
0.2
0
1950
1960
1970
Roberto Casarin
1980
1990
2000
Introduction to Econometrics - (Gretl Lab 2)
Eteroschedasticità - Esempio 2
Model 9: WLS, using observations 1948:02–1999:12 (T = 623)
Dependent variable: DAAA
Variable used as weight: sigmainv
const
DUS3MT
Coefficient
Std. Error
t-ratio
p-value
0.00931597
0.248917
0.00561751
0.0140703
1.6584
17.6910
0.0977
0.0000
Statistics based on the weighted data:
Sum squared resid
R2
F (1, 621)
Log-likelihood
Schwarz criterion
ρ̂
94.93639
0.335097
312.9709
−297.9615
608.7920
0.291173
S.E. of regression
Adjusted R 2
P-value(F )
Akaike criterion
Hannan–Quinn
Durbin–Watson
0.390994
0.334026
5.10e–57
599.9229
603.3697
1.417149
Statistics
based
original
data: - (Gretl Lab 2)
Roberto
Casarinon the
Introduction
to Econometrics
Eteroschedasticità - Esempio 2
Confronto: WLS è più efficiente di OLS quando gli errori sono
eteroschedastici. Si veda anche il p-value dell’intercetta.
WLS
const
DUS3MT
Coefficient
Std. Error
t-ratio
p-value
0.00931597
0.248917
0.00561751
0.0140703
1.6584
17.6910
0.0977
0.0000
OLS
const
DUS3MT
Coefficient
Std. Error
t-ratio
p-value
0.00565089
0.274529
0.00672904
0.0143765
0.8398
19.0957
0.4014
0.0000
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Autocorrelazione
Autocorrelazione
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Autocorrelazione
• Una delle assunzioni del modello di regressione è che i termini di
errore siano indipendenti. E’quindi necessario verificare che i
residui di una regressione siano indipendenti attraverso dei test
(Durbin-Watson, Bresusch-Godfrey, Box-Pierce e Ljiung-Box).
• In particolare diremo che i termini di disturbo del modello di
regressione
yt = x′t β + ut
(10)
sono serialmente correlati se esistono s 6= t tali che E(ut , us ) 6= 0.
In questo caso la matrice di varianza covarianze di u non è
diagonale. Questo significa che yt ed ys oltre ai regressori hanno in
comune altri elementi e che il modello di regressione dato sopra
con le ipotesi OLS viste a lezione non è soddisfacente.
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Autocorrelazione
• Potrebbe trattarsi di problemi di omissione di variabili, non
corretta specificazione della forma funzionale, mancata inclusione
di variabili dipendenti (o indipedenti) ritardate.
• Primi a di presentare questi test vediamo se è possibile intuire
anche graficamente la presenza di correlazione seriale
(autocorrelazione) e che in alcuni casi è possibile dare un
interpretazione economica.
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Autocorrelazione
Tassi di Interesse
• Consideriamo il dataset xm722ibr.wk1 relativo a tassi su
obbligazioni con rating AAA yt e dei tassi su obbligazioni
pubbliche (Treasury Bill a 3 mesi), xt . Consideriamo le differenze
prime di tali variabili: ∆xt e ∆yt .
• dal modello di regressione ∆yt = α + β∆xt + ut otteniamo i
residui ût . Il coefficiente di correlazione tra ût e ût−1 è pari a
0.276543. Dal diagramma di dispersione si può osservare la
presenza di una relazione lineare tra le due variabili.
• E’ ragionevole pensare che a seguito di una deviazione da una
relazione di equilibrio tra yt e xt l’aggiustamento di yt non sia
immediato, ma sia progressivo nel tempo. Per questo motivo una
relazione statica tra ∆yt e ∆xt può non essere adeguata con
conseguente evidenza di correlazione seriale nei residui.
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Autocorrelazione
uhat versus uhat1 (with least squares fit)
1.2
Y = 9.65e-005 + 0.277X
1
0.8
0.6
uhat
0.4
0.2
0
-0.2
-0.4
-0.6
-0.8
-0.6
-0.4
-0.2
0
Roberto Casarin
0.2
uhat1
0.4
0.6
0.8
1
Introduction to Econometrics - (Gretl Lab 2)
Autocorrelazione
Coefficienti di autocorrelazione
Test sulla correlazione seriale richiedono che le osservazioni
possano essere naturalmente ordinate. Per series storiche l’ordine è
dato dall’indice temporale. Nei dati cross-section le osservazioni
possono essere ordinate in base ad una delle variabili esplicative.
L’indice di correlazione è
PT
ût ût−1
(11)
r = qP t=2 P
T −1 2
T
2
û
û
t=1 t
t=2 t
di cui si utilizza una versione asintoticamente equivalente
PT
t=2 ût ût−1
r1 = P
T
2
t=1 ût
(12)
Elevati valordi di r1 possono indicare errata specificazioine nella
dinamica per dati di tipo timeseries oppure errata forma funzionale
per dati cross-section.
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Autocorrelazione
Si può costruire l’autocorrelogramma valutando per ogni ritardo
k con k = . . . , K il seguente coefficente di correlazione di ordine k
rk =
PT
t=k+1 ût ût−k
PT
2
t=1 ût
(13)
Il grafico generato da (k, rk ) può dare un’idea della presenza di
autocorrelazione
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Autocorrelazione
Test Durbin-Watson Il test DW è basato sulla seguente idea.
Siano σ 2 e ̺ la varianza dei termini di disturbo ed la correlazione
tra ut e ut−1 allora E(ut − ut−1 )2 = 2σ 2 (1 − ̺). Cosı̀ se i due
termini di errore consecutivi sono correlati la differenza (ut − ut−1
tenderà ad essere piccola. La statistica DW è definita come segue
d=
T
P
(ut − ut−1 )2
t=2
T
P
t=1
(14)
ut2
La statistica soddisfa: 0 ≤ d ≤ 4 e d ≈ 2(1 − r1 ). Valori di d vicini
allo zero indicano autocorrelazione positiva mentre valori prossimi
a 4 indicano autocorrelazione negativa. I valori critici della
statistica test dipendono dalla matrice X di regressori. Le bande di
confidenza esistono per regressori deterministici e termini di errore
gaussiani. DW è utilizzata in modo informale come strumento di
diagnosi per indicare la presenza di autocorrelazione
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Autocorrelazione
Test Breusch-Godfrey LM Il modello di riferimento è
yt = x′t β + ut
(15)
ut = γ1 ut−1 + . . . + γp ut−p + ηt
(16)
con ηt iid e gaussiano con varianza ση2 per ogni t. Considerando il
caso AR(1), cioè p = 1 segue che
yt = γ1 yt−1 + x′t β − γx′t−1 β + ηt
(17)
in cui si vuole valutare l’ipotesi che γ1 = 0. Si può dimostrare che
il test è equivalente alla seguente procedura a due passi in cui si
utilizza un modello di regressione ausiliario.
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Autocorrelazione
◮
stima OLS y = X β + u
◮
generiamo i residui û = y − X β̂
◮
regressione ausiliaria (stima OLS):
ût = x′t δ + γ1 ût−1 + . . . + γp ût−p + ωt
◮
determinare LM = TR 2 che è distribuita asintoticamente
come χ2 (p) sotto l’ipotesi nulla di assenza di correlazione
seriale H0 = γ1 = . . . = γp = 0
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Autocorrelazione
Tests Box-Pierce e Ljiung-Box Le statistiche test sono
BP = T
LB = T
p
X
k=1
p
X
k=1
rk2
(18)
T +2 2
r
T −k k
(19)
Sotto l’ipotesi nulla di assenza di autocorrelazione la statistica BP
ha distribuzione asintotica χ2 (p) mentre la statistica LB (detta
anche Q-test) ha distribuzione asintotica χ2 (p) (sotto l’ipotesi
aggiuntiva che i regressori siano deterministici, nel caso siano
stocastici è consigliabile utilizzare il test Breusch-Godfrey).
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Autocorrelazione
Rimedi Possibili
• Per dati cross-section è necessario variare le forma funzionale.
• Per dati timeseries è necessario considerare le proprietà
dinamiche dei dati. Per esempio considerando
yt = β1 + β2 xt + ut
(20)
la correlazione tra ut = yt − β1 − β2 xt e
ut−1 = yt−1 − β1 − β2 xt−1 può essere dovuta al legame tra yt e
xt−1 e yt−1 che può essere considerata con il modello
yt = γ1 + γ2 xt + γ3 xt−1 + γ4 yt−1 + ηt
con ηt iid. (Si veda nota su modelli ADL).
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
(21)
Autocorrelazione
Rimedi Possibili
• Modello di regressione con errori AR(1).
ut = γut−1 + ηt
(22)
ut = yt − β1 − β2 xt
(23)
da cui segue
yt = β1 (1 − γ) + β2 xt − β2 γxt−1 + γyt−1 + ηt
(24)
che corrisponde a
yt = γ1 + γ2 xt + γ3 xt−1 + γ4 yt−1 + ηt
(25)
con γ1 = β1 (1 − γ), γ2 = β2 , γ3 = −β2 γ e γ4 = γ e con il vincolo
γ2 γ4 + γ3 = 0
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
(26)
Autocorrelazione
Rimedi Possibili
• Se i termini di errore ηt sono distribuiti normalmente è possibile
stimare i parametri γ e β1 e β2 utilizzando NLS (nonlinear least
square) altrimenti si può utilizzare una procedura a due passi
(procedura di Cochrane-Orcutt). Si osserva che:
yt − γyt−1 = β1 (1 − γ) + β2 (xt − γxt−1 ) + ηt
(27)
da cui:
◮
Consideriamo γ = 0 e stimiamo con OLS β1 e β2 :
yt = β1 + β2 xt + ut . Lo stimatore sarà consistente (se
−1 < γ < 1) ma non efficiente.
◮
Regrediamo ût su ût−1 ottenendo γ̂
◮
e yt − γ̂yt−1 su xt − γ̂xt−1 ottenendo dei nuovi residui η̃t .
Una nuova stima di γ può essere ottenuta utilizzando i nuovi
residui.
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Autocorrelazione
Esempio
Consideriamo l’esempio sui tassi di interesse
• La statistica DW = 1.446 quindi r1 ≈ 0.277
• Il coefficiente di autocorrelazione del primo ordine è significativo
(Q-test)
• Il test Breusch-Godfrey con p = 1 e p = 2 ritardi indica la
presenza di autocorrelazione
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Autocorrelazione
OLS, using observations 1948:02–1999:12 (T = 623)
Dependent variable: DAAA
const
DUS3MT
Coefficient
Std. Error
t-ratio
p-value
0.00565089
0.274529
0.00672904
0.0143765
0.8398
19.0957
0.4014
0.0000
Mean dependent var
Sum squared resid
R2
F (1, 621)
Log-likelihood
Schwarz criterion
ρ̂
0.007528
17.51432
0.369957
364.6465
228.5322
−444.1953
0.276686
Roberto Casarin
S.D. dependent var
S.E. of regression
Adjusted R 2
P-value(F )
Akaike criterion
Hannan–Quinn
Durbin–Watson
0.211405
0.167939
0.368942
2.66e–64
−453.0644
−449.6177
1.446100
Introduction to Econometrics - (Gretl Lab 2)
Autocorrelazione
Residual ACF
0.3
0.2
0.1
0
-0.1
-0.2
-0.3
+- 1.96/T0.5
0
2
4
6
8
10
12
lag
Residual PACF
0.3
0.2
0.1
0
-0.1
-0.2
-0.3
0
+- 1.96/T .5
0
2
4
6
8
10
12
lag
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Autocorrelazione
Residual autocorrelation function
LAG
ACF
PACF
Q-stat
1
2
3
4
5
6
7
8
9
10
11
12
0.2764
-0.0754
0.0086
0.0337
0.0546
0.1012
0.0354
0.0499
0.0449
0.0079
0.0329
-0.0611
0.2764
-0.1643
0.0871
-0.0087
0.0606
0.0785
-0.0110
0.0705
0.0034
0.0011
0.0317
-0.1074
47.8159
51.3775
51.4240
52.1380
54.0139
60.4804
61.2716
62.8484
64.1241
64.1639
64.8526
67.2286
Roberto Casarin
[p-value]
[0.000]
[0.000]
[0.000]
[0.000]
[0.000]
[0.000]
[0.000]
[0.000]
[0.000]
[0.000]
[0.000]
[0.000]
Introduction to Econometrics - (Gretl Lab 2)
Autocorrelazione
Breusch-Godfrey test for autocorrelation up to order 12 OLS, using
observations 1948:02-1999:12 (T = 623) Dependent variable: uhat
Coefficient
Std. Error
t-ratio
p-value
const
0.000292938 0.00630670 0.04645 0.9630
DUS3MT -0.0279546
0.0143213
-1.952
0.0514
uhat1
0.358428
0.0414183
8.654
4.44e-017
uhat2
-0.214417
0.0428149
-5.008
7.21e-07
uhat3
0.0900817
0.0435623
2.068
0.0391
uhat4
-0.00895890 0.0438469
-0.2043 0.8382
uhat5
0.0232144
0.0438376
0.5296
0.5966
Unadjusted R-squared = 0.138853, Test statistic: LMF =
8.182996, with p-value = P(F (12, 609) > 8.183) = 2.24e-014
Alternative statistic: TR 2 = 86.505134, with p-value =
P(Chi − square(12) > 86.5051) = 2.34e-013
Ljung-Box Q’ = 67.2286, with p-value =
P(Chi − square(12) > 67.2286) = 1.05e-009
Roberto Casarin
Introduction to Econometrics - (Gretl Lab 2)
Autocorrelazione
Cochrane–Orcutt, using observations 1948:03–1999:12 (T = 622)
Dependent variable: DAAA
ρ = 0.289012
ρ̂ = 0.289012
const
DUS3MT
Coefficient
Std. Error
t-ratio
p-value
0.00594436
0.252253
0.00909245
0.0143429
0.6538
17.5873
0.5135
0.0000
Statistics based on the
Mean dependent var 0.007556
Sum squared resid
16.11453
2
R
0.420317
F (1, 620)
309.3128
ρ̂
0.050437
Roberto Casarin
rho-differenced data:
S.D. dependent var
S.E. of regression
Adjusted R 2
P-value(F )
Durbin–Watson
0.211574
0.161218
0.419382
1.80e–56
1.896534
Introduction to Econometrics - (Gretl Lab 2)