Comments
Transcript
Econometria Applicata Analisi dei residui
Econometria Applicata Analisi dei residui Roberto Casarin Università Ca’ Foscari Venice, December 5, 2012 R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 1 / 63 Introduzione Analisi dei residui Abbiamo discusso delle assunzioni alla base del modello di regressione e delle proprietà di cui godono gli stimatori OLS sotto queste assunzioni. In questa lezione vediamo come verificare che le ipotesi sui termini di errore siano rispettate nel campione di dati in esame. Normalità dei residui (test JB) Eteroschedasticità (Goldfeld-Quandt, Breusch-Pagan, White, ARCH-LM) Autocorrelazione (Breusch-Godfrey, Durbin-Watson, Box-Pierce, Lijung-Box) Corretta specificazione (AIC, BIC, RESET) Stabilità del modello (Chow, CUSUM) Capitoli 6 ed 8. R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 2 / 63 Eteroschedasticità Eteroschedasticità R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 3 / 63 Eteroschedasticità Motivazioni • Quando è presente eteroschedasticità nelle serie gli stimatori ML e FWLS sono più efficienti rispetto allo stimatore OLS. Ma si perde efficienza se applichiamo ML e FWLS quando in realtà la serie è omoschedastica. • Vediamo quindi alcuni test diagnostici per verficare l’ipotesi di omoschedasticità: Goldfeld-Quandt, ARCH, Breusch-Pagan e White. R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 4 / 63 Eteroschedasticità-GQ Goldfeld-Quandt test Richiede che i dati siano ordinati in modo che la varianza dei termini di errore sia non descrescente. L’ipotesi nulla è varianza costante per tutte le osservazioni contro l’alternativa che la varianza cresca. Per verificare questa ipotesi il campione ordinato è diviso in tree gruppi. Il primo costitutito dalla prime T1 osservazioni ha varianza σ12 il secondo costituito dalle ultime T2 osservazioni ha varianza σ22 ed il sottocampione rimanente di dimensione T3 = T − T1 − T2 escluso dall’analisi. H0 : σ22 = σ12 H0 : σ22 > σ12 R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui (1) (2) Venice, December 5, 2012 5 / 63 Eteroschedasticità-GQ Siano RSS1 ed RSS2 la somma del quadrato dei residui della regressione OLS rispettivamente nel primo e nel secondo sottocampione e s12 = RSS1 /(T1 − k) ed s22 = RSS2 /(T2 − k) le corrispondenti varianze. Allora la seguente statistica test F = RSS2 /((T2 − k)σ22 ) s 2 /σ 2 = 22 22 2 RSS1 /((T1 − k)σ1 ) s1 /σ1 (3) sotto l’ipotesi nulla H0 (e sotto le ipotesi OLS) diventa F = s22 /s12 e si distribuisce come una FT2 −k,T1 −k . L’ipotesi nulla è rifiutata in favore dell’alternativa per valori elevati di F. Non esiste una regola generale per la scelta del numero di osservazioni T3 da escludere, ma osserviamo che se il cambiamento di varianza è in corrispondenza di una punto di rottura strutturale allora è ottimale scegliere due sottocampioni e quindi T3 = 0. Se c’e’ una variazione non improvvisa si esclude generalmente T3 = n/5 per campioni piccoli e T3 = n/3 per campioni grandi. R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 6 / 63 Eteroschedasticità-LR Likelihood-ratio test Alcune volte i dati possono essere separati in più gruppi dove la varianza è assunta costante nei gruppi e diversa tra gruppi distinti. Se ci sono G gruppi con varianza σj2 , e numerosità campionaria nj , con j = 1, . . . , G , sotto l’ipotesi nulla H0 : σ12 = σ22 = . . . = σG2 (4) con alternativa che la statistica test 2 LR = T log(sML )− G X 2 Tj log(sj,ML ) (5) j=1 2 si distribuisce asintoticamente come χ2 (G − 1), dove sML = u′ u/n è la varianza 2 ′ stimata su tutto il campione di dati e sj,ML = uj uj /nj è la varianza stimata sul gruppo j-esimo. R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 7 / 63 Eteroschedasticità-BP Breusch-Pagan (LM) test Il test Breusch-Pagan è basato su un modello di eteroschedasticità del tipo σt2 = h(z′t γ) con zt = (1, z2t , . . . , zpt )′ set di variabili che spiegano le differenze di varianza tra le osservazioni. L’ipotesi nulla di varianza costante corrisponde a p − 1 restrizioni sui parametri, il test corrisponde al test LM LM = ∂L ∂θ ′ −1 ∂L ∂L −E ∂θ∂θ′ ∂θ (6) con θ = (β, γ ′ )′ e T T n 1X 1 X (yt − x′t β)2 L(β, γ) = − log(2π) − log(h(z′t γ)) − 2 2 t=1 2 t=1 h(z′t γ) (7) (Nota 1: legame con ML, WLS e 2SFWLS o FWLS iterati. Nota 2: modelli moltiplicativi e additivi per σt2 ). R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 8 / 63 Eteroschedasticità-BP Per valutare il test dovremmo calcolare il gradiente e l’Hessiano della verosimiglianza del modello senza vincoli e poi valutare la statistica LM in corrispondenza dei parametri stimati sotto l’ipotesi nulla. Si può dimostrare che questo equivale alla seguente costruzione del test 1 : stima OLS: y = X β + u e calcolo dei residui û = y − X β̂ 2 : Regressione ausiliaria: ût2 = γ0 + γ1 z2t + . . . + γp−1 zpt + et e calcolo di R 2 3 : LM = TR 2 . LM è distribuito asintoticamente come una χ2 (p − 1) sotto l’ipotesi nulla di omoschedasticità R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 9 / 63 Eteroschedasticità-W White test Il vantaggio del test Breusch-Pagan è che la funzione h sulla forma funzionale della varianza può essere non specificata. Comunque è necessario conoscere quali sono le variabili zt che influenzano la varianza. Se le variabili sono non note allora 2 2 si possono utilizzare le variabili esplicative: x2t , . . . , xkt e x2t , . . . , xkt , in tal caso p = 2k − 2. Il test LM con questa particolare scelta delle variabili esplicative è detto test di White (senza ”cross term”). Una estensione è il test di White con termini incrociati: xjt xis con j 6= i. R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 10 / 63 Eteroschedasticità-ARCH Test ARCH LM Anche il test ARCH è un test LM che è fondato su una struttura di eteroschedasticità del tipo ARCH(q) (Autoregressive Conditional 2 2 Heteroschedasticity di ordine q): σt2 = γ0 + γ1 ut−1 + . . . + γq ut−q . Il test LM si costruisce con i seguenti passi 1 : stima OLS: y = X β + u e calcolo dei residui û = y − X β̂ 2 2 2 : Regressione ausiliaria: ût2 = γ0 + γ1 ût−1 + . . . + γq ût−q + et e calcolo di R 2 3 : LM = TR 2 . LM è distribuito asintoticamente come una χ2 (q) sotto l’ipotesi nulla di omoschedasticità R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 11 / 63 Eteroschedasticità - Esempio 1 Esempio 1 Consideriamo dati cross section sul salario dei dipendenti di 474 banche. Ci sono tre categorie di lavoratori: custodi, manager e amministrativi. Consideriamo il seguente modello di regressione yi = β1 + β2 x2i + β3 x3i + β4 x4i + β5 D2i + β6 D3i + ui (8) yi : log of the salary x2i : education x3i : gender (dummy, 1 se maschio, 0 femmina) x4i : minority (dummy, 1 se minoranza e 0 altrimenti) D2i : dummy (1 lavoro come custode, 0 altrimenti) D3i : dummy (1 lavoro come manager, 0 altrimenti) con i = 1, . . . , n. R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 12 / 63 Eteroschedasticità - Esempio 1 Model 1: OLS, using observations 1–474 Dependent variable: LOGSALARY const EDUC GENDER MINORITY DUMJCAT2 DUMJCAT3 Coefficient Std. Error t-ratio p-value 9.57469 0.0441917 0.178340 −0.0748581 0.170360 0.539075 0.0542179 0.00428498 0.0209623 0.0224588 0.0434936 0.0302130 176.5965 10.3132 8.5077 −3.3331 3.9169 17.8425 0.0000 0.0000 0.0000 0.0009 0.0001 0.0000 Mean dependent var Sum squared resid R2 F (5, 468) Log-likelihood Schwarz criterion R. Casarin (Università Ca’ Foscari) 10.35679 17.86407 0.760775 297.6627 104.4077 −171.8481 S.D. dependent var S.E. of regression Adjusted R 2 P-value(F ) Akaike criterion Hannan–Quinn Econometria Applicata Analisi dei residui 0.397334 0.195374 0.758219 7.9e–143 −196.8154 −186.9961 Venice, December 5, 2012 13 / 63 Eteroschedasticità - Esempio 1 LOGSALARY versus JOBCAT (with least squares fit) 12 Y = 9.80 + 0.398X LOGSALARY 11.5 11 10.5 10 9.5 1 R. Casarin (Università Ca’ Foscari) 1.5 2 JOBCAT Econometria Applicata Analisi dei residui 2.5 3 Venice, December 5, 2012 14 / 63 Eteroschedasticità - Esempio 1 1 0.8 0.6 resid 0.4 0.2 0 -0.2 -0.4 -0.6 1 R. Casarin (Università Ca’ Foscari) 1.5 2 JOBCAT Econometria Applicata Analisi dei residui 2.5 3 Venice, December 5, 2012 15 / 63 Eteroschedasticità - Esempio 1 Test Goldfeld-Quandt • Dallo scatter plot dei residui contro la variabile di comodo JOBCAT osserviamo che la varianza dei residui varia a seconda della categoria. Osserviamo che i tre sottocampioni sono: 363 JOBCAT=1, 27 JOBCAT=2 e 84 JOBCAT=3. Ora consideriamo tre modelli di regressione distinti per i tre sottocampioni. Ovviamente esclusiamo le due varibili dummy D2i e D3i . Per il sottocampione in cui JOBCAT=2 escludiamo GENDER dato che nel sottocampione ci sono solo maschi. Osserviamo dai seguenti risultati che la seconda regressione non è significativa (test F), probabilmente anche a causa dei pochi dati. • Quindi escludiamo il secondo sottocampione e testiamo l’ipotesi che σ12 = σ22 contro l’alternativa σ22 > σ12 utilizzando la satistica F = (s22 /s12 ) = (0.227476/0.188190)2 = 1.457 che ha distribuzione F84−4,363−4 . Il p-value è pari a 0.011186 quindi rifiutiamo l’ipotesi nulla. R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 16 / 63 Eteroschedasticità - Esempio 1 Test Goldfeld-Quandt Utilizziamo Sample>Restrict, based on criterion... per determinare i diversi sottocampioni Utilizziamo Tools>p-value finder>F... per trovare il p-value associato al valore della statistica test R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 17 / 63 Eteroschedasticità - Esempio 1 Model 3: OLS, using observations 1–363 Dependent variable: LOGSALARY const EDUC GENDER MINORITY Coefficient Std. Error t-ratio p-value 9.55642 0.0463597 0.169221 −0.0985574 0.0565441 0.00449408 0.0212746 0.0233131 169.0083 10.3157 7.9541 −4.2276 0.0000 0.0000 0.0000 0.0000 Mean dependent var Sum squared resid R2 F (3, 359) Log-likelihood Schwarz criterion R. Casarin (Università Ca’ Foscari) 10.20254 12.71420 0.418977 86.29199 93.25585 −162.9341 S.D. dependent var S.E. of regression Adjusted R 2 P-value(F ) Akaike criterion Hannan–Quinn Econometria Applicata Analisi dei residui 0.245863 0.188190 0.414122 4.63e–42 −178.5117 −172.3197 Venice, December 5, 2012 18 / 63 Eteroschedasticità - Esempio 1 Model 4: OLS, using observations 1–27 Dependent variable: LOGSALARY const EDUC MINORITY Coefficient Std. Error t-ratio p-value 10.3939 −0.00463417 −0.0191656 0.0677387 0.00631878 0.0275429 153.4409 −0.7334 −0.6958 0.0000 0.4704 0.4932 Mean dependent var Sum squared resid R2 F (2, 24) Log-likelihood Schwarz criterion R. Casarin (Università Ca’ Foscari) 10.33745 0.122445 0.039055 0.487710 34.53372 −59.17994 S.D. dependent var S.E. of regression Adjusted R 2 P-value(F ) Akaike criterion Hannan–Quinn Econometria Applicata Analisi dei residui 0.070006 0.071427 -0.041024 0.619985 −63.06745 −61.91149 Venice, December 5, 2012 19 / 63 Eteroschedasticità - Esempio 1 Model 5: OLS, using observations 1–84 Dependent variable: LOGSALARY const EDUC GENDER MINORITY Coefficient Std. Error t-ratio p-value 9.67598 0.0669673 0.211185 0.260611 0.274004 0.0165246 0.0807968 0.119540 35.3133 4.0526 2.6138 2.1801 0.0000 0.0001 0.0107 0.0322 Mean dependent var Sum squared resid R2 F (3, 80) Log-likelihood Schwarz criterion R. Casarin (Università Ca’ Foscari) 11.02962 4.139612 0.308942 11.92153 7.238179 3.246909 S.D. dependent var S.E. of regression Adjusted R 2 P-value(F ) Akaike criterion Hannan–Quinn Econometria Applicata Analisi dei residui 0.268648 0.227476 0.283028 1.56e–06 −6.476359 −2.567687 Venice, December 5, 2012 20 / 63 Eteroschedasticità - Esempio 1 Model 9: OLS, using observations 1–474 Dependent variable: sq resid const DUMJCAT2 DUMJCAT3 Coefficient Std. Error t-ratio p-value 0.0351658 −0.0182647 0.0201025 0.00342653 0.0130228 0.00790440 10.2628 −1.4025 2.5432 0.0000 0.1614 0.0113 Mean dependent var Sum squared resid R2 F (2, 471) Log-likelihood Schwarz criterion R. Casarin (Università Ca’ Foscari) 0.037688 2.007417 0.019507 4.685268 622.4761 −1226.469 S.D. dependent var S.E. of regression Adjusted R 2 P-value(F ) Akaike criterion Hannan–Quinn Econometria Applicata Analisi dei residui 0.065791 0.065284 0.015343 0.009665 −1238.952 −1234.043 Venice, December 5, 2012 21 / 63 Eteroschedasticità - Esempio 1 Breusch-Pagan Vogliamo verificare la seguente struttura di eteroschedasticità (modello moltiplicativo): σi2 = e γ0 +γ1 D2i +γ2 D3i . Il primo passo della procedura consiste nel regredire il guadrato dei residui (attenzione non il logaritmo del quadrato!) sulle due varibili dummy ottenendo R 2 = 0.021333 (vedi figura pagina precedente). Da cui LM = 474 · 0.021333 = 10.111 che sotto l’ipotesi nulla γ1 = γ2 = 0 ha distribuzione χ2 (3 − 1). Il p-value è pari a 0.006. Quindi rifiutiamo l’ipotesi nulla. R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 22 / 63 Eteroschedasticità - Esempio 1 Test LR Dividendo il campione in tre gruppi in funzione del valore dalla variabile JOBCAT otteniamo per i tre sottocampioni: s12 = 0.1881902, s22 = 0.0714272 e 2 s32 = 0.2274762. Da cui otteniamo s1,ML = 0.1881902 · 363−4 363 = 0.0350, 2 2 2 27−3 s2,ML = 0.071427 27 = 0.0045 e s3,ML = 0.2274762 84−4 84 = 0.0493. Osserviamo 2 inoltre che s12 = 0.1953742 e quindi sML = 0.1953742 · 474−6 474 = 0.0377. La statistica test: LR = 474 log(0.0377) − 363 log(0.0350) − 27 log(0.0045) − 84 log(0.0493) = 61.2, sotto l’ipotesi nulla, ha distribuzione asintotica χ2 (3 − 1). Il p-value è pari a 0. Quindi l’ipotesi di omoschedasticità è rifiutata. R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 23 / 63 Eteroschedasticità - Esempio 1 White Il test di White senza cross-products e con cross-products porta a rifiutare l’ipotesi nulla di omoschedasticità con p-values pari a 0.041678 e 0.011285 rispettivamente (vedi figure seguenti). R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 24 / 63 Eteroschedasticità - Esempio 1 Dependent variable: uhat 2 Coefficient Std. Error t-ratio const 0.0169722 0.0534069 0.3178 EDUC 0.000632237 0.00835041 0.07571 GENDER -0.00104331 0.00704285 -0.1481 MINORITY -0.00674886 0.00750964 -0.8987 DUMJCAT2 -0.00991070 0.0145921 -0.6792 DUMJCAT3 0.00734671 0.0116268 0.6319 sqEDUC 7.09153e-05 0.000326738 0.2170 Unadjusted R-squared = 0.027609 Test statistic: TR 2 = = P(Chi − square(6) > 13.086833) = 0.041678 R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui p-value 0.7508 0.9397 0.8823 0.3693 0.4974 0.5278 0.8283 13.086833, with p-value Venice, December 5, 2012 25 / 63 Eteroschedasticità - Esempio 1 Dependent variable: uhat 2 Omitted due to exact collinearity: X 3 − X 5 Coefficient Std. Error t-ratio p-value const 0.131454 0.0718267 1.830 EDUC -0.0188857 0.0118901 -1.588 GENDER -0.0374905 0.0448115 -0.8366 MINORITY 0.0215931 0.0448275 0.4817 DUMJCAT2 -0.0627389 0.0746543 -0.8404 DUMJCAT3 0.273542 0.109895 2.489 sqEDUC 0.000884387 0.000491919 1.798 X2 − X3 0.00248857 0.00333562 0.7461 X2 − X4 -0.00253195 0.00348105 -0.7274 X2 − X5 0.00482944 0.00665341 0.7259 X2 − X6 -0.0183418 0.00695796 -2.636 X3 − X4 -0.00282086 0.0166238 -0.1697 X3 − X6 0.0215932 0.0262545 0.8225 X4 − X5 0.0224349 0.0298916 0.7505 X4 − X6 0.0812140 0.0370309 2.193 Unadjusted R-squared = 0.060660 Test statistic: TR 2 = P(Chi − square(14) > 28.752679) = 0.011285 R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui 0.0679 0.1129 0.4032 0.6303 0.4011 0.0132 0.0729 0.4560 0.4674 0.4683 0.0087 0.8653 0.4112 0.4533 0.0288 28.752679, with p-value = Venice, December 5, 2012 26 / 63 Eteroschedasticità - Esempio 2 Esempio 2 Sia yt il tasso di rendimento delle obbligazioni con rating AAA e sia xt il tasso di rendimento dei titoli di stato (Treasury Bill) a 3-mesi, rilevati mensilemente tra gennaio 1950 e dicembre 1999. Vogliamo stimare ∆yt = α + β∆xt + ut R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui (9) Venice, December 5, 2012 27 / 63 Eteroschedasticità - Esempio 2 Model 1: OLS, using observations 1948:02–1999:12 (T = 623) Dependent variable: DAAA const DUS3MT Coefficient Std. Error t-ratio p-value 0.00565089 0.274529 0.00672904 0.0143765 0.8398 19.0957 0.4014 0.0000 Mean dependent var Sum squared resid R2 F (1, 621) Log-likelihood Schwarz criterion ρ̂ R. Casarin (Università Ca’ Foscari) 0.007528 17.51432 0.369957 364.6465 228.5322 −444.1953 0.276686 S.D. dependent var S.E. of regression Adjusted R 2 P-value(F ) Akaike criterion Hannan–Quinn Durbin–Watson Econometria Applicata Analisi dei residui 0.211405 0.167939 0.368942 2.66e–64 −453.0644 −449.6177 1.446100 Venice, December 5, 2012 28 / 63 Eteroschedasticità - Esempio 2 Regression residuals (= observed - fitted DAAA) 1.2 1 0.8 residual 0.6 0.4 0.2 0 -0.2 -0.4 -0.6 -0.8 1950 1960 R. Casarin (Università Ca’ Foscari) 1970 1980 Econometria Applicata Analisi dei residui 1990 2000 Venice, December 5, 2012 29 / 63 Eteroschedasticità - Esempio 2 1.2 1 usq1 0.8 0.6 0.4 0.2 0 1950 1960 R. Casarin (Università Ca’ Foscari) 1970 1980 Econometria Applicata Analisi dei residui 1990 2000 Venice, December 5, 2012 30 / 63 Eteroschedasticità - Esempio 2 DUS3MT versus DAAA (with least squares fit), sub-sample: 1948:01-1974:12 1 Y = -0.00294 + 1.19X DUS3MT 0.5 0 -0.5 -1 -1.5 -0.4 -0.3 R. Casarin (Università Ca’ Foscari) -0.2 -0.1 0 DAAA 0.1 Econometria Applicata Analisi dei residui 0.2 0.3 Venice, December 5, 2012 31 / 63 Eteroschedasticità - Esempio 2 DUS3MT versus DAAA (with least squares fit), sub-sample 1975:01-1999:12 3 Y = -0.000394 + 1.37X 2 DUS3MT 1 0 -1 -2 -3 -4 -5 -1 R. Casarin (Università Ca’ Foscari) -0.5 0 DAAA 0.5 Econometria Applicata Analisi dei residui 1 Venice, December 5, 2012 32 / 63 Eteroschedasticità - Esempio 2 Vogliamo verificare l’ipotesi di omoschedasticità, utilizzando i seguenti modelli di eteroschedasticità i σt2 = σ 2 (∆xt )2 (White) ii σt2 = γ1 + γ2 ut2 (ARCH LM) iii σt2 = γ1 + γ2 ∆xt (Breusch-Pagan LM) iv σt2 = γ1 + γ2 Dt , (Dt = 1 se t > 1974 : 12) (Breusch-Pagan LM) R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 33 / 63 Eteroschedasticità - Esempio 2 White’s test for heteroskedasticity OLS, using observations 1948:02-1999:12 (T = 623) Dependent variable: uhat 2 Coefficient Std. Error t-ratio p-value const 0.0266391 0.00313198 8.506 1.36e-016 DUS3MT -7.22712e-05 0.00695667 -0.01039 0.9917 sqDUS3MT 0.00672943 0.00275691 2.441 0.0149 Unadjusted R-squared = 0.010725 Test statistic: TR 2 = 6.681598, with p-value = P(Chi − square(2) > 6.681598) = 0.035409 R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 34 / 63 Eteroschedasticità - Esempio 2 Test for ARCH of order 2 Coefficient Std. Error t-ratio alpha(0) 0.0171892 0.00325323 5.284 alpha(1) 0.166183 0.0391886 4.241 alpha(2) 0.225508 0.0391904 5.754 Null hypothesis: no ARCH effect is present Test statistic: LM = 58.742 with p-value = P(Chi − square(2) > 58.742) = R. Casarin (Università Ca’ Foscari) p-value 1.76e-07 2.57e-05 1.37e-08 1.75523e-013 Econometria Applicata Analisi dei residui Venice, December 5, 2012 35 / 63 Eteroschedasticità - Esempio 2 Breusch-Pagan test for heteroskedasticity OLS, using observations 1948:02-1999:12 (T = 623) Dependent variable: scaled uhat 2 Coefficient Std. Error t-ratio p-value const 1.00139 0.109639 9.134 9.25e-019 DUS3MT -0.203847 0.234242 -0.8702 0.3845 Explained sum of squares = 5.67032 Test statistic: LM = 2.835158, with p-value = P(Chi − square(1) > 2.835158) = 0.092222 R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 36 / 63 Eteroschedasticità - Esempio 2 Breusch-Pagan test for heteroskedasticity Model 2: OLS, using observations 1948:02–1999:12 (T = 623) Dependent variable: usq1a const du74 Coefficient Std. Error t-ratio p-value 0.00912376 0.0394340 0.00413967 0.00596553 2.2040 6.6103 0.0279 0.0000 Mean dependent var Sum squared resid R2 F (1, 621) Log-likelihood Schwarz criterion ρ̂ R. Casarin (Università Ca’ Foscari) 0.028113 3.437360 0.065739 43.69633 735.7523 −1458.636 0.159407 S.D. dependent var S.E. of regression Adjusted R 2 P-value(F ) Akaike criterion Hannan–Quinn Durbin–Watson Econometria Applicata Analisi dei residui 0.076910 0.074399 0.064234 8.27e–11 −1467.505 −1464.058 1.681000 Venice, December 5, 2012 37 / 63 Eteroschedasticità - Esempio 2 • Il test White, ARCH-LM e Breusch-Pagan (iii) portanto a rigettare l’ipotesi nulla di omoschedasticità (vedi p-value). Per il test di Breusch-Pagan (iv) osserviamo che LM = nR 2 = 623 · 0.065739 = 40.95539 che sotto l’ipotesi nulla si distribuisce come una χ2 (1). Il p-value è pari a 0. Quindi rigettiamo l’ipotesi nulla di omoschedasticità. • Confrontiamo ora gli effetti dei tre modelli di eteroschedasticità sui residui e vediamo come utilizzare uno dei modelli di eteroschedasticità per ottenere una stima 2SFWLS. R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 38 / 63 Eteroschedasticità - Esempio 2 Esempio: regimi di volatilità (variabile dummy) e stima 2SFWLS stima OLS ∆yt = α + β∆xt + ut generiamo la serie σt2 = ût2 (denominata usq1) costruiamo il modello di regressione ausiliario: σt2 = γ1 + γ2 Dt + εt , (Add>time trend e poi Add>define new variable> du80=time>380) determiniamo i fitted σ̂t2 e li salviamo con nome yhat8 Definiamo i pesi 1/σ̂t Add>define new variable> sigmainv=1/sqrt(yhat8) stima WLS con pesi 1/σ̂t Models>Other Linear Models>Weighted Least Squares... R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 39 / 63 Eteroschedasticità - Esempio 2 Model 8: OLS, using observations 1948:02–1999:12 (T = 623) Dependent variable: usq1 const du80 Coefficient Std. Error t-ratio p-value 0.00989738 0.0472844 0.00375262 0.00604607 2.6375 7.8207 0.0086 0.0000 Mean dependent var Sum squared resid R2 F (1, 621) Log-likelihood Schwarz criterion ρ̂ R. Casarin (Università Ca’ Foscari) 0.028113 3.349347 0.089660 61.16299 743.8321 −1474.795 0.138765 S.D. dependent var S.E. of regression Adjusted R 2 P-value(F ) Akaike criterion Hannan–Quinn Durbin–Watson Econometria Applicata Analisi dei residui 0.076910 0.073440 0.088194 2.26e–14 −1483.664 −1480.217 1.722141 Venice, December 5, 2012 40 / 63 Eteroschedasticità - Esempio 2 Actual and fitted usq1 1.2 fitted actual 1 usq1 0.8 0.6 0.4 0.2 0 1950 1960 R. Casarin (Università Ca’ Foscari) 1970 1980 Econometria Applicata Analisi dei residui 1990 2000 Venice, December 5, 2012 41 / 63 Eteroschedasticità - Esempio 2 Model 9: WLS, using observations 1948:02–1999:12 (T = 623) Dependent variable: DAAA Variable used as weight: sigmainv const DUS3MT Coefficient Std. Error t-ratio p-value 0.00931597 0.248917 0.00561751 0.0140703 1.6584 17.6910 0.0977 0.0000 Statistics based on the weighted data: Sum squared resid R2 F (1, 621) Log-likelihood Schwarz criterion ρ̂ 94.93639 0.335097 312.9709 −297.9615 608.7920 0.291173 S.E. of regression Adjusted R 2 P-value(F ) Akaike criterion Hannan–Quinn Durbin–Watson 0.390994 0.334026 5.10e–57 599.9229 603.3697 1.417149 Statistics based on the original data: Mean dependent var R. Casarin (Università Ca’ Foscari) 0.007528 S.D. dependent var Econometria Applicata Analisi dei residui 0.211405 Venice, December 5, 2012 42 / 63 Eteroschedasticità - Esempio 2 Confronto: WLS è più efficiente di OLS quando gli errori sono eteroschedastici. Si veda anche il p-value dell’intercetta. WLS const DUS3MT Coefficient Std. Error t-ratio p-value 0.00931597 0.248917 0.00561751 0.0140703 1.6584 17.6910 0.0977 0.0000 OLS const DUS3MT R. Casarin (Università Ca’ Foscari) Coefficient Std. Error t-ratio p-value 0.00565089 0.274529 0.00672904 0.0143765 0.8398 19.0957 0.4014 0.0000 Econometria Applicata Analisi dei residui Venice, December 5, 2012 43 / 63 Autocorrelazione Autocorrelazione R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 44 / 63 Autocorrelazione • Una delle assunzioni del modello di regressione è che i termini di errore siano indipendenti. E’quindi necessario verificare che i residui di una regressione siano indipendenti attraverso dei test (Durbin-Watson, Bresusch-Godfrey, Box-Pierce e Ljiung-Box). • In particolare diremo che i termini di disturbo del modello di regressione yt = x′t β + ut (10) sono serialmente correlati se esistono s 6= t tali che E(ut , us ) 6= 0. In questo caso la matrice di varianza covarianze di u non è diagonale. Questo significa che yt ed ys oltre ai regressori hanno in comune altri elementi e che il modello di regressione dato sopra con le ipotesi OLS viste a lezione non è soddisfacente. R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 45 / 63 Autocorrelazione • Potrebbe trattarsi di problemi di omissione di variabili, non corretta specificazione della forma funzionale, mancata inclusione di variabili dipendenti (o indipedenti) ritardate. • Primi a di presentare questi test vediamo se è possibile intuire anche graficamente la presenza di correlazione seriale (autocorrelazione) e che in alcuni casi è possibile dare un interpretazione economica. R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 46 / 63 Autocorrelazione Tassi di Interesse • Consideriamo il dataset xm722ibr.wk1 relativo a tassi su obbligazioni con rating AAA yt e dei tassi su obbligazioni pubbliche (Treasury Bill a 3 mesi), xt . Consideriamo le differenze prime di tali variabili: ∆xt e ∆yt . • dal modello di regressione ∆yt = α + β∆xt + ut otteniamo i residui ût . Il coefficiente di correlazione tra ût e ût−1 è pari a 0.276543. Dal diagramma di dispersione si può osservare la presenza di una relazione lineare tra le due variabili. • E’ ragionevole pensare che a seguito di una deviazione da una relazione di equilibrio tra yt e xt l’aggiustamento di yt non sia immediato, ma sia progressivo nel tempo. Per questo motivo una relazione statica tra ∆yt e ∆xt può non essere adeguata con conseguente evidenza di correlazione seriale nei residui. R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 47 / 63 Autocorrelazione uhat versus uhat1 (with least squares fit) 1.2 Y = 9.65e-005 + 0.277X 1 0.8 0.6 uhat 0.4 0.2 0 -0.2 -0.4 -0.6 -0.8 -0.6 -0.4 R. Casarin (Università Ca’ Foscari) -0.2 0 0.2 uhat1 0.4 Econometria Applicata Analisi dei residui 0.6 0.8 1 Venice, December 5, 2012 48 / 63 Autocorrelazione Coefficienti di autocorrelazione Test sulla correlazione seriale richiedono che le osservazioni possano essere naturalmente ordinate. Per series storiche l’ordine è dato dall’indice temporale. Nei dati cross-section le osservazioni possono essere ordinate in base ad una delle variabili esplicative. L’indice di correlazione è PT ût ût−1 r = qP t=2 P T −1 2 T 2 t=1 ût t=2 ût (11) di cui si utilizza una versione asintoticamente equivalente r1 = PT t=2 PT ût ût−1 t=1 (12) ût2 Elevati valordi di r1 possono indicare errata specificazioine nella dinamica per dati di tipo timeseries oppure errata forma funzionale per dati cross-section. R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 49 / 63 Autocorrelazione Si può costruire l’autocorrelogramma valutando per ogni ritardo k con k = . . . , K il seguente coefficente di correlazione di ordine k rk = PT t=k+1 ût ût−k PT 2 t=1 ût (13) Il grafico generato da (k, rk ) può dare un’idea della presenza di autocorrelazione R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 50 / 63 Autocorrelazione Test Durbin-Watson Il test DW è basato sulla seguente idea. Siano σ 2 e ̺ la varianza dei termini di disturbo ed la correlazione tra ut e ut−1 allora E(ut − ut−1 )2 = 2σ 2 (1 − ̺). Cosı̀ se i due termini di errore consecutivi sono correlati la differenza (ut − ut−1 tenderà ad essere piccola. La statistica DW è definita come segue T P (ut − ut−1 )2 t=2 (14) d= T P ut2 t=1 La statistica soddisfa: 0 ≤ d ≤ 4 e d ≈ 2(1 − r1 ). Valori di d vicini allo zero indicano autocorrelazione positiva mentre valori prossimi a 4 indicano autocorrelazione negativa. I valori critici della statistica test dipendono dalla matrice X di regressori. Le bande di confidenza esistono per regressori deterministici e termini di errore gaussiani. DW è utilizzata in modo informale come strumento di diagnosi per indicare la presenza di autocorrelazione R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 51 / 63 Autocorrelazione Test Breusch-Godfrey LM Il modello di riferimento è yt = x′t β + ut (15) ut = γ1 ut−1 + . . . + γp ut−p + ηt (16) con ηt iid e gaussiano con varianza ση2 per ogni t. Considerando il caso AR(1), cioè p = 1 segue che yt = γ1 yt−1 + x′t β − γx′t−1 β + ηt (17) in cui si vuole valutare l’ipotesi che γ1 = 0. Si può dimostrare che il test è equivalente alla seguente procedura a due passi in cui si utilizza un modello di regressione ausiliario. R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 52 / 63 Autocorrelazione stima OLS y = X β + u generiamo i residui û = y − X β̂ regressione ausiliaria (stima OLS): ût = x′t δ + γ1 ût−1 + . . . + γp ût−p + ωt determinare LM = TR 2 che è distribuita asintoticamente come χ2 (p) sotto l’ipotesi nulla di assenza di correlazione seriale H0 = γ1 = . . . = γp = 0 R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 53 / 63 Autocorrelazione Tests Box-Pierce e Ljiung-Box Le statistiche test sono BP = T LB = T p X k=1 p X k=1 rk2 (18) T +2 2 r T −k k (19) Sotto l’ipotesi nulla di assenza di autocorrelazione la statistica BP ha distribuzione asintotica χ2 (p) mentre la statistica LB (detta anche Q-test) ha distribuzione asintotica χ2 (p) (sotto l’ipotesi aggiuntiva che i regressori siano deterministici, nel caso siano stocastici è consigliabile utilizzare il test Breusch-Godfrey). R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 54 / 63 Autocorrelazione Rimedi Possibili • Per dati cross-section è necessario variare le forma funzionale. • Per dati timeseries è necessario considerare le proprietà dinamiche dei dati. Per esempio considerando yt = β1 + β2 xt + ut (20) la correlazione tra ut = yt − β1 − β2 xt e ut−1 = yt−1 − β1 − β2 xt−1 può essere dovuta al legame tra yt e xt−1 e yt−1 che può essere considerata con il modello yt = γ1 + γ2 xt + γ3 xt−1 + γ4 yt−1 + ηt (21) con ηt iid. (Si veda nota su modelli ADL). R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 55 / 63 Autocorrelazione Rimedi Possibili • Modello di regressione con errori AR(1). ut = γut−1 + ηt (22) ut = yt − β1 − β2 xt (23) da cui segue yt = β1 (1 − γ) + β2 xt − β2 γxt−1 + γyt−1 + ηt (24) yt = γ1 + γ2 xt + γ3 xt−1 + γ4 yt−1 + ηt (25) che corrisponde a con γ1 = β1 (1 − γ), γ2 = β2 , γ3 = −β2 γ e γ4 = γ e con il vincolo γ2 γ4 + γ3 = 0 R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui (26) Venice, December 5, 2012 56 / 63 Autocorrelazione Rimedi Possibili • Se i termini di errore ηt sono distribuiti normalmente è possibile stimare i parametri γ e β1 e β2 utilizzando NLS (nonlinear least square) altrimenti si può utilizzare una procedura a due passi (procedura di Cochrane-Orcutt). Si osserva che: yt − γyt−1 = β1 (1 − γ) + β2 (xt − γxt−1 ) + ηt (27) da cui: Consideriamo γ = 0 e stimiamo con OLS β1 e β2 : yt = β1 + β2 xt + ut . Lo stimatore sarà consistente (se −1 < γ < 1) ma non efficiente. Regrediamo ût su ût−1 ottenendo γ̂ e yt − γ̂yt−1 su xt − γ̂xt−1 ottenendo dei nuovi residui η̃t . Una nuova stima di γ può essere ottenuta utilizzando i nuovi residui. R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 57 / 63 Autocorrelazione Esempio Consideriamo l’esempio sui tassi di interesse • La statistica DW = 1.446 quindi r1 ≈ 0.277 • Il coefficiente di autocorrelazione del primo ordine è significativo (Q-test) • Il test Breusch-Godfrey con p = 1 e p = 2 ritardi indica la presenza di autocorrelazione R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 58 / 63 Autocorrelazione OLS, using observations 1948:02–1999:12 (T = 623) Dependent variable: DAAA const DUS3MT Coefficient Std. Error t-ratio p-value 0.00565089 0.274529 0.00672904 0.0143765 0.8398 19.0957 0.4014 0.0000 Mean dependent var Sum squared resid R2 F (1, 621) Log-likelihood Schwarz criterion ρ̂ R. Casarin (Università Ca’ Foscari) 0.007528 17.51432 0.369957 364.6465 228.5322 −444.1953 0.276686 S.D. dependent var S.E. of regression Adjusted R 2 P-value(F ) Akaike criterion Hannan–Quinn Durbin–Watson Econometria Applicata Analisi dei residui 0.211405 0.167939 0.368942 2.66e–64 −453.0644 −449.6177 1.446100 Venice, December 5, 2012 59 / 63 Autocorrelazione Residual ACF 0.3 0.2 0.1 0 -0.1 -0.2 -0.3 +- 1.96/T0.5 0 2 4 6 8 10 12 lag Residual PACF 0.3 0.2 0.1 0 -0.1 -0.2 -0.3 0 +- 1.96/T .5 0 2 4 6 8 10 12 lag R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 60 / 63 Autocorrelazione Residual autocorrelation function LAG ACF PACF Q-stat 1 2 3 4 5 6 7 8 9 10 11 12 0.2764 -0.0754 0.0086 0.0337 0.0546 0.1012 0.0354 0.0499 0.0449 0.0079 0.0329 -0.0611 0.2764 -0.1643 0.0871 -0.0087 0.0606 0.0785 -0.0110 0.0705 0.0034 0.0011 0.0317 -0.1074 R. Casarin (Università Ca’ Foscari) 47.8159 51.3775 51.4240 52.1380 54.0139 60.4804 61.2716 62.8484 64.1241 64.1639 64.8526 67.2286 [p-value] [0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [0.000] [0.000] Econometria Applicata Analisi dei residui Venice, December 5, 2012 61 / 63 Autocorrelazione Breusch-Godfrey test for autocorrelation up to order 12 OLS, using observations 1948:02-1999:12 (T = 623) Dependent variable: uhat Coefficient Std. Error t-ratio p-value const 0.000292938 0.00630670 0.04645 0.9630 DUS3MT -0.0279546 0.0143213 -1.952 0.0514 uhat1 0.358428 0.0414183 8.654 4.44e-017 uhat2 -0.214417 0.0428149 -5.008 7.21e-07 uhat3 0.0900817 0.0435623 2.068 0.0391 uhat4 -0.00895890 0.0438469 -0.2043 0.8382 uhat5 0.0232144 0.0438376 0.5296 0.5966 Unadjusted R-squared = 0.138853, Test statistic: LMF = 8.182996, with p-value = P(F (12, 609) > 8.183) = 2.24e-014 Alternative statistic: TR 2 = 86.505134, with p-value = P(Chi − square(12) > 86.5051) = 2.34e-013 Ljung-Box Q’ = 67.2286, with p-value = P(Chi − square(12) > 67.2286) = 1.05e-009 R. Casarin (Università Ca’ Foscari) Econometria Applicata Analisi dei residui Venice, December 5, 2012 62 / 63 Autocorrelazione Cochrane–Orcutt, using observations 1948:03–1999:12 (T = 622) Dependent variable: DAAA ρ = 0.289012 ρ̂ = 0.289012 const DUS3MT Coefficient Std. Error t-ratio p-value 0.00594436 0.252253 0.00909245 0.0143429 0.6538 17.5873 0.5135 0.0000 Statistics based on the Mean dependent var 0.007556 Sum squared resid 16.11453 R2 0.420317 F (1, 620) 309.3128 ρ̂ 0.050437 R. Casarin (Università Ca’ Foscari) rho-differenced data: S.D. dependent var S.E. of regression Adjusted R 2 P-value(F ) Durbin–Watson Econometria Applicata Analisi dei residui 0.211574 0.161218 0.419382 1.80e–56 1.896534 Venice, December 5, 2012 63 / 63