Comments
Description
Transcript
Guida ai comandi di gretl
Guida ai comandi di gretl Gnu Regression, Econometrics and Time-series Library Allin Cottrell Department of Economics Wake Forest university Riccardo “Jack” Lucchetti Dipartimento di Economia Università Politecnica delle Marche Cristian Rigamonti (traduzione italiana) Febbraio 2008 ATTENZIONE: questa traduzione è aggiornata alla versione 1.7.1 di gretl. Per versioni successive del programma si rimanda alla documentazione in inglese. È garantito il permesso di copiare, distribuire e/o modificare questo documento seguendo i termini della Licenza per Documentazione Libera GNU, Versione 1.1 o ogni versione successiva pubblicata dalla Free Software Foundation (si veda http://www.gnu.org/licenses/fdl. html). Indice 1 Guida ai comandi 1 1.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Comandi in ordine alfabetico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 add . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 adf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 append . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 ar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 ar1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 arbond . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 arch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 arima . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 boxplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 break . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 chow . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 coeffsum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 coint . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 coint2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 corr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 corrgm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 criteria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 cusum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 dataset . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 delete . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 diff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 difftest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 discrete . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 dummify . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 elif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 else . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 end . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 endif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 endloop . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 eqnprint . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 equation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 estimate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 i Indice ii fcast . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 foreign . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 freq . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 garch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 genr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 gmm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 gnuplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 graph . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 hausman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 heckit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 help . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 hsk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 hurst . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 if . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 include . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 info . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 intreg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 kpss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 labels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 lad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 lags . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 ldiff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 leverage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 lmtest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 logistic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 logit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 logs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 loop . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 mahal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 meantest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 mle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 modeltab . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 modprint . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 mpols . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 nls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 normtest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 nulldata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 ols . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 omit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 open . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 Indice iii orthdev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 outfile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 panel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 pca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 pergm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 print . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 printf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 probit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 pvalue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 qlrtest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 quantreg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 quit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 rename . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 reset . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 restrict . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 rmplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 run . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 runs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 scatters . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 sdiff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 set . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 setinfo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 setobs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 setmiss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 shell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 smpl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 spearman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 sprintf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 square . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 sscanf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 store . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 summary . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 system . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 tabprint . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 testuhat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 tobit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 tsls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 var . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 varlist . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 Indice iv vartest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 vecm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 vif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 wls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 xcorrgm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 xtab . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 1.3 Comandi raggruppati per argomento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 Stima . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 Trasformazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 Statistiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 Dataset . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 Grafici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 Stampa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 Previsione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 Programmazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 Utilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 2 Guida alle funzioni di gretl 62 2.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 2.2 Accessori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 $ahat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 $aic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 $bic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 $coeff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 $compan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 $df . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 $ess . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 $gmmcrit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 $h . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 $hausman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 $hqc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 $jalpha . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 $jbeta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 $jvbeta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 $lnl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 $ncoeff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 $nobs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 $nvars . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 $pd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 $pvalue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 $rho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 Indice v $rsq . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 $sargan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 $sigma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 $stderr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 $stopwatch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 $T . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 $t1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 $t2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 $test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 $trsq . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 $uhat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 $vcv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 $yhat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 2.3 Functions proper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 abs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 atan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 BFGSmax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 bkfilt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 cdemean . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 cdf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 cdiv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 ceil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 cholesky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 cmult . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 cnorm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 cols . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 corr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 cos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 cov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 critical . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 cum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 det . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 diag . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 diff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 dnorm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 dsort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 eigengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 eigensym . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 exp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 fdjac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 fft . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 Indice vi ffti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 firstobs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 floor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 fracdiff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 gammafun . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 genpois . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 gini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 ginv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 hpfilt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 imaxc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 imaxr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 iminc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 iminr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 infnorm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 int . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 inv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 invcdf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 invpd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 islist . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 isnull . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 isseries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 isstring . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 lags . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 lastobs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 ldet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 ldiff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 log . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 lngamma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 log10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 log2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 lower . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 lrvar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 makemask . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 max . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 maxc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 maxr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 mcorr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 mcov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 mean . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 meanc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 Indice vii meanr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 median . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 mexp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 min . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 minc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 minr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 missing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 misszero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 mlag . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 mnormal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 mols . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 movavg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 mread . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 mshape . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 muniform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 mwrite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 mxtab . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 nelem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 nobs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 nullspace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 obs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 obsnum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 ok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 onenorm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 ones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 orthdev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 pmean . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 princomp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 psd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 pvalue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 qform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 qnorm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 qrdecomp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 quantile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 rank . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 ranking . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 randgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 rcond . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 resample . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 round . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 Indice viii rows . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 sd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 sdiff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 selifc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 selifr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 seq . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 sin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 sort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 sortby . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 sqrt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 sst . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 sum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 sumc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 sumr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 svd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 tan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 tr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 transp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 uniform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 unvech . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 upper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 values . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 var . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 vec . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 vech . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 zeromiss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 zeros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 3 Opzioni, argomenti e percorsi 91 3.1 Avvio di gretl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 3.2 Menù preferenze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 3.3 Avvio di gretlcli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 3.4 Ricerca dei percorsi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 MS Windows . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 4 Parole riservate 95 Capitolo 1 Guida ai comandi 1.1 Introduzione I comandi descritti in questa guida possono essere eseguiti nella versione a riga di comando del programma, ma anche in quella con con interfaccia grafica (GUI), inserendoli in un file “script” da eseguire o nel “terminale di gretl”. La guida utilizza le seguenti convenzioni: • Il carattere a larghezza fissa viene usato per indicare ciò che l’utente deve scrivere e per i nomi delle variabili. • I termini in corsivo sono dei segnaposto da sostituire con termini specifici, ad esempio si potrebbe scrivere reddito invece del generico variabile-x. • Il costrutto [ arg ] indica che l’argomento arg è opzionale: è possibile fornirlo oppure no (in ogni caso, le parentesi quadre non vanno scritte). • La frase “comando di stima” indica un comando che genera stime per un certo modello, ad esempio ols, ar o wls. 1.2 Comandi in ordine alfabetico add Argomento: lista-variabili Opzioni: --vcv (mostra la matrice di covarianza) --quiet (non mostra le stime del modello aumentato) --silent (non mostra nulla) --inst (aggiunge come strumento, solo per TSLS) --both (aggiunge come regressore e come strumento, solo per TSLS) Esempi: add 5 7 9 add xx yy zz --quiet Va invocato dopo un comando di stima. Aggiunge al modello precedente le variabili nella lista-variabili e stima il nuovo modello. Viene eseguito anche un test per la significatività congiunta delle variabili aggiunte: nel caso di stime OLS, la statistica test è la F , negli altri casi è il chi-quadro asintotico di Wald. Un p-value inferiore a 0.05 indica che i coefficienti sono congiuntamente significativi al livello del 5 per cento. Se viene usata l’opzione --quiet viene mostrato solo il risultato del test per la significatività congiunta delle variabili aggiunte, altrimenti vengono mostrate anche le stime per il modello aumentato. Nell’ultimo caso, l’opzione --vcv mostra anche la matrice di covarianza dei coefficienti. Usando l’opzione --silent, non viene mostrato nulla; tuttavia i risultati del test possono essere recuperati usando le variabili speciali $test e $pvalue. Se il modello originale è stato stimato con i minimi quadrati a due stadi, può sorgere un’ambiguità: le nuove variabili vanno aggiunte come regressori, come strumenti o con entrambe le funzioni? Per risolvere l’ambiguità, nella modalità predefinita le variabili sono aggiunte come regressori endogeni, se si usa l’opzione --inst sono aggiunte come strumenti, mentre se si usa l’opzione --both sono aggiunte come regressori esogeni. Accesso dal menù: Finestra del modello, /Test/ADD - Aggiungi variabili 1 Capitolo 1. Guida ai comandi 2 adf Argomenti: ordine lista-variabili Opzioni: --nc (test senza costante) --c (solo con la costante) --ct (con costante e trend) --ctt (con costante, trend e trend al quadrato) --seasonals (include variabili dummy stagionali) --gls (rimuove la media o il trend usando GLS) --verbose (mostra i risultati della regressione) --quiet (non mostra i risultati) --difference (usa la differenza prima della variabile) --test-down (ordine di ritardo automatico) Esempi: adf 0 y adf 2 y --nc --c --ct adf 12 y --c --test-down Vedi anche jgm-1996.inp Calcola una serie di test Dickey–Fuller sulle variabili specificate, assumendo come ipotesi nulla che le variabili abbiano una radice unitaria. Se si usa l’opzione --difference, i test vengono condotti sulla differenza prima delle variabili e la discussione che segue va riferita a questa trasformazione delle variabili. Per impostazione predefinita, vengono mostrate due varianti del test: una basata su una regressione che contiene solo una costante, e una che include la costante e un trend lineare. È possibile controllare le varianti specificando una o più opzioni. In tutti i casi, la variabile dipendente è la differenza prima della variabile specificata, y, e la variabile dipendente più importante è il ritardo (di ordine uno) di y. Il modello è costruito in modo che il coefficiente della variabile ritardata y è pari a 1 meno la radice. Ad esempio, il modello con una costante può essere scritto come (1 − L)yt = β0 + (α − 1)yt−1 + t Se l’ordine di ritardi, k, è maggiore di 0, ai regressori di ognuna delle regressioni calcolate per il test saranno aggiunti k ritardi della variabile dipendente, con la precisazione che segue. Se si usa l’opzione --test-down, k viene interpretato come ritardo massimo, mentre l’ordine di ritardo effettivamente usato viene ottenuto testando all’indietro con il seguente algoritmo: 1. Stima la regressione Dickey–Fuller con k ritardi della variabile dipendente. 2. Se questo ordine di ritardi è significativo, esegue il test con l’ordine di ritardo k. Altrimenti, prova il test con k = k − 1; se k = 0, esegue il test con ordine di ritardo 0, altrimenti va al punto 1. Durante il punto 2 spiegato sopra, “significativo” significa che la statistica t per l’ultimo ritardo abbia un p-value asintotico a due code per la distribuzione normale pari a 0.10 o inferiore. L’opzione --gls può essere usata insieme a una delle altre due opzioni --c e --ct (il modello con costante o quello con costante e trend). L’effetto di questa opzione è di rimuovere la media o il trend della variabile da testare, usando la procedura GLS suggerita da Elliott, Rothenberg e Stock (1996), che fornisce un test di potenza maggiore rispetto a quell’approccio standard di Dickey–Fuller approach. Questa opzione non è compatibile con le opzioni --nc, --ctt o --seasonals. I p-value per questo test sono basati su MacKinnon (1996). Il codice rilevante è incluso per gentile concessione dell’autore. Nel caso del test con trend lineare usando la procedura GLS questi P-value non sono utilizzabili; vengono usati i valori critici contenuti nella Tabella 1 di Elliott, Rothenberg e Stock (1996). Accesso dal menù: /Variabile/Test Dickey-Fuller aumentato Capitolo 1. Guida ai comandi 3 append Argomento: file-dati Opzione: --time-series (si veda oltre) Apre un file di dati e aggiunge il suo contenuto al dataset attuale, se i nuovi dati sono compatibili. Il programma cerca di riconoscere il formato del file di dati (interno, testo semplice, CSV, Gnumeric, Excel, ecc.). I dati aggiunti possono avere la forma di osservazioni aggiuntive su variabili già presenti nel dataset, o di nuove variabili. In quest’ultimo caso occorre che il numero delle nuove osservazioni sia pari a quello delle osservazioni presenti nel dataset, oppure che i nuovi dati includano informazioni precise sulle osservazioni in modo che gretl possa capire come aggiungere i valori. Nel caso di aggiunta di dati a un dataset panel, c’è una possibilità speciale. Detti n il numero di unità cross-section, T il numero di periodi temporali, e m il numero di nuove osservazioni da aggiungere. Se m = n i nuovi dati saranno considerati invarianti nel tempo, e saranno copiati per ognuno dei periodi temporali. D’altra parte, se m = T i dati saranno trattati come invarianti tra le unità. Se il panel è “quadrato”, ed m è pari sia ad n che a T , il comportamento predefinito consiste nel trattare i nuovi casi come invarianti nel tempo, ma è possibile forzare l’interpretazione dei nuovi dati come serie storiche usando l’opzione --time-series (che verrà ignorata in tutti gli altri casi). Accesso dal menù: /File/Aggiungi dati ar Argomenti: ritardi ; variabile-dipendente variabili-indipendenti Opzione: --vcv (mostra la matrice di covarianza) Esempio: ar 1 3 4 ; y 0 x1 x2 x3 Calcola le stime parametriche usando la procedura iterativa generalizzata di Cochrane–Orcutt (si veda il Capitolo 9.5 di Ramanathan, 2002). La procedura termina quando le somme dei quadrati degli errori consecutivi non differiscono per più dello 0.005 per cento, oppure dopo 20 iterazioni. ritardi è una lista di ritardi nei residui, conclusa da un punto e virgola. Nell’esempio precedente, il termine di errore è specificato come ut = ρ1 ut−1 + ρ3 ut−3 + ρ4 ut−4 + et Accesso dal menù: /Modello/Serie storiche/AR - Stima autoregressiva ar1 Argomenti: depvar indepvars Opzioni: --hilu (usa la procedura di Hildreth–Lu) --pwe (usa lo stimatore di Prais–Winsten) --vcv (mostra la matrice di covarianza) --no-corc (non affinare i risultati con Cochrane-Orcutt) Esempi: ar1 1 0 2 4 6 7 ar1 y 0 xlist --hilu --no-corc ar1 y 0 xlist --pwe Calcola stime feasible GLS per un modello in cui il termine di errore segue un processo autoregressivo del prim’ordine. Il metodo predefinito è la procedura iterativa di Cochrane–Orcutt (si veda ad esempio il capitolo 9.4 di Ramanathan, 2002). La procedura termina quando le stime successive del coefficiente di autocorrelazione non differiscono per più di 0.001, oppure dopo 20 iterazioni. Capitolo 1. Guida ai comandi 4 Se si usa l’opzione --hilu, verrà usata la procedura di ricerca di Hildreth–Lu. I risultati sono quindi ottimizzati con la procedura iterativa di Cochrane–Orcutt, a meno che non si usi l’opzione --no-corc (che viene ignorata se non viene specificata --hilu). Se si usa l’opzione --pwe, viene usato lo stimatore di Prais–Winsten, che prevede una procedura simile a quella di Cochrane–Orcutt; la differenza è che mentre Cochrane–Orcutt tralascia la prima osservazione, Prais–Winsten ne fa uso. Per i dettagli, si veda per esempio il capitolo 13 di Econometric Analysis (2000) di Greene. Accesso dal menù: /Modello/Serie storiche/Cochrane-Orcutt Accesso dal menù: /Modello/Serie storiche/Hildreth-Lu Accesso dal menù: /Modello/Serie storiche/Prais-Winsten arbond Argomento: p [ q ] ; variabile-dipendente variabili-indipendenti [ ; strumenti ] Opzioni: --quiet (non stampa il modello stimato) --vcv (mostra matrice di covarianza) --two-step (usa stima GMM 2-step) --time-dummies (aggiunge variabili dummy temporali) --asymptotic (calcola gli errori standard asintotici nel modo consueto) Esempi: arbond 2 ; y Dx1 Dx2 arbond 2 5 ; y Dx1 Dx2 ; Dx1 arbond 1 ; y Dx1 Dx2 ; Dx1 GMM(x2,2,3) Vedi anche arbond91.inp Esegue la stima di modelli panel dinamici (ossia, modelli panel che includono uno o più ritardi della variabile dipendente) usando il metodo GMM proposto da Arellano e Bond (1991). Il parametro p rappresenta l’ordine dell’autoregressione per la variabile dipendente. Il parametro opzionale q indica il massimo ritardo del livello della variabile dipendente da usare come strumento; se si omette questo argomento, o lo si pone uguale a 0, vengono usati tutti i ritardi disponibili. La variabile dipendente andrebbe specificata sotto forma di livello; viene differenziata automaticamente, visto che lo stimatore usa la differenziazione per eliminare gli effetti individuali. Le variabili indipendenti invece non vengono differenziate automaticamente: se si intende usare le differenze (tipicamente lo si vorrà fare per le variabili quantitative, ma non ad esempio per le dummy temporali), occorrerà prima creare le variabili differenziate e poi specificarle come regressori. L’ultimo campo (opzionale) del comando consente di specificare gli strumenti. Se non viene usato, si assumerà che tutte le variabili indipendenti sono strettamente esogene. Se si specifica uno strumento, occorre includere nell’elenco tutte le variabili indipendenti strettamente esogene. Per i regressori predeterminati, è possibile usare la funzione GMM per includere un intervallo specifico di ritardi in stile diagonale. Questo modo di procedere è illustrato nel terzo esempio visto sopra. Il primo argomento di GMM è il nome della variabile in questione, il secondo è il ritardo minimo da usare, mentre il terzo è quello massimo. Se il terzo argomento è pari a 0, vengono usati tutti i ritardi disponibili. Per impostazione predefinita, vengono mostrati i risultati della stima a un passo (con errori standard robusti), ma è possibile scegliere una stima a due passi. In entrambi i casi, vengono mostrati i testi per l’autocorrelazione di ordine 1 e 2, oltre al test di sovraidentificazione di Sargan. Si noti che in questo modello differenziato l’autocorrelazione del prim’ordine non contrasta con la validità del modello, mentre quella di ordine 2 viola le ipotesi statistiche che ne sono alla base. Nel caso della stima in due passi, gli errori standard sono calcolati usando la correzione per campioni finiti suggerita da Windmeijer (2005). Gli errori standard asintotici calcolati nel modo consueto non sono generalmente ritenuti affidabili nel caso dello stimatore a due passi, ma se Capitolo 1. Guida ai comandi 5 per qualche motivo si vuole usarli, è possibile usare l’opzione --asymptotic per disabilitare la correzione di Windmeijer. Se si usa l’opzione --time-dummies, viene aggiunto ai regressori un insieme di variabili dummy temporali. Il numero di variabili dummy è pari al numero massimo dei periodi usati nella stima meno uno, per evitare la perfetta collinearità in presenza della costante. Le dummy sono specificate in livelli; se si intende usare variabili dummy sotto forma di differenze temporali, occorre definirle ed aggiungerle manualmente. Accesso dal menù: /Model/Panel arch Argomenti: ordine variabile-dipendente variabili-indipendenti Esempio: arch 4 y 0 x1 x2 x3 Stima il modello specificato tenendo conto della possibile eteroschedasticità condizionale autoregressiva (ARCH, Autoregressive Conditional Heteroskedasticity). Per prima cosa il modello viene stimato con OLS, quindi viene eseguita una regressione ausiliaria, in cui i quadrati dei residui della prima regressione vengono regrediti sui loro valori ritardati. Il passo finale è una stima con minimi quadrati ponderati, in cui i pesi sono i reciproci delle varianze dell’errore della regressione ausiliaria (se la varianza prevista di qualche osservazione nella regressione ausiliaria non risulta positiva, viene usato il corrispondente residuo al quadrato). I valori alpha mostrati sotto i coefficienti sono i parametri del processo ARCH stimati nella regressione ausiliaria. Si veda anche garch e lmtest (l’opzione --arch). Accesso dal menù: /Modello/Serie storiche/ARCH arima Argomenti: p d q [ ; P D Q ] ; variabile-dipendente [ variabili-indipendenti ] Opzioni: --verbose (mostra i dettagli delle iterazioni) --vcv (mostra la matrice di covarianza) --opg (si veda sotto) --nc (non include l’intercetta) --conditional (usa la massima verosimiglianza condizionale) --x-12-arima (usa X-12-ARIMA per la stima) Esempi: arima 1 0 2 ; y arima 2 0 2 ; y 0 x1 x2 --verbose arima 0 1 1 ; 0 1 1 ; y --nc Se non viene fornita una lista di variabili-indipendenti, stima un modello autoregressivo integrato a media mobile (ARIMA: Autoregressive, Integrated, Moving Average) univariato. I valori p, d e q rappresentano rispettivamente gli ordini dei termini autoregressivi (AR), l’ordine di differenziazione, e quello dei termini a media mobile (MA). Questi valori possono essere indicati in forma numerica o con i nomi di variabili scalari preesistenti. Ad esempio, un valore d pari a 1 significa che prima di stimare i parametri ARMA occorre prendere la differenza della variabile dipendente. Se si vuole includere solo alcuni specifici ritardi AR o MA (invece che tutti i ritardi fino all’ordine specificato) è possibile sostituire p e/o q in due modi: col nome di una matrice predefinita che contiene un insieme di valori interi, oppure con un’espressione come {1 4}, osia un insieme di ritardi separati da spazi e racchiusi tra parentesi graffe. I valori interi opzionali P, D e Q rappresentano rispettivamente, l’ordine dei termini AR stagionali, l’ordine di differenziazione stagionale e l’ordine dei termini MA stagionali. Essi sono rilevanti solo la frequenza dei dati è superiore a 1 (ad esempio, dati trimestrali o mensili). Questi valori devono essere indicati in forma numerica o come variabili scalari. Capitolo 1. Guida ai comandi 6 Nel caso univariato la scelta predefinita include un’intercetta nel modello, ma questa può essere soppressa con l’opzione --nc. Se vengono aggiunte delle variabili-indipendenti, il modello diventa un ARMAX: in questo caso occorre indicare esplicitamente la costante se si desidera un’intercetta (come nel secondo degli esempi proposti). È disponibile una sintassi alternativa per questo comando: se non si intende applicare alcuna operazione di differenziazione (stagionale o non stagionale), è possibile omettere totalmente i termini d e D, invece che impostarli esplicitamente pari a 0. Inoltre, arma è un sinonimo di arima, quindi ad esempio il comando seguente è un modo valido per specificare un modello ARMA(2,1): arma 2 1 ; y Il funzionamento predefinito utilizza la funzionalità ARMA “interna” di gretl, che usa la stima di massima verosimiglianza esatta usando il filtro di Kalman; come opzione è possibile usare la stima di massima verosimiglianza condizionale. Se è stato installato il programma X-12-ARIMA è possibile usare questo al posto del codice interno di gretl. Per i dettagli su queste opzioni si veda la Guida all’uso di gretl. L’algoritmo interno di gretl per ARMA utilizza una procedura di massima verosimiglianza condizionale, implementata attraverso la stima iterata con minimi quadrati della regressione del prodotto esterno del gradiente (OPG). Si veda la Guida all’uso di gretl per la logica della procedura. I coefficienti AR (e quelli per gli eventuali regressori aggiuntivi) sono inizializzati usando una auto-regressione OLS, mentre i coefficienti MA sono inizializzati a zero. Quando si usa il codice ARMA interno, le deviazioni standard sono stimate basandosi su un’approssimazione numerica all’inversa negativa dell’Hessiana. Se si usa l’opzione --opg viene invece usato il prodotto esterno del gradiente. L’opzione è ignorata se si sceglie la stima con X-12-ARIMA. Il valore AIC mostrato nei modelli ARIMA è calcolato secondo la definizione usata in X-12ARIMA, ossia AIC = −2` + 2k dove ` è la log-verosimiglianza e k è il numero totale di parametri stimati. Si noti che X-12ARIMA non produce criteri di informazione come l’AIC quando la stima è effettuata col metodo della massima verosimiglianza condizionale. Il valore di “frequenza” mostrato insieme alle radici AR e MA è il valore di λ che risolve z = r ei2π λ dove z è la radice in questione e r è il suo modulo. Accesso dal menù: /Modello/Serie Storiche/ARIMA Accesso alternativo: Menù pop-up nella finestra principale (selezione singola) boxplot Argomento: lista-variabili Opzione: --notches (mostra l’intervallo di confidenza al 90 per cento per la mediana) Questo tipo di grafici (da Tukey e Chambers) mostra la distribuzione di una variabile. La “scatola” centrale (box) racchiude il 50 per cento centrale dei dati, ossia è delimitato dal primo e terzo quartile. I “baffi” (whiskers) si estendono fino ai valori minimo e massimo. Una linea trasversale sulla scatola indica la mediana, mentre un segno “+” indica la media. Nel caso dei grafici a tacca (notches), una tacca indica i limiti dell’intervallo di confidenza approssimato al 90 per cento per la mediana, ottenuto col metodo bootstrap. Dopo ogni variabile specificata nel comando boxplot, è possibile aggiungere un’espressione booleana tra parentesi per limitare il campione per la variabile in questione. Occorre inserire uno spazio tra il nome o il numero della variabile e l’espressione. Si supponga di avere dati sui salari di uomini e donne e di avere una variabile dummy GENERE che vale 1 per gli uomini e 0 Capitolo 1. Guida ai comandi 7 per le donne. In questo caso, è possibile generare dei boxplot comparativi usando la seguente lista-variabili: salario (GENERE=1) salario (GENERE=0) Alcuni dettagli del funzionamento dei boxplot di gretl possono essere controllati attraverso un file testuale chiamato .boxplotrc. Per ulteriori dettagli, si veda la Guida all’uso di gretl. Accesso dal menù: /Visualizza/Grafico/Boxplot break Esce da un ciclo. Questo comando può essere usato solo all’interno di un ciclo e causa l’immediata interruzione dell’esecuzione del ciclo (o di quello più interno, nel caso di cicli nidificati). Si veda anche il comando loop. chow Argomento: osservazione Opzione: --quiet (non mostra le stime del modello aumentato) Esempi: chow 25 chow 1988:1 Va eseguito dopo una regressione OLS e fornisce un test per l’ipotesi nulla che non esista un break strutturale del modello in corrispondenza del punto di rottura specificato. La procedura consiste nel creare una variabile dummy che vale 1 a partire dal punto di rottura specificato da osservazione fino alla fine del campione, 0 altrove; inoltre vengono creati dei termini di interazione tra questa dummy e i regressori originali. Viene quindi stimata una regressione che include questi termini. Per impostazione predefinita viene calcolata una statistica F , prendendo la regressione aumentata come non vincolata e la regressione originale come vincolata. Se il modello originale usa uno stimatore robusto per la matrice di covarianza, come statistica test viene usato un valore chi-quadro di Wald, basato su uno stimatore robusto della matrice di covarianza della regressione aumentata. Accesso dal menù: Finestra del modello, /Test/CHOW coeffsum Argomento: lista-variabili Esempio: coeffsum xt xt_1 xr_2 restrict.inp Deve essere usato dopo una regressione. Calcola la somma dei coefficienti delle variabili nella lista-variabili e ne mostra l’errore standard e il p-value per l’ipotesi nulla che la loro somma sia zero. Si noti la differenza tra questo test e omit, che assume come ipotesi nulla l’uguaglianza a zero di tutti i coefficienti di un gruppo di variabili indipendenti. Accesso dal menù: Finestra del modello, /Test/Somma dei coefficienti Capitolo 1. Guida ai comandi 8 coint Argomenti: ordine variabile-dipendente variabili-indipendenti Opzioni: --nc (non include la costante) --ct (include la costante e il trend) --ctt (include la costante e il trend quadratico) --skip-df (non esegue i test DF sulle variabili individuali) Esempi: coint 4 y x1 x2 coint 0 y x1 x2 --ct --skip-df Il test di cointegrazione di Engle–Granger. La procedura predefinita è la seguente: (1) eseguire dei test Dickey–Fuller aumentati, sull’ipotesi nulla che ognuna delle variabili elencate abbia una radice unitaria; (2) stimare la regressione di cointegrazione; (3) eseguire un test DF sui residui della regressione di cointegrazione. Se si usa l’opzione --skip-df, il passo (1) viene saltato. Se l’ordine di ritardo specificato è positivo, tutti i test Dickey–Fuller utilizzano questo ordine. Se l’ordine indicato viene preceduto da un segno meno, viene interpretato come l’ordine massimo, e l’ordine utilizzato effettivamente viene ricavato con la stessa procedura di test all’indietro descritta per il comando adf. L’impostazione predefinita consiste nell’includere una costante nella regressione di cointegrazione; se si vuole omettere la costante, basta usare l’opzione --nc. Se si vuole aggiungere all’elenco dei termini deterministici della regressione un trend lineare o quadratico, basta usare le opzioni --ct o --ctt. Queste opzioni sono mutualmente esclusive. Il test di cointegrazione di Engle–Granger. La procedura predefinita è la seguente: (1) eseguire dei test Dickey–Fuller aumentati, sull’ipotesi nulla che ognuna delle variabili elencate abbia una radice unitaria; (2) stimare la regressione di cointegrazione; (3) eseguire un test DF sui residui della regressione di cointegrazione. Se si attiva la casella Salta i test DF iniziali, il passo (1) viene saltato. I pvalue per questo test si basano su MacKinnon (1996). Il codice relativo è stato incluso per gentile concessione dell’autore. Accesso dal menù: /Modello/Serie storiche/Test di cointegrazione/Engle-Granger coint2 Argomenti: ordine lista-y [ ; lista-x ] [ ; lista-rx ] Opzioni: --nc (senza costante) --rc (costante vincolata) --crt (costante e trend vincolato) --ct (costante e trend non vincolato) --seasonals (include dummy stagionali centrate) --quiet (mostra solo i test) --verbose (mostra i dettagli delle regressioni ausiliarie) Esempi: coint2 2 y x coint2 4 y x1 x2 --verbose coint2 3 y x1 x2 --rc Esegue il test di Johansen per la cointegrazione tra le variabili della lista-y per l’ordine specificato di ritardi.I valori critici sono calcolati con l’approssimazione gamma di J. Doornik (Doornik, 1998). Per i dettagli su questo test, si veda Hamilton, Time Series Analysis (1994), Cap. 20. L’inclusione di trend deterministici nel modello è controllata dalle opzioni del comando. Se non si indica alcuna opzione, viene inclusa una “costante non vincolata”, che permette la presenza di un’intercetta diversa da zero nelle relazioni di cointegrazione e di un trend nei livelli delle variabili endogene. Nella letteratura originata dal lavoro di Johansen (si veda ad esempio il suo libro del 1995), si fa riferimento a questo come al “caso 3”. Le prime quattro opzioni mostrate sopra, che sono mutualmente esclusive, producono rispettivamente i casi 1, 2, 4 e 5. Capitolo 1. Guida ai comandi 9 Il significato di questi casi e i criteri per scegliere tra di essi sono spiegati nella Guida all’uso di gretl. Le liste opzionali lista-x e lista-rx permettono di controllare per specifiche variabili esogene che entrano nel sistema in modo non vincolato (lista-x) o vincolate allo spazio di cointegrazione (lista-rx). Queste liste vanno separate tra di loro e dalla lista-y usando il carattere punto e virgola. L’opzione --seasonals, che può accompagnare una qualsiasi delle altre opzioni, specifica l’inclusione di un gruppo di variabili dummy stagionali centrate. Questa opzione è disponibile solo per dati trimestrali o mensili. La tabella seguente fornisce un esempio di interpretazione dei risultati del test nel caso di 3 variabili. H0 denota l’ipotesi nulla, H1 l’ipotesi alternativa e c il numero delle relazioni di cointegrazione. Test traccia Test λ-max Rango H0 H1 H0 H1 0 c=0 c=3 c=0 c=1 1 c=1 c=3 c=1 c=2 2 c=2 c=3 c=2 c=3 Si veda anche il comando vecm. Accesso dal menù: /Modello/Serie storiche/Test do cointegrazione/Johansen corr Argomento: [ lista-variabili ] Opzioni: --uniform (assicura l’uniformità del campione) --spearman (Rho di Spearman) --kendall (Tau di Kendall) --verbose (mostra i ranghi) Esempi: corr y x1 x2 x3 corr ylist --uniform corr x y --spearman Per impostazione predefinita, mostra le coppie di coefficienti di correlazione (la correlazione del prodotto dei momenti di Pearson) per le variabili date nella lista-variabili, o per tutte le variabili del dataset se non viene specificata alcuna lista-variabili. Il comportamento predefinito consiste nell’usare tutte le osservazioni disponibili per calcolare ognuno dei coefficienti, ma se si usa l’opzione --uniform il campione verrà limitato (se necessario) in modo che per tutti i coefficienti venga usato lo stesso insieme di osservazioni. Questa opzione ha effetto solo se le diverse variabili contengono un numero diverso di valori mancanti. Le opzioni (mutualmente esclusive) --spearman e --kendall producono rispettivamente, la correlazione di rango di Spearman (rho) e la correlazione di rango di Kendall (tau), invece del solito coefficiente di Pearson. Quando si usa una di queste opzioni, la lista-variabili deve contenere solo due variabili. Quando viene calcolata la correlazione di rango, si può usare l’opzione --verbose per mostrare i dati originali e ordinati (altrimenti questa opzione verrà ignorata). Accesso dal menù: /Visualizza/Matrice di correlazione Accesso alternativo: Menù pop-up nella finestra principale (selezione multipla) corrgm Argomenti: variabile [ max-ritardo ] Esempio: corrgm x 12 Capitolo 1. Guida ai comandi 10 Mostra i valori della funzione di autocorrelazione per la variabile specificata (dal nome o dal numero). I valori sono definiti come ρ̂(ut , ut−s ) dove ut è la t-esima osservazione della variabile u e s è il numero dei ritardi. Vengono mostrate anche le autocorrelazioni parziali (calcolate con l’algoritmo di Durbin–Levinson), ossia al netto dell’effetto dei ritardi intermedi. Il comando produce anche un grafico del correlogramma e mostra la statistica Q di Box–Pierce per testare l’ipotesi nulla che la serie sia “white noise” (priva di autocorrelazione). La statistica si distribuisce asintoticamente come chi-quadro con gradi di libertà pari al numero di ritardi specificati. Se viene specificato un valore max-ritardo, la lunghezza del correlogramma viene limitata al numero di ritardi specificato, altrimenti viene scelta automaticamente in funzione della frequenza dei dati e del numero di osservazioni. Accesso dal menù: /Variabile/Correlogramma Accesso alternativo: Menù pop-up nella finestra principale (selezione singola) criteria Argomenti: ess T k Esempio: criteria 23.45 45 8 Calcola il criterio di informazione di Akaike (AIC), il criterio di informazione bayesiana di Schwarz (BIC) e il criterio di Hannan–Quinn, dati ess (somma dei quadrati degli errori), il numero delle osservazioni (T ) e quello dei coefficienti (k). T , k e ess possono essere valori numerici o nomi di variabili definite in precedenza. L’AIC è calcolato come nella formulazione originale di Akaike (1974), ossia AIC = −2` + 2k dove ` denota la log-verosimiglianza massimizzata. Il BIC è calcolato come BIC = −2` + k log T Il HQC è calcolato come HQC = −2` + 2k log log T Si veda la Guida all’uso di gretl per ulteriori dettagli. cusum Opzioni: --squares (esegue il test CUSUMSQ) --quiet (stampa solamente il test di Harvey–Collier) Va eseguito dopo la stima di un modello OLS. Esegue il test CUSUM (o, se si usa l’opzione --squares, il test CUSUMSQ ) per la stabilità dei parametri. Viene calcolata una serie di errori di previsione per il periodo successivo, attraverso una serie di regressioni: la prima usa le prime k osservazioni e viene usata per generare la previsione della variabile dipendente per l’osservazione k + 1; la seconda usa le prime k + 1 osservazioni per generare una previsione per l’osservazione k + 2 e così via (dove k è il numero dei parametri nel modello originale). Viene mostrata, anche graficamente, la somma cumulata degli errori scalati di previsione (o dei quadrati degli errori). L’ipotesi nulla della stabilità dei parametri è rifiutata al livello di significatività del 5 per cento se la somma cumulata va al di fuori delle bande di confidenza al 95 per cento. Nel caso di test CUSUM, viene mostrata anche la statistica t di Harvey–Collier per testare l’ipotesi nulla della stabilità dei parametri. Si veda il Capitolo 7 di Econometric Analysis di Greene, per i dettagli. Per il test CUSUMSQ, la banda di confidenza al 95descritto in Edgerton e Wells (1994). Accesso dal menù: Finestra del modello, /Test/CUSUM(SQ) Capitolo 1. Guida ai comandi 11 data Argomento: lista-variabili Legge le variabili nella lista-variabili da un database (gretl, RATS 4.0 o PcGive), che deve essere stato precedentemente aperto con il comando open. La frequenza dei dati l’intervallo del campione possono essere impostati usando i comandi setobs e smpl prima di questo comando. Ecco un esempio completo: open macrodat.rat setobs 4 1959:1 smpl ; 1999:4 data GDP_JP GDP_UK Questi comandi aprono un database chiamato macrodat.rat, impostano un dataset trimestrale che inizia nel primo trimestre del 1959 e finisce nel quarto trimestre del 1999 e infine importano le serie GDP_JP e GDP_UK. Se non si specificano setobs e smpl nel modo descritto, la frequenza dei dati e l’intervallo del campione vengono impostati usando la prima variabile letta dal database. Se le serie da leggere hanno frequenza maggiore di quella impostata nel dataset, è possibile specificare un metodo di compattamento, come mostrato di seguito data (compact=average) LHUR PUNEW I quattro metodi di compattamento disponibili sono “average” (usa la media delle osservazioni ad alta frequenza), “last” (usa l’ultima osservazione), “first” e “sum”. Se non si specifica alcun metodo, verrà usata la media delle osservazioni. Accesso dal menù: /File/Database dataset Argomenti: parola-chiave parametri Esempi: dataset addobs 24 dataset compact 1 dataset compact 4 last dataset expand 12 dataset transpose dataset sortby x1 dataset resample 500 Esegue varie operazioni sull’intero dataset, a seconda della parola-chiave usata, che può essere addobs, compact, expand, transpose, sortby, dsortby o resample. Nota: questi comandi non sono disponibili quando sul dataset è definito un sotto-campione ottenuto selezionando le osservazioni con un criterio Booleano. addobs: deve essere seguito da un intero positivo. Aggiunge il numero specificato di osservazioni alla fine del dataset, tipicamente a scopo di ottenere delle previsioni. I valori della maggior parte delle variabili nell’intervallo aggiunto sono impostati come valori mancanti, ma alcune variabili deterministiche, ad esempio le tendenze lineari e le variabili dummy periodiche, sono riconosciute ed estese. compact: deve essere seguito da un intero positivo che rappresenta la nuova frequenza dei dati, che dovrebbe essere minore di quella attuale (ad esempio un valore 4 quando la frequenza attuale è 12 significa che si compatterà un dataset mensile in uno trimestrale). Questo comando è disponibile solo se il dataset contiene serie storiche: compatta tutte le serie del dataset alla nuova frequenza. È possibile dare un secondo parametro, tra sum, first o last, per specificare, rispettivamente, di compattare usando la somma dei valori alla frequenza maggior, i valori di inizio periodo, o di fine periodo. Il comportamento predefinito consiste nel prendere la media dei valori sul periodo. Capitolo 1. Guida ai comandi 12 expand: deve essere seguito da un intero positivo che rappresenta la nuova frequenza dei dati, che dovrebbe essere maggiore di quella attuale. Questo comando è disponibile solo per serie storiche annuali o trimestrali. I dati annuali possono essere espansi a trimestrali o mensili; quelli trimestrali possono essere espansi a mensili. Tutte le serie nel dataset verranno espanse assegnando alle nuove osservazioni i valori del periodo corrispondente nel vecchio dataset. transpose: non richiede parametri aggiuntivi. Traspone il dataset attuale: ogni osservazione (riga) del dataset attuale diventerà una variabile (colonna), e ogni variabile un’osservazione. Questo comando è utile quando si importano da fonti esterne dei dati organizzati con le variabili disposte per riga. sortby: richiede il nome di una variabile, che viene usata come criterio di ordinamento. Le osservazioni di tutte le altre variabili del dataset sono riordinate secondo valori crescenti della variabile indicata. Questo comando è disponibile solo per dati non datati. dsortby: funziona come sortby ma riordina le osservazioni secondo i valori decrescenti della variabile specificata. resample: costruisce un nuovo dataset attraverso un campionamento causale, con reimmissione, delle righe del dataset attuale. È richiesto un argomento, ossia il numero di righe da includere, che può essere minore, uguale o maggiore del numero di osservazioni nei dati originali. Il dataset originale può essere recuperato usando il comando smpl full. Accesso dal menù: /Dati delete Argomento: [ lista-variabili ] Opzione: --db (rimuove dal database aperto) Per impostazione predefiinita, rimuove dal dataset le variabili elencate (specificate tramite il nome o il numero). Usare con cautela: non viene chiesta conferma dell’operazione e le variabili con numeri identificativi più alti vengono ri-numerate. Se non viene specificata alcuna lista-variabili viene eliminata dal dataset l’ultima variabile (quella col numero identificativo più alto). Se si usa l’opzione --db, il comando rimuove le variabili elencate non dal dataset attuale ma da un database gretl, assumendo che questo sia stato aperto in precedenza e che l’utente abbia il permesso di scrittura sul file che contiene il database. Si veda anche il comando open. Accesso dal menù: Pop-up nella finestra principale (selezione singola) diff Argomento: lista-variabili Calcola la differenza prima di ogni variabile nella lista-variabili e la salva in una nuova variabile il cui nome è prefissato con d_. Quindi diff x y crea le nuove variabili d_x = x(t) - x(t-1) d_y = y(t) - y(t-1) Accesso dal menù: /Aggiungi/Differenze difftest Argomenti: var1 var2 Opzioni: --sign (Test del segno, scelta predefinita) --rank-sum (Test rank-sum di Wilcoxon) --signed-rank (Test signed-rank di Wilcoxon) --verbose (Mostra informazioni aggiuntive) Capitolo 1. Guida ai comandi 13 Esegue un test non parametrico per la differenza tra due popolazioni o gruppi; il tipo di test dipende dall’opzione usata. Con l’opzione --sign, viene eseguito il test del segno, che si basa sul fatto che per due campioni x e y estratti casualmente dalla stessa distribuzione, la probabilità che valga x i > y i per ogni osservazione i dovrebbe valere 0.5. La statistica test è w, ossia il numero di osservazioni per cui vale x i > y i . Sotto l’ipotesi nulla, questa grandezza si distribuisce come una binomiale con parametri (n, 0.5), dove n è il numero di osservazioni. Con l’opzione --rank-sum, viene eseguito il test rank-sum di Wilcoxon. Questo test procede ordinando le osservazioni estratte da entrambi i campioni dalla più piccola alla più grande, e quindi calcolando la somma dei ranghi delle osservazioni da uno dei campioni. I due campioni non devono necessariamente avere la stessa dimensione: se sono diversi, viene usato il campione più piccolo per calcolare la somma dei ranghi. Sotto l’ipotesi nulla che i campioni siano estratti da popolazioni con la stessa mediana, la distribuzione di probabilità della somma dei ranghi può essere calcolata per ogni valore dell’ampiezza dei due campioni, mentre per campioni abbastanza ampi essa approssima la distribuzione normale. Con l’opzione --signed-rank, viene eseguito il test signed-rank di Wilcoxon. Questo test è valido per coppie di campioni, come possono essere ad esempio i valori di una variabile in un gruppo di individui prima e dopo un certo trattamento. Il test procede calcolando le differenze tra le coppie di osservazioni x i − y i , ordinando queste differenze per valore assoluto e assegnando ad ogni coppia un valore di rango con segno, in cui il segno rispecchia il segno della differenza. Quindi viene calcolato W + , la somma di tutti i ranghi con segno positivo. Come avviene per il test rank-sum, questa statistica ha una distribuzione precisa nell’ipotesi nulla che la differenza mediana sia zero, distribuzione che converte alla normale nel caso di campioni abbastanza ampi. Usando l’opzione --verbose con i test di Wilcoxon viene mostrato l’ordinamento delle osservazioni (l’opzione non ha effetto se usata con il test del segno). discrete Argomento: lista-variabili Opzione: --reverse (marca le variabili come continue) Marca ogni variabile della lista-variabili come discreta. In modalità predefinita, tutte le variabili sono considerate come continue; marcando una variabile come discreta, essa viene trattata in modo speciale nei diagrammi di frequenza, e può esere usata con il comando dummify. Usando l’opzione --reverse, l’operazione viene invertita, ossia, le variabili nella lista-variabili sono marcate come continue. Accesso dal menù: /Variabile/Modifica attributi dummify Argomento: lista-variabili Opzioni: --drop-first (omette dalla codifica il valore minimo) --drop-last (omette dalla codifica il valore massimo) Per ogni variabile rilevante nella lista-variabili, crea un insieme di variabili dummy che codificano i valori distinti di quella variabile. Le variabili rilevanti sono quelle che sono state marcate esplicitamente come discrete, o quelle che assumono un numero limitato di valori che devono essere “abbastanza arrotondati” (multipli di 0.25). Per impostazione predefinita, viene aggiunta una variabile dummy per ognuno dei valori distinti della variabile in questione. Ad esempio, se una variabile discreta x ha 5 valori distinti, verranno create 5 variabili dummy, di nome Dx_1, Dx_2 e così via. La prima variabile dummy avrà valore 1 per le osservazioni in cui x assume il suo valore minimo, e 0 altrove; la successiva variabile dummy avrà valore 1 dove x assume il secondo tra i suoi valori, e così via. Se viene usata una delle opzioni --drop-first o --drop-last, il più basso o il più alto dei valori della variabile Capitolo 1. Guida ai comandi 14 viene omesso dalla codifica (questa funzione può essere utile per evitare la cosiddetta “trappola delle variabili dummy”). Questo comando può anche essere usato nel contesto di una regressione. Ad esempio, la riga seguente specifica un modello in cui y viene regredita sull’insieme di variabili dummy che codificano x (in questo contesto non è possibile passare opzioni al comando dummify). ols y dummify(x) elif Si veda if. else Si veda if. end Termina un blocco di comandi di qualsiasi tipo. Ad esempio, end system termina un system (sistema di equazioni). endif Si veda if. endloop Indica la fine di un ciclo (loop) di comandi. Si veda loop. eqnprint Argomento: [ -f nomefile ] Opzione: --complete (crea un documento completo) Va eseguito dopo la stima di un modello. Stampa il modello stimato sotto forma di equazione LATEX. Se viene specificato un nome di file usando l’opzione -f, il risultato viene scritto in quel file, altrimenti viene scritto in un file il cui nome ha la forma equation_N.tex, dove N è il numero di modelli stimati finora nella sessione in corso. Si veda anche tabprint. Usando l’opzione --complete, il file LATEX è un documento completo, pronto per essere processato; altrimenti il file va incluso in un documento. Accesso dal menù: Finestra del modello, /LaTeX equation Argomenti: variabile-dipendente variabili-indipendenti Esempio: equation y x1 x2 x3 const Specifica un’equazione all’interno di un sistema di equazioni (si veda system). La sintassi per specificare un’equazione in un sistema SUR è la stessa usata ad esempio in ols. Per un’equazione in un sistema con minimi quadrati a tre stadi, invece è possibile usare una specificazione simile a quella usata per OLS e indicare una lista di strumenti comuni usando l’istruzione instr (si veda ancora system), oppure si può usare la stessa sintassi di tsls. Capitolo 1. Guida ai comandi 15 estimate Argomenti: nome-sistema stimatore Opzioni: --iterate (itera fino alla convergenza) --no-df-corr (nessuna correzione per i gradi di libertà) --geomean (si veda oltre) --verbose (mostra i dettagli delle iterazioni) Esempi: estimate Klein Model 1 method=fiml estimate Sys1 method=sur estimate Sys1 method=sur --iterate Esegue la stima di un sistema di equazioni, che deve essere stato definito in precedenza usando il comando system. Per prima cosa va indicato il nome del sistema, racchiuso tra virgolette se contiene spazi, quindi il tipo di stimatore, preceduto dalla stringa method=. Gli stimatori disponibili sono: ols, tsls, sur, 3sls, fiml o liml. Se al sistema in questione sono stati imposti dei vincoli (si veda il comando restrict), la stima sarà soggetta a tali vincoli. Se il metodo di stima è sur o 3sls e viene usata l’opzione --iterate, lo stimatore verrà iterato. Nel caso di SUR, se la procedura converge, i risultati saranno stime di massima verosimiglianza. Invece l’iterazione della procedura dei minimi quadrati a tre stadi non produce in genere risultati di massima verosimiglianza a informazione completa. L’opzione --iterate viene ignorata con gli altri metodi di stima. Se vengono scelti gli stimatori equazione per equazione ols o tsls, nel calcolo degli errori standard viene applicata in modo predefinito una correzione per i gradi di libertà, che può essere disabilitata usando l’opzione --no-df-corr. Questa opzione non ha effetti nel caso vengano usati altri stimatori, che non prevedono correzioni per i gradi di libertà. La formula usata in modo predefinito per calcolare gli elementi della matrice di covarianza tra equazioni è û0 ûj σ̂i,j = i T Se viene usata l’opzione --geomean, viene applicata una correzione per i gradi di libertà secondo la formula û0i ûj σ̂i,j = q (T − ki )(T − kj ) dove i k indicano il numero di parametri indipendenti in ogni equazione. Se si usa l’opzione --verbose e un metodo iterativo, vengono mostrati i dettagli delle iterazioni. fcast Argomenti: [ oss-iniziale oss-finale ] [ passi-avanti ] [ nome-variabile ] Opzioni: --dynamic (crea previsioni dinamiche) --static (crea previsioni statiche) --out-of-sample (genera previsioni fuori dal campione) --quiet (non mostra le previsioni) --rolling (vedi sotto) Esempi: fcast 1997:1 2001:4 f1 fcast fit2 fcast 2004:1 2008:3 4 rfcast --rolling Deve seguire un comando di stima. Calcola previsioni per l’intervallo specificato. A seconda del tipo di modello, calcola anche gli errori standard (si veda oltre). Deve seguire un comando di stima. Calcola previsioni per un certo intervallo delle osservazioni. L’intervallo può essere specificato indicando oss-iniziale e oss-finale, oppure con l’opzione --out-of-sample (in questo caso la previsione sarà per le osservazioni successive a quelle su Capitolo 1. Guida ai comandi 16 cui è stato stimato il modello); se non si usa alcuna opzione, l’intervallo sarà quello attualmente impostato. Se si sceglie una previsione fuori dal campione ma non sono disponibili osservazioni, viene segnalato un errore. A seconda del tipo di modello, calcola anche gli errori standard (si veda oltre). L’opzione --rolling produce un comportamento speciale spiegato oltre. Se l’ultimo modello stimato consiste in un’equazione singola, l’argomento opzionale nomevariabile ha l’effetto seguente: i valori della previsione non sono mostrati, ma vengono salvati nel dataset con il nome di variabile indicato. Se l’ultimo modello stimato è un sistema di equazioni, nome-variabile ha un effetto diverso, ossia seleziona una particolare varabile endogena per cui effettuare la previsione (l’impostazione predefinita consiste nel produrre previsioni per tutte le variabili endogene). Nel caso del sistema, o se non viene specificata nome-variabile, i valori della previsione possono essere recuperati usando la varaiabile accessoria $fcast, mentre gli errori standard, se disponibili, con $fcerr. La scelta tra previsione statica e dinamica è rilevante solo nel caso di modelli dinamici, che comprendono un processo di errore autoregressivo, o che comprendono uno o più valori ritardati della variabile dipendente come regressori. Le previsioni statiche sono per il periodo successivo, basate sui valori effettivi nel periodo precedente, mentre quelle dinamiche usano la regola della previsione a catena. Ad esempio, se la previsione per y nel 2008 richiede come input il valore di y nel 2007, non è possibile calcolare una previsione statica se non si hanno dati per il 2007. È possibile calcolare una previsione dinamica per il 2008 se si dispone di una precedente previsione per y nel 2007. La scelta predefinita consiste nel fornire una previsione statica per ogni porzione dell’intervallo di previsione che fa parte dell’intervallo del campione su cui il modello è stato stimato, e una previsione dinamica (se rilevante) fuori dal campione. L’opzione dynamic richiede di produrre previsioni dinamiche a partire dalla prima data possibile, mentre l’opzione static richiede di produrre previsioni statiche anche fuori dal campione. L’opzione rolling al momento è disponibile solo per i modelli composti da una singola equazione e stimati via OLS. Quando si usa questa opzione, le previsioni calcolate sono ricorsive, ossia: ogni previsione è generata da una stima del modello che usa i dati a partire da un certo punto fisso (ossia l’inizio dell’intervallo del campione usato per la stima originaria) fino alla data di previsione meno k osservazioni, dove k è il numero di passi-avanti specificato come argomento. Le previsioni sono sempre dinamiche quando è possibile. Si noti che l’argomento passi-avanti deve essere utilizzato solo insieme all’opzione rolling. La natura degli errori standard della previsione (se disponibili) dipende dalla natura del modello e della previsione. Per i modelli lineari statici, gli errori standard sono calcolati seguendo il metodo delineato in Davidson and MacKinnon (2004); essi incorporano sia l’incertezza dovuta al processo d’errore, sia l’incertezza dei parametri (sintetizzata dalla matrice di covarianza delle stime dei parametri). Per modelli dinamici, gli errori standard della previsione sono calcolati solo nel caso di previsione dinamica, e non incorporano incertezza dei parametri. Per modelli non lineari, al momento non sono disponibili errori standard della previsione. Accesso dal menù: Finestra del modello, /Analisi/Previsioni foreign Argomento: [ linguaggio ] Opzioni: --send-data (pre-carica il dataset attuale) --quiet (sopprime l’output dal programma esterno) Questo comando apre una modalità speciale, in cui vengono accettati comandi che verranno eseguiti da un programma esterno. Con il comando end foreign si esce da questa modalità e i comandi verranno eseguiti. Al momento, l’unico programma esterno compatibile con questa modalità è GNU R, e l’unico argomento linguaggio accettabile è language=R (che è il valore predefinito, e può essere omesso). In futuro potranno essere supportati altri programmi. Si veda la Guida all’uso di gretl per dettagli ed esempi. Capitolo 1. Guida ai comandi 17 freq Argomento: variabile Opzioni: --quiet (non mostra il grafico) --normal (test per la distribuzione normale) --gamma (test per la distribuzione gamma) --silent (non mostra nulla) Se non vengono indicate opzioni, mostra la distribuzione di frequenza per la variabile (indicata con il nome o il numero). Usando l’opzione --normal, vengono mostrati i risultati del test chi-quadro di Doornik–Hansen per la normalità. Usando l’opzione --gamma, al posto del test di normalità viene eseguito il test non parametrico di Locke per l’ipotesi nulla che la variabile segua la distribuzione gamma; si veda Locke (1976), Shapiro e Chen (2001). Si noti che la parametrizzazione della distribuzione gamma in gretl è (forma, scala). In modalità interattiva viene mostrato anche un grafico della distribuzione, a meno che non si usi l’opzione --quiet. L’opzione --silent sopprime interamente l’output mostrato di solito. Ha senso usarla insieme a una delle opzioni riguardanti la distribuzione: in questo modo la statistica test e il suo p-value verranno salvati nelle variabili accessorie $test e $pvalue. Accesso dal menù: /Variabile/Distribuzione di frequenza function Argomento: nome-funzione Apre un blocco di istruzioni che definiscono una funzione. Il blocco va chiuso con end function. Per i dettagli, si veda la Guida all’uso di gretl. garch Argomenti: p q ; variabile-dipendente [ variabili-indipendenti ] Opzioni: --robust (errori standard robusti) --verbose (mostra i dettagli delle iterazioni) --vcv (mostra la matrice di covarianza) --nc (non include una costante) --fcp (usa l’algoritmo di Fiorentini, Calzolari e Panattoni) --arma-init (parametri di varianza iniziale da ARMA) Esempi: garch 1 1 ; y garch 1 1 ; y 0 x1 x2 --robust Stima un modello GARCH (Generalized Autoregressive Conditional Heteroskedasticity) univariato, o, se sono specificate delle variabili-indipendenti, includendo delle variabili esogene. I valori interi p e q (che possono essere indicati in forma numerica o col nome di variabili scalari preesistenti) rappresentano gli ordini di ritardo nell’equazione della varianza condizionale. ht = α0 + q X i=1 2 αi εt−i + p X βj ht−j j=1 Il parametro p rappresenta quinsi l’ordine generalizzato (o “AR”), mentre q rappresenta il consueto ordine ARCH (o “MA”). Se p è diverso da zero, anche q deve essere diverso da zero, altrimenti il modello non è identificato. Comunque, è possibile stimare un modello ARCH consueto impostando q a un valore positivo e p a zero. La somma di p e q non deve superare 5. Si noti che nell’equazione della media viene automaticamente inclusa una costante, a meno che non si usi l’opzione --nc. Capitolo 1. Guida ai comandi 18 Per impostazione predefinita, i modelli GARCH vengono stimati usando il codice nativo gretl, ma è anche possibile usare l’algoritmo di Fiorentini, Calzolari e Panattoni (1996). Il primo usa il massimizzatore BFGS, mentre il secondo usa la matrice di informazione per massimizzare la verosimiglianza, con un raffinamento usando l’Hessiana. Sono disponibili varie stime della matrice di covarianza dei coefficienti. Il metodo predefinito è quello dell’Hessiana, a meno che non si usi l’opzione --robust, nel qual caso viene usata la matrice di covarianza QML (White). Altre possibilità (ad es. la matrice di informazione, o lo stimatore di Bollerslev–Wooldridge) possono essere specificate con il comando set. In modalità predefinita, le stime dei parametri di varianza sono inizializzate usando la varianza dell’errore non condizionale, ottenuta dalla stima OLS iniziale, per la costante, e piccoli valori positivi per i coefficienti dei valori passati dell’errore al quadrato e per la varianza dell’errore. L’opzione --arma-init fa in modo che i valori iniziali per questi parametri siano ricavati da un modello ARMA iniziale, sfruttando la relazione tra GARCH e ARMA mostrata nel capitolo 21 di Time Series Analysis di Hamilton. In alcuni casi, questo metodo può aumentare le probabilità di convergenza. I residui GARCH e la varianza condizionale stimata sono memorizzate rispettivamente nelle variabili $uhat e $h. Ad esempio, per ottenere la varianza condizionale è possibile scrivere: genr ht = $h Accesso dal menù: /Modello/Serie storiche/GARCH genr Argomenti: nuova-variabile = formula In contesti appropriati, series, scalar e matrix sono sinonimi per questo comando. Crea nuove variabili, di solito per mezzo di trasformazioni di variabili esistenti. Si veda anche diff, logs, lags, ldiff, sdiff e square per le scorciatoie. Nel contesto di una formula genr, le variabili esistenti devono essere referenziate per nome, non per numero identificativo. La formula dev’essere una combinazione ben definita di nomi di variabile, costanti, operatori e funzioni (descritte oltre). Ulteriori dettagli su alcuni aspetti di questo comando si possono trovare nella Guida all’uso di gretl. Il comando genr può produrre come risultato una serie o uno scalare. Ad esempio, la formula x2 = x * 2 produce una serie se la variabile x è una serie e uno scalare se x è uno scalare. Le formule x = 0 e mx = mean(x) producono degli scalari. In alcune circostanze, può essere utile che un risultato scalare sia espanso in una serie o in un vettore: è possibile ottenere questo risultato usando series come “alias” per il comando genr. Ad esempio, series x = 0 produce una serie con tutti i valori pari a 0. Allo stesso modo, è possibile usare scalar come alias per genr, ma non è possibile forzare un risultato vettoriale in uno scalare: con questa parola chiave si indica che il risultato dovrebbe essere uno scalare; se non lo è, viene emesso un messaggio di errore. Quando una formula produce una serie o un vettore come risultato, l’intervallo su cui essi sono definiti dipende dall’impostazione attuale del campione. È quindi possibile definire una serie a pezzi, alternando l’uso dei comandi smpl e genr. Gli operatori aritmetici supportati sono, in ordine di precedenza: ^ (esponenziale); *, / e % (modulo o resto); + e -. Gli operatori Booleani disponibili sono (ancora in ordine di precedenza): ! (negazione), && (AND logico), || (OR logico), >, <, =, >= (maggiore o uguale), <= (minore o uguale) e != (disuguale). Gli operatori Booleani possono essere usati per costuire variabili dummy: ad esempio (x > 10) produce 1 se x > 10, 0 altrimenti. Le costanti predefinite sono pi e NA. L’ultima rappresenta il codice per i valori mancanti: è possibile inizializzare una variabile con valori mancanti usando scalar x = NA. Il comando genr supporta un’ampia gamma di funzioni matematiche e statistiche, da quelle più comuni a quelle di uso specifico in econometria. Inoltre offre l’accesso a numerose variabili Capitolo 1. Guida ai comandi 19 interne che vengono definite nel corso della stima di regressioni, dell’esecuzione di test, e così via. Per un elenco delle funzioni e degli accessori, si veda: il capitolo 2. Oltre agli operatori e alle funzioni mostrati, ci sono alcuni usi speciali del comando genr: • genr time crea una variabile trend temporale (1,2,3,. . . ) chiamata time. genr index fa la stessa cosa, ma chiamando la variabile index. • genr dummy crea una serie di variabili dummy a seconda della periodicità dei dati. Ad esempio, nel caso di dati trimestrali (periodicità 4) il programma crea dq1, che vale 1 nel primo trimestre e 0 altrove, dq2 che vale 1 nel secondo trimestre e 0 altrove, e così via. Nel caso di dati mensili, le dummy si chiamano dm1, dm2 e così via. Con altre frequenze dei dati, i nomi delle dummy sono dummy_1, dummy2, ecc. • genr unitdum e genr timedum creano insiemi di variabili dummy speciali da usare in un dataset di tipo panel. Il primo comando crea dummy che rappresentano le unità cross section, il secondo i periodi di osservazione. Nota: nella versione a riga di comando del programma, i comandi genr che estraggono dati relativi al modello si riferiscono sempre al modello stimato per ultimo. Questo vale anche per la versione grafica del programma se si usa genr nel “terminale di gretl” o si immette una formula usando l’opzione “Definisci nuova variabile” nel menù Variabile della finestra principale. Usando la versione grafica, però, è possibile anche estrarre i dati da qualunque modello mostrato in una finestra (anche se non è il modello più recente) usando il menù “Analisi” nella finestra del modello. La variabile speciale t serve da indice per le osservazioni (obs è un sinonimo). Ad esempio, genr dum = (t=15) crea una variabile dummy che vale 1 per l’osservazione 15 e 0 altrove. È anche possibile usare questa variabile per selezionare alcune osservazioni particolari secondo la data o il nome. Ad esempio genr d = (obs>1986:4), genr d = (obs>2008/04/01), genr d = (obs=CA). Quando si usa una data o un nome dell’osservazione, questi vanno racchiusi tra virgolette doppie, mentre non è strettamente necessario farlo per le date trimestrali e mensili. Nota: quando si usa t e obs con serie storiche annuali, il valore corrisponde sempre all’anno dell’osservazione. Quindi se si hanno dati annuali che iniziano nel 1970, l’osservazione per il 1980 corrisponde a t=1980, non a t=10. Con dati trimestrali o mensili, invece, t=10 corrisponde alla decima osservazione. È possibile estrarre dei valori scalari da una serie usando una formula genr con la sintassi nomevariabile[osservazione]. Il valore di osservazione può essere specificato con un numero o una data. Esempi: x[5], CPI[1996:01]. Per i dati giornalieri occorre usare la forma AAAA/MM/GG, ad esempio ibm[1970/01/23]. È possibile modificare una singola osservazione in una serie usando genr. Per farlo, occorre aggiungere un numero di osservazione o una data valida tra parentesi quadre al nome della variabile nel lato sinistro della formula. Ad esempio: genr x[3] = 30 o genr x[1950:04] = 303.7. Ecco un esempio di utilizzo delle variabili dummy: si supponga che x abbia valori 1, 2, o 3 e si desiderino tre variabili dummy, d1 = 1 se x = 1, e 0 altrove, d2 = 1 se x = 2 e così via. Per crearle, basta usare i comandi: genr d1 = (x=1) genr d2 = (x=2) genr d3 = (x=3) Accesso dal menù: /Variabile/Definisci nuova variabile Accesso alternativo: Menù pop-up nella finestra principale Capitolo 1. Guida ai comandi 20 Tabella 1.1: Esempi di utilizzo del comando genr Commento Formula x1 al cubo y = x1^3 y = ln((x1+x2)/x3) z = x>y z(t) = 1 se x(t) > y(t), 0 altrove y = x(-2) x ritardata di 2 periodi y = x(+2) x anticipata di 2 periodi y = diff(x) y(t) = x(t) - x(t-1) y = ldiff(x) y(t) = log x(t) - log x(t-1), il tasso di crescita istantaneo di x y = sort(x) ordina x in senso crescente e la salva in y y = dsort(x) ordina x in senso decrescente y = int(x) tronca x e salva il valore intero in y y = abs(x) salva il valore assoluto di x y = sum(x) somma i valori di x escludendo i valori mancanti NA Pt cumulativa: yt = τ=1 xτ y = cum(x) aa = $ess imposta aa uguale alla somma dei quadrati degli errori dell’ultima regressione x = $coeff(sqft) estrae il coefficiente stimato per la variabile sqft nell’ultima regressione rho4 = $rho(4) estrae il coefficiente di autoregressione del quarto ordine dall’ultimo modello (presume un modello ar model) cvx1x2 = $vcv(x1, x2) estrae il coefficiente di covarianza stimato tra le variabili x1 e x2 dall’ultimo modello foo = uniform() variabile pseudo-casuale uniforme nell’intervallo 0–1 bar = 3 * normal() variabile pseudo-casuale normale con µ = 0, σ = 3 samp = ok(x) vale 1 per le osservazioni dove il valore di x non è mancante. gmm Opzioni: --two-step (Stima a due passi) --iterate (GMM iterato) --vcv (Mostra la matrice di covarianza) --verbose (Mostra i dettagli delle iterazioni) Esegue la stima col metodo dei momenti generalizzato (Generalized Method of Moments, GMM) usando l’algoritmo BFGS (Broyden, Fletcher, Goldfarb, Shanno). Occorre specificare uno o più comandi per aggiornare le quantità rilevanti (tipicamente i residui GMM), una o più condizioni di ortogonalità, una matrice iniziale dei pesi e un elenco dei parametri da stimare, il tutto racchiuso tra le parole chiave gmm e end gmm. Si veda la Guida all’uso di gretl per i dettagli. Quello che segue è un semplice esempio illustrativo. gmm e = y - X*b orthog e ; W weights V params b end gmm Nell’esempio si assume che y e X siano matrici di dati, b sia un vettore con i valori dei parametri, W sia una matrice di strumenti, e V un’appropriata matrice dei pesi. La dichiarazione orthog e ; W indica che il vettore dei residui e è in linea di principio ortogonale ad ognuno degli strumenti che compongono le colonne di W. Accesso dal menù: /Modello/GMM Capitolo 1. Guida ai comandi 21 gnuplot Argomenti: variabili-y variabile-x [ variabile-dummy ] Opzioni: --with-lines (usa linee invece che punti) --with-impulses (usa linee verticali) --time-series (mostra rispetto al tempo) --suppress-fitted (non mostra la linea stimata) --linear-fit (mostra fit minimi quadrati) --inverse-fit (mostra fit inverso) --quadratic-fit (mostra fit quadratico) --loess-fit (mostra fit loess) --dummy (si veda sotto) Esempi: gnuplot y1 y2 x gnuplot x --time-series --with-lines gnuplot wages educ gender --dummy Le variabili nella lista variabili-y vengono mostrate rispetto alle variabili-x. Per avere un grafico storico è possibile usare time come variabile-x, oppure usare l’opzione --time-series. Usando l’opzione --dummy, occorre fornire esattamente tre variabili: una variabile y, una variabile x, e una variabile dummy dumvar. L’effetto è quello di mostrare y rispetto a x colorando in modo diverso i vari punti, a seconda che dumvar valga 1 o 0. In modalità interattiva il risultato è mostrato immediatamente. In modalità “batch”, viene scritto un file di comandi gnuplot, chiamato gpttmpN.plt, a partire da N = 01; il grafico vero e proprio può essere generato usando il programma gnuplot (su MS Windows: wgnuplot). Le varie opzioni “fit” si applicano solo nel caso di un diagramma a dispersione bivariato. Il comportamento predefinito consiste nel mostrare la linea con le stime OLS, se e solo se il coefficiente di pendenza è significativo almeno al 10 per cento. Se si usa l’opzione suppress non viene mostrata alcuna linea. Se si usa l’opzione linear, la linea OLS viene mostrata a prescindere dalla sua significatività. Le altre opzioni (inverse, quadratic e loess) mostrano rispettivamente un fit inverso (la regressione di y su 1/x), un fit quadratico o un fit loess (chiamato a volte anche “lowess”, una regressione robusta con pesi locali). È disponibile un’ulteriore opzione per questo comando: dopo la specificazione delle variabili e le eventuali opzioni, è possibile aggiungere direttamente dei comandi gnuplot per modificare l’aspetto visivo del grafico (ad esempio, impostando il titolo e o gli intervalli degli assi). Questi comandi aggiuntivi vanno inclusi tra parentesi graffe e ogni comando va separato con un punto e virgola; è possibile usare una barra rovesciata (\) per continuare un gruppo di comandi gnuplot sulla riga successiva. Ecco un esempio della sintassi: { set title ’Il mio titolo’; set yrange [0:1000]; } Accesso dal menù: /Visualizza/Grafico Accesso alternativo: Menù pop-up nella finestra principale, pulsante grafico sulla barra degli strumenti graph Argomenti: variabili-y variabile-x Opzione: --tall (usa 40 righe) Grafici ASCII. Le variabili-y (che possono essere definite per nome o numero) sono rappresentate rispetto alla variabile-x usando simboli ASCII. L’opzione --tall produce un grafico di 40 righe per 60 colonne, altrimenti il grafico sarà di 20 righe per 60 colonne (per la visualizzazione a schermo). Si veda anche gnuplot. Capitolo 1. Guida ai comandi 22 hausman Questo test è disponibile solo dopo aver stimato un modello OLS su dati panel (si veda anche setobs). Testa il semplice modello “pooled” (con tutte le osservazioni mescolate indistintamente) contro le principali alternative: il modello a effetti fissi e quello a effetti casuali. Il modello a effetti fissi permette all’intercetta della regressione di variare per ogni unità cross section. Viene eseguito un test F per l’ipotesi nulla che le intercette non differiscano tra loro. Il modello a effetti casuali scompone la varianza dei residui in due parti: una specifica all’unità cross section e una specifica all’osservazione particolare (la stima può essere eseguita solo se il numero delle unità cross section nel dataset è maggiore del numero dei parametri da stimare). La statistica LM di Breusch–Pagan testa l’ipotesi nulla che il modello pooled OLS sia adeguato contro l’alternativo modello a effetti casuali. Può accadere che il modello pooled OLS sia rifiutato nei confronti di entrambe le alternative, a effetti fissi o casuali. A patto che gli errori specifici di unità o di gruppo siano non correlati con le variabili indipendenti, lo stimatore a effetti casuali è più efficiente dello stimatore a effetti fissi; nel caso contrario lo stimatore a effetti casuali non è consistente e deve essergli preferito lo stimatore a effetti fissi. L’ipotesi nulla per il test di Hausman è che l’errore specifico di gruppo non sia correlato con le variabili indipendenti (e quindi che il modello a effetti casuali sia preferibile). Un basso p-value per questo test suggerisce di rifiutare il modello a effetti casuali in favore del modello a effetti fissi. Accesso dal menù: Finestra del modello, /Test/HAUSMAN - Diagnosi panel heckit Argomenti: variabile-dipendente variabili-indipendenti ; equazione di selezione Opzioni: --two-step (esegue la stima in due passi) --vcv (mostra la matrice di covarianza) --verbose (mostra risultati aggiuntivi) Esempio: heckit y 0 x1 x2 ; ys 0 x3 x4 heckit.inp Modello di selezione di tipo Heckman. Nella specificazione, la lista che precede il punto e virgola rappresenta l’equazione principale, mentre la seconda lista rappresenta l’equazione di selezione. La variabile dipendente nell’equazione di selezione (ys nell’esempio visto sopra) deve essere una variabile binaria. Per impostazione predefinita, i parametri sono stimati per massima verosimiglianza. La matrice di covarianza dei parametri è calcolata usando l’inversa negativa dell’Hessiana. Se si vuole usare la procedura di stima in due passi, basta usare l’opzione --two-step. In questo caso, la matrice di covarianza dei parametri dell’equazione principale è corretta nel modo descritto da Heckman (1979). Si noti che nella stima di massima verosimiglianza viene impiegata una matrice hessiana calcolata numericamente; ciò può condurre a una stima inaccurata della matrice di covarianze se l’ordine di grandezza delle variabili esplicative è tale per cui alcuni dei coefficienti stimati risultano molto piccoli in valore assoluto. Il problema verrà affrontato nelle versioni future; nel frattempo, si può aggirare il problema riscalando opportunamente i regressori problematici. Accesso dal menù: /Modello/Modelli non lineari/Heckit help Varianti: help help functions help comando help funzione Opzione: --func (sceglie l’aiuto sulle funzioni) Capitolo 1. Guida ai comandi 23 Se non vengono indicati argomenti, mostra un elenco dei comandi disponibili. Indicando l’argomento functions, mostra un elenco delle funzioni disponibili (si veda genr). help comando descrive il comando (ad es. help smpl). help funzione descrive la funzione (ad es. help ldet). Alcune funzioni hanno lo stesso nome dei comandi relativi (ad esempio diff): in questo caso verrà mostrato l’aiuto relativo al comando, a meno che non si usi l’opzione --func. Accesso dal menù: /Aiuto hsk Argomenti: variabile-dipendente variabili-indipendenti Opzione: --vcv (mostra la matrice di covarianza) Questo comando è utile in presenza di eteroschedasticità sotto forma di una funzione incognita dei regressori, che può essere approssimata da una relazione quadratica. In questo contesto, offre la possibilità di avere errori standard consistenti e stime dei parametri più efficienti, rispetto alla stima OLS. La procedura richiede: (a) la stima OLS del modello, (b) una regressione ausiliaria per generare la stima della varianza dell’errore e (c) la stima con minimi quadrati ponderati, usando come peso il reciproco della varianza stimata. Nella regressione ausiliaria (b) il logaritmo dei quadrati dei residui dalla prima regressione OLS viene regredito sui regressori originali e sui loro quadrati. La trasformazione logaritmica viene effettuata per assicurarsi che le varianze stimate siano non negative. Indicando con u∗ i valori stimati da questa regressione, la serie dei pesi per la regressione con minimi quadrati ponderati è data da 1/exp(u∗ ). Accesso dal menù: /Modello/Altri modelli lineari/HSK - WLS corretti per eteroschedasticità hurst Argomento: nome-variabile Calcola l’esponente di Hurst (una misura di persistenza, o di memoria lunga) per una serie storica con almeno 128 osservazioni. L’esponente di Hurst è discusso da Mandelbrot. In termini teorici è l’esponente H nella relazione RS(x) = anH dove RS è l’“intervallo riscalato” della variabile x in un campione dell’ampiezza n, mentre a è una costante. L’intervallo riscalato è l’intervallo (valore massimo meno valore minimo) del valore cumulato, o somma parziale, di x sul periodo del campione (dopo aver sottratto la media campionaria), diviso per lo scarto quadratico medio campionario. Come punto di riferimento, se x è un rumore bianco (media zero, persistenza zero) l’intervallo dei suoi valori cumulati (che forma una passeggiata casuale), scalato per lo scarto quadratico medio, cresce come la radice quadrata dell’ampiezza campionaria, ossia ha un esponente di Hurst atteso pari a 0.5. Valori dell’esponente sensibilmente maggiori di 0.5 indicano persistenza della serie, mentre valori minori di 0.5 indicano anti-persistenza (autocorrelazione negativa). In teoria l’esponente deve essere compreso tra 0 e 1, ma in campioni finiti è possibile ottenere delle stime per l’esponente maggiori di 1. In gretl, l’esponente è stimato usando il sotto-campionamento binario: si inizia dall’intero intervallo dei dati, quindi si usano le due metà dell’intervallo, poi i quattro quarti, e così via. Il valore RS è la media presa sui vari campioni. L’esponente è quindi stimato come il coefficiente di pendenza della regressione del logaritmo di RS sul logaritmo dell’ampiezza del campione. Accesso dal menù: /Variabile/Esponente di Hurst if Struttura di controllo per l’esecuzione dei comandi. Sono supportate le tre forme seguenti: Capitolo 1. Guida ai comandi 24 # Forma semplice if condizione comandi endif # A due rami if condizione comandi-1 else comandi-2 endif # A tre o più rami if condizione-1 comandi-1 elif condizione-2 comandi-2 else comandi-3 endif La condizione deve essere un’espressione Booleana, per la cui sintassi si veda genr. Può essere incluso più di un blocco elif. Inoltre, i blocchi if . . . endif possono essere nidificati. include Argomento: file-input Da usare in uno script di comandi, principalmente per includere definizioni di funzioni. Esegue i comandi nel file-input e ripassa il controllo allo script principale. Per includere una funzione che fa parte di un pacchetto, occorre specificare anche l’estensione del file. Si veda anche il comando run. info Mostra le informazioni aggiuntive contenute nel file di dati attuale. Accesso dal menù: /Dati/Visualizza descrizione Accesso alternativo: Finestre di esplorazione dei dati intreg Argomenti: Opzioni: var-min var-max var-indip --quiet (non mostra i risultati) --verbose (mostra i dettagli delle iterazioni) --robust (errori standard robusti) Esempio: intreg lo hi const x1 x2 wtp.inp Stima un modello di regressione per intervallo. Questo modello è adatto al caso in cui la variabile dipendente è osservata in modo imperfetto per alcune osservazioni (o anche tutte). In altre parole, si ipotizza che il processo generatore dei dati sia yt∗ = xt β + t ma che solo mt ≤ yt ≤ Mt sia osservato (l’intervallo può essere limitato a destra o a sinistra). Si noti che per alcune osservazioni m può essere uguale a M. Le variabili var-min e var-max devono contenere valori NA nel caso di osservazioni non limitate a sinistra o a destra. Capitolo 1. Guida ai comandi 25 Il modello è stimato per massima verosimiglianza, ipotizzando la normalità del termine di disturbo. Per impostazione predefinita, gli errori standard sono calcolati usando l’inversa dell’Hessiana. Se si usa l’opzione --robust, vengono calcolati invece gli errori standard QML o Huber–White. In questo caso la matrice di covarianza stimata è un “sandwich” dell’inversa dell’Hessiana stimata e del prodotto esterno del gradiente. Accesso dal menù: /Modello/Modelli non lineari/Regressione per intervalli kpss Argomenti: ordine lista-variabili Opzioni: --trend (include un trend) --verbose (mostra i risultati della regressione) --quiet (non mostra i risultati) --difference (usa la differenza prima della variabile) Esempi: kpss 8 y kpss 4 x1 --trend Calcola il test KPSS (Kwiatkowski, Phillips, Schmidt e Shin, 1992) per la stazionarietà di ognuna delle variabili specificate (o della loro differenza prima, se si usa l’opzione --difference. L’ipotesi nulla è che la variabile in questione sia stazionaria, attorno a un valore fisso o, se è stata usata l’opzione --trend, attorno a un trend deterministico lineare. L’argomento ordine determina la dimensione della finestra usata per il livellamento di Bartlett. Se si usa l’opzione --verbose, vengono mostrati anche i risultati della regressione ausiliaria, insieme alla varianza stimata della componente random walk della variabile. Accesso dal menù: /Variabile/Test KPSS labels Mostra le etichette informative per le variabili generate con il comando genr e quelle aggiunte al dataset attraverso l’interfaccia grafica. lad Argomenti: variabile-dipendente variabili-indipendenti Opzione: --vcv (mostra la matrice di covarianza) Calcola una regressione che minimizza la somma delle deviazioni assolute dei valori stimati dai valori effettivi della variabile dipendente. Le stime dei coefficienti sono derivate usando l’algoritmo del simplesso di Barrodale–Roberts; viene mostrato un messaggio di avvertimento se la soluzione non è unica. Gli errori standard sono derivati usando la procedura bootstrap con 500 estrazioni. La matrice di covarianza per le stime dei parametri, mostrata se si usa l’opzione --vcv, si basa sulla stessa procedura. Accesso dal menù: /Modello/Stima robusta/LAD - Minime deviazioni assolute lags Varianti: lags lista-variabili lags ordine ; lista-variabili Esempi: lags x y lags 12 ; x y Crea delle nuove variabili come valori ritardati di ognuna delle variabili nella lista-variabili. Il numero dei ritardi può essere indicato dal primo parametro opzionale, altrimenti sarà pari alla periodicità del dataset. Ad esempio, se la periodicità è 4 (trimestrale), il comando lags x y crea Capitolo 1. Guida ai comandi x_1 x_2 x_3 x_4 = = = = 26 x(t-1) x(t-2) x(t-3) x(t-4) Il numero dei ritardi creati può essere indicato come primo parametro opzionale. Accesso dal menù: /Aggiungi/Ritardi delle variabili selezionate ldiff Argomento: lista-variabili Calcola la differenza prima del logaritmo naturale di ogni variabile della lista-variabili e la salva in una nuova variabile con il prefisso ld_. Così, ldiff x y crea le nuove variabili ld_x = log(x) - log(x(-1)) ld_y = log(y) - log(y(-1)) Accesso dal menù: /Aggiungi/Differenze logaritmiche leverage Opzione: --save (salva le variabili) Deve seguire immediatamente un comando ols. Calcola il “leverage” (h, compreso tra 0 e 1) di ogni osservazione nel campione su cui è stato stimato il precedente modello. Mostra il residuo (u) per ogni osservazione assieme al leverage corrispondente e a una misura della sua influenza sulla stima: uh/(1 − h). I “punti di leverage” per cui il valore di h supera 2k/n (dove k è il numero dei parametri stimati e n è l’ampiezza del campione) sono indicati con un asterisco. Per i dettagli sui concetti di leverage e influenza, si veda Davidson e MacKinnon (1993, capitolo 2). Vengono mostrati anche i valori DFFITS: questi sono “residui p studentizzati” (ossia i residui previsti, divisi per i propri errori standard) moltiplicati per h/(1 − h). Per una discussione dei residui studentizzati e dei valori DFFITS si veda G. S. Maddala, Introduction to Econometrics, capitolo 12 e anche Belsley, Kuh e Welsch (1980). In breve, i “residui previsti” sono la differenza tra il valore osservato e il valore stimato della variabile dipendente all’osservazione t, ottenuti da una regressione in cui quell’osservazione è stata omessa (oppure in cui è stata aggiunta una variabile dummy che vale 1 solo per l’osservazione t); il residuo studentizzato si ottiene dividendo il residuo previsto per il proprio errore standard. Se si usa l’opzione --save, il leverage, il valore di influenza e il valore DFFITS vengono aggiunti al dataset in uso. Accesso dal menù: Finestra del modello, /Test/LEVERAGE - Osservazioni influenti lmtest Argomento: [ ordine ] Opzioni: --logs (non-linearità, logaritmi) --autocorr (correlazione seriale) --arch (ARCH) --squares (non-linearità, quadrati) --white (eteroschedasticità, test di White) --white-nocross (eteroschedasticità, test di White (solo quadrati)) --breusch-pagan (eteroschedasticità, test di Breusch–Pagan) --robust (stima robusta della varianza per Breusch–Pagan) --panel (eteroschedasticità, a gruppi) --quiet (non mostra la regressione ausiliaria) Capitolo 1. Guida ai comandi 27 Deve seguire immediatamente un comando di stima. A seconda dell’opzione usata, il comando esegue uno dei test seguenti: test dei moltiplicatori di Lagrange per la non-linearità (logaritmi o quadrati), test di White (con o senza i prodotti incrociati) o test di Breusch–Pagan per l’eteroschedasticità, test LMF per la correlazione seriale (si veda Kiviet, 1986) o test per il modello ARCH (Autoregressive Conditional Heteroskedasticity, si veda anche il comando arch). La maggior parte delle opzioni sono disponibili solo per modelli stimati con OLS, ma si veda oltre per alcuni dettagli riguardanti la stima con i minimi quadrati a due stadi. L’argomento opzionale ordine è rilevante solo nel caso si scelga l’opzione --autocorr o l’opzione --arch. Per impostazione predefinita, questi test sono eseguiti usando un ordine di ritardo pari alla periodicità dei dati, ma è possibile anche impostare un ordine di ritardo specifico. L’opzione --robust ha effetto solo se viene scelto il test di Breusch–Pagan; l’effetto è quello di usare lo stimatore robusto per la varianza proposto da Koenker (1981), rendendo il test meno sensibile all’ipotesi di normalità. L’opzione --panel è disponibile solo se il modello viene stimato su dati panel: in questo caso viene eseguito un test per eteroschedasticità a gruppi (ossia per una varianza dell’errore diversa fra le unità cross section). Per impostazione predefinita, il programma mostra la regressione ausiliaria su cui si basa la statistica test, ma è possibile evitarlo usando l’opzione --quiet. La statistica test e il suo p-value possono essere recuperati usando le variabili accessorie $test e $pvalue. Nel caso di modelli stimati col metodo dei minimi quadrati a due stadi (si veda tsls), non è possibile usare il test LM, quindi gretl offre alcuni test equivalenti; in questo caso, l’opzione --autocorr calcola il test di Godfrey per l’autocorrelazione (si veda Godfrey 1994), mentre l’opzione --white produce il test HET1 per l’eteroschedasticità (si veda Pesaran e Taylor 1999). Accesso dal menù: Finestra del modello, /Test logistic Argomenti: variabile-dipendente variabili-indipendenti [ ymax=valore ] Opzione: --vcv (mostra la matrice di covarianza) Esempi: logistic y const x logistic y const x ymax=50 Regressione logistica: esegue una regressione OLS usando la trasformazione logistica sulla variabile dipendente: ! y log y∗ − y La variabile dipendente dev’essere strettamente positiva. Se è una frazione decimale, compresa tra 0 e 1, il valore predefinito per y ∗ (il massimo asintotico della variabile dipendente) è 1. Se la variabile dipendente è una percentuale, compresa tra 0 e 100, il valore predefinito di y ∗ è 100. È possibile indicare un valore diverso per il massimo, usando la sintassi opzionale ymax=valore, che segue la lista dei regressori. Il valore fornito deve essere maggiore di tutti i valori osservati della variabile dipendente. I valori stimati e i residui della regressione sono trasformati automaticamente usando y= y∗ 1 + e−x dove x rappresenta un valore stimato oppure un residuo della regressione OLS, usando la variabile dipendente trasformata. I valori riportati sono dunque confrontabili con la variabile dipendente originale. Si noti che se la variabile dipendente è binaria, occorre usare il comando logit invece di questo comando. Accesso dal menù: /Modello/Modelli non lineari/Logistico Capitolo 1. Guida ai comandi 28 logit Argomenti: variabile-dipendente variabili-indipendenti Opzioni: --robust (errori standard robusti) --vcv (mostra la matrice di covarianza) --verbose (mostra i dettagli delle iterazioni) --p-values (mostra i p-value invece delle pendenze) Se la variabile dipendente è binaria (i suoi valori sono 0 o 1), esegue una stima di massima verosimiglianza dei coefficienti per le variabili-indipendenti con il metodo BRMR (“binary response model regression”) descritto in Davidson e MacKinnon (2004). Visto che il modello è nonlineare, le pendenze dipendono dai valori delle variabili indipendenti: per impostazione predefinita, al posto dei p-value vengono mostrate le pendenze rispetto ad ognuna delle variabili indipendenti, calcolate in corrispondenza della media della variabile. Questo comportamento può essere soppresso usando l’opzione --p-values. La statistica chi-quadro testa l’ipotesi nulla che tutti i coefficienti tranne la costante siano pari a zero. In modalità predefinita, gli errori standard sono calcolati con l’inversa negativa dell’Hessiana. Se si usa l’opzione --robust, verranno calcolati gli errori standard QML o quelli di Huber–White. In questo caso, la matrice di covarianza stimata è un “sandwich” dell’inversa dell’Hessiana stimata e del prodotto esterno del gradiente. Per i dettagli, si veda Davidson e MacKinnon 2004, cap. 10. Se la variabile dipendente non è binaria, ma è discreta, si ottengono stime Logit ordinate. Se la variabile scelta come dipendente non è discreta, viene emesso un messaggio di errore. Per condurre un’analisi delle proporzioni (dove la variabile dipendente è la proporzione dei casi che hanno una certa caratteristica in ogni osservazione, invece che una variabile binaria che indica se la caratteristica è presente o no), non bisogna usare il comando logit, ma occorre costruire la variabile logit come genr lgt_p = log(p/(1 - p)) e usare questa come variabile dipendente in una regressione OLS. Si veda Ramanathan 2002, capitolo 12. Accesso dal menù: /Modello/Modelli non lineari/Logit logs Argomento: lista-variabili Calcola il logaritmo naturale di ognuna delle variabili della lista-variabili e lo salva in una nuova variabile col prefisso l_, ossia una “elle” seguita da un trattino basso. Ad esempio logs x y crea le nuove variabili l_x = ln(x) e l_y = ln(y). Accesso dal menù: /Aggiungi/Logaritmi delle variabili selezionate loop Argomento: controllo Opzioni: --progressive (abilita modalità speciali di alcuni comandi) --verbose (mostra i dettagli dei comandi genr) --quiet (non mostra il numero di iterazioni eseguite) Esempi: loop 1000 loop 1000 --progressive loop while essdiff > .00001 loop i=1991..2000 loop for (r=-.99; r<=.99; r+=.01) loop foreach i xlist Capitolo 1. Guida ai comandi 29 Questo comando apre una modalità speciale, in cui il programma accetta comandi da eseguire più volte. Si esce dalla modalità loop con l’istruzione endloop: solo a questo punto i comandi indicati vengono eseguiti. Il parametro controllo deve assumere uno dei cinque valori mostrati negli esempi: un numero di volte per cui ripetere i comandi all’interno del loop; “while” seguito da una condizione booleana; un intervallo di valori interi per una variabile indice; “for” seguito da tre espressioni tra parentesi, separate da punti e virgola (in modo simile all’istruzione for nel linguaggio di programmazione C); infine, “foreach” seguito da una variabile indice e una lista. Si veda la Guida all’uso di gretl per altri dettagli ed esempi, oltre che per la spiegazione dell’opzione --progressive (che è destinata ad essere usata nelle simulazioni Monte Carlo) e per l’elenco dei comandi di gretl che possono essere usati all’interno di un loop. mahal Argomento: lista-variabili Opzioni: --save (salva le distanze nel dataset) --vcv (mostra la matrice di covarianza) La distanza di Mahalanobis è la distanza tra due punti in uno spazio k-dimensionale, scalata rispetto alla variazione statistica in ogni dimensione dello spazio. Ad esempio, se p e q sono due osservazioni su un insieme di k variabili con matrice di covarianza C, la distanza di Mahalanobis tra le due osservazioni è data da q (p − q)0 C −1 (p − q) dove (p − q) è un vettore a k dimensioni. Se la matrice di covarianza è la matrice identità, la distanza di Mahalanobis corrisponde alla distanza Euclidea. Lo spazio in cui vengono calcolate le distanze è definito dalle variabili selezionate; per ogni osservazione nell’intervallo attuale viene calcolata la distanza tra l’osservazione e il centroide delle variabili selezionate. La distanza è la controparte multidimensionale di uno z-score standard e può essere usata per giudicare se una certa osservazione “appartiene” a un gruppo di altre osservazioni. Se si usa l’opzione --vcv, vengono mostrate la matrice di covarianza e la sua inversa. Se si usa l’opzione --save, le distanze vengono salvate nel dataset con il nome mdist (o mdist1, mdist2 e così via, se esiste già una variabile con quel nome). Accesso dal menù: /Visualizza/Distanze di Mahalanobis meantest Argomenti: var1 var2 Opzione: --unequal-vars (assume varianze diverse) Calcola la statistica t per l’ipotesi nulla che le medie della popolazione siano uguali per le variabili var1 e var2, mostrando il suo p-value. L’impostazione predefinita prevede di assumere che le varianze delle due variabili siano uguali, mentre usando l’opzione --unequal-vars, si assume che esse siano diverse. Questo è rilevante per la statistica test solo se le due variabili contengono un diverso numero di osservazioni valide (non mancanti). Accesso dal menù: /Modello/Modelli bivariati/Differenza delle medie Capitolo 1. Guida ai comandi 30 mle Argomenti: funzione di log-verosimiglianza derivate Opzioni: --quiet (non stampa il modello stimato) --vcv (mostra la matrice di covarianza) --hessian (calcola la matrice di covarianza a partire dall’Hessiana) --robust (matrice di covarianza QML) --verbose (mostra i dettagli delle iterazioni) Esempio: weibull.inp Esegue la stima di massima verosimiglianza (ML, Maximum Likelihood) usando l’algoritmo BFGS (Broyden, Fletcher, Goldfarb, Shanno). Occorre specificare la funzione di log-verosimiglianza e indicare dei valori iniziali per i parametri della funzione (utilizzando il comando genr. Se possibile è consigliabile indicare anche espressioni per le derivate di questa funzione, rispetto ad ognuno dei parametri; se non si indicano le derivate analitiche, verrà calcolata un’approssimazione numerica. Esempio: si supponga di avere una serie X con valori 0 o 1 e di voler ottenere la stima di massima verosimiglianza della probabilità p che X valga 1 (è semplice intuire che la stima ML di p corrisponderà alla proporzione dei valori 1 nel campione). Occorre per prima cosa aggiungere p al dataset e assegnargli un valore iniziale; è possibile farlo nel modo seguente con il comando genr: genr p = 0.5. Quindi costruiamo il blocco di comandi per la stima di massima verosimiglianza: mle loglik = X*log(p) + (1-X)*log(1-p) deriv p = X/p - (1-X)/(1-p) end mle La prima riga specifica la funzione di log-verosimiglianza: inizia con la parola chiave mle, quindi contiene la variabile dipendente e una specificazione per la log-verosimiglianza usando la stessa sintassi del comando genr. La riga seguente (che è opzionale), inizia con la parola chiave deriv e fornisce la derivata della funzione di log-verosimiglianza rispetto al parametro p. Se non vengono indicate derivate, occorre includere una dichiarazione che identifica i parametri liberi (separati da spazi) utilizzando la parola chiave params. Ad esempio si sarebbe potuto scrivere: mle loglik = X*log(p) + (1-X)*log(1-p) params p end mle e in questo caso la derivata verrebbe calcolata numericamente. Si noti che eventuali opzioni vanno indicate nella riga finale del blocco MLE. Per impostazione predefinita, gli errori standard sono basati sul prodotto esterno del gradiente. Se si usa l’opzione --hessian, vengono basati sull’inversa negativa dell’Hessiana (che è approssimata numericamente). Se si usa l’opzione --robust, viene usato uno stimatore QML (ossia, un sandwich dell’inversa negativa dell’Hessiana e della matrice di covarianza del gradiente). Accesso dal menù: /Modello/Massima verosimiglianza modeltab Argomenti: add o show o free Manipola la “tabella modelli” di gretl. Si veda la Guida all’uso di gretl per i dettagli. Le opzioni hanno i seguenti effetti: add aggiunge l’ultimo modello stimato alla tabella modelli, se possibile; show mostra la tabella modelli in una finestra; free pulisce la tabella. Accesso dal menù: Finestra delle icone, Icona Tabella Modelli Capitolo 1. Guida ai comandi 31 modprint Argomenti: matcoeff nomi [ stat ] Stampa la tabella dei coefficienti e le statistiche aggiuntive opzionali per un modello stimato “a mano”. Utile principalmente per le funzioni definite dall’utente. L’argomento matcoeff deve essere una matrice k per 2 che contiene k coefficienti e k errori standard associati, mentre nomi deve essere una stringa che contiene almeno k nomi, separati da virgole, per i coefficienti. L’argomento opzionale stat è un vettore che contiene p statistiche aggiuntive da stampare sotto la tabella dei coefficienti. Se si usa questo argomento, nomi deve contenere k + p stringhe separate da virgola, di cui le ultime p sono associate alle statistiche aggiuntive. mpols Argomenti: variabile-dipendente variabili-indipendenti Opzioni: --vcv (mostra la matrice di covarianza) --simple-print (non mostra le statistiche ausiliarie) --quiet (non mostra i risultati) Calcola le stime OLS per il modello indicato usando aritmetica in virgola mobile a precisione multipla. Questo comando è disponibile solo se gretl è compilato con il supporto per la libreria Gnu Multiple Precision (GMP). Per impostazione predefinita, vengono usati 256 bit di precisione nei calcoli, ma è possibile aumentare questo valore usando la variabile d’ambiente GRETL_MP_BITS. Ad esempio, usando l’interprete dei comandi bash, è possibile aumentare la precisione a 1024 bit eseguendo il comando seguente prima di avviare gretl export GRETL_MP_BITS=1024 Per questo comando è disponibile un’opzione abbastanza speciale (utile soprattutto a scopo di test): se la lista variabili-indipendenti è seguita da un punto e virgola, e da un’ulteriore lista di numeri, questi numeri vengono interpretati come potenze di x da aggiungere alla regressione, dove x è l’ultima variabile della lista variabili-indipendeti. Questi termini addizionali vengono calcolati e memorizzati in precisione multipla. Nell’esempio seguente, y è regredita su x e sulla seconda, terza e quarta potenza di x: mpols y 0 x ; 2 3 4 Accesso dal menù: /Modello/Altri modelli lineari/MPOLS - Minimi quadrati in alta precisione nls Argomenti: funzione [ derivate ] Opzioni: --quiet (non stampa il modello stimato) --robust (errori standard robusti) --vcv (mostra la matrice di covarianza) --verbose (mostra i dettagli delle iterazioni) Esempio: wg_nls.inp Esegue una stima con minimi quadrati non-lineari (NLS: Nonlinear Least Squares) usando una versione modificata dell’algoritmo di Levenberg–Marquardt. Occorre fornire una specificazione di funzione e dichiarare i parametri della funzione (usando il comando genr) prima della stima. Opzionalmente, è anche possibile specificare le espressioni per le derivate della funzione rispetto a ognuno dei parametri. Se non si indicano le derivate, occorre fornire una lista dei parametri da stimare (separati da spazi o virgole), preceduta dalla parola chiave params. In quest’ultimo caso, viene calcolata un’approssimazione numerica del Jacobiano. Capitolo 1. Guida ai comandi 32 È più semplice mostrare il funzionamento con un esempio. Quello che segue è uno script completo per stimare la funzione di consumo non-lineare presentata in Econometric Analysis di William Greene (capitolo 11 della quarta edizione, o capitolo 9 della quinta). I numeri alla sinistra delle righe sono dei punti di riferimento e non fanno parte dei comandi. Si noti che le opzioni, come ad esempio --vcv per mostrare la matrice di covarianza delle stime dei parametri, vanno aggiunte al comando finale end nls. 1 2 3 4 5 6 7 8 9 10 open greene11_3.gdt ols C 0 Y genr a = $coeff(0) genr b = $coeff(Y) genr g = 1.0 nls C = a + b * Y^g deriv a = 1 deriv b = Y^g deriv g = b * Y^g * log(Y) end nls --vcv Spesso è comodo inizializzare i parametri con riferimento a un modello lineare collegato, come è mostrato nelle righe da 2 a 5. I parametri alfa, beta e gamma possono essere impostati a qualunque valore iniziale (non necessariamente sulla base di un modello stimato con OLS), ma la convergenza della procedura NLS non è garantita per qualunque punto di partenza. I veri comandi NLS occupano le righe da 6 a 10. Sulla riga 6 viene dato il comando nls: viene specificata una variabile dipendente, seguita dal segno uguale, seguito da una specificazione di funzione. La sintassi per l’espressione a destra è la stessa usata per il comando genr. Le tre righe successive specificano le derivate della funzione di regressione rispetto a ognuno dei parametri. Ogni riga inizia con il comando deriv, indica il nome di un parametro, il segno di uguale e un’espressione che indica come calcolare la derivata (anche qui la sintassi è la stessa di genr). In alternativa, invece di fornire le derivate, è possibile sostituire le righe dalla 7 alla 9 con la seguente: params a b g La riga 10, end nls, completa il comando ed esegue la stima. Per ulteriori dettagli sulla stima NLS si veda la Guida all’uso di gretl. Accesso dal menù: /Modello/Modelli non lineari/NLS - Minimi quadrati non lineari normtest Argomento: series Opzioni: --dhansen (test Doornik–Hansen) --swilk (test di Shapiro–Wilk) --lillie (test di Lilliefors) --jbera (test di Jarque–Bera) --all (esegue tutti i test) --quiet (non mostra i dettagli dei risultati) Conduce un test di normalità per la serie specificata. Il tipo di test eseguito è determinato dalle opzioni del comando (se non ne viene usata alcuna, viene eseguito il test di Doornik– Hansen). Si noti che il test di Jarque–Bera test, sebbene semplice da calcolare, ha un’accuratezza relativamente bassa in campioni limitati, quindi se ne raccomanda l’uso principalmente a scopo di confronto. La statistica test e il suo p-value possono essere recuperati usando gli accessori $test e $pvalue. Se si usa l’opzione --all, i risultati salvati saranno queslli del test di Doornik–Hansen. Capitolo 1. Guida ai comandi 33 nulldata Argomento: lunghezza-serie Opzione: --preserve (preserva le matrici) Esempio: nulldata 500 Crea un dataset “vuoto”, che contiene solo una costante e una variabile indice, con periodicità 1 e il numero indicato di osservazioni. Ad esempio, è possibile creare un dataset a scopo di simulazione usando alcuni comandi genr (come genr uniform() e genr normal()) per generare dati di prova. Questo comando può essere usato insieme a loop. Si veda anche l’opzione “seed” del comando set. Per impostazione predefinita, questo comando cancella tutti i dati presenti nell’ambiente di lavoro di gretl. Usando l’opzione --preserve, verranno mantenute tutte le matrici attualmente definite. Accesso dal menù: /File/Nuovo dataset ols Argomenti: variabile-dipendente variabili-indipendenti Opzioni: --vcv (mostra la matrice di covarianza) --robust (errori standard robusti) --jackknife (vedi sotto) --simple-print (non mostra le statistiche ausiliarie) --quiet (non mostra i risultati) --anova (stampa una tabella ANOVA) --no-df-corr (sopprime la correzione per i gradi di libertà) --print-final (si veda sotto) Esempi: ols 1 0 2 4 6 7 ols y 0 x1 x2 x3 --vcv ols y 0 x1 x2 x3 --quiet Calcola le stime minimi quadrati ordinari (OLS: Ordinary Least Squares) usando la variabiledipendente e la lista di variabili-indipendenti, che possono essere specificate per nome o numero. Il termine costante può essere indicato usando il numero 0. Oltre alle stime dei coefficienti e agli errori standard, il programma mostra i p-value per le statistiche t (a due code) e F . Un p-value inferiore a 0.01 indica significatività al livello dell’1 per cento ed è denotato con ***. ** indica invece la significatività tra l’1 e il 5 per cento, mentre * indica un livello di significatività tra il 5 e il 10 per cento. Vengono mostrate anche le statistiche di selezione del modello (il criterio di informazione di Akaike, AIC, e il criterio di informazione bayesiana di Schwarz, BIC). La formula usata per AIC è descritta in Akaike (1974), ossia meno due volte la log-verosimiglianza massimizzata più il doppio del numero di parametri stimati. Usando l’opzione --no-df-corr la correzione per i gradi di libertà non viene applicata nel calcolo della varianza stimata dell’errore (e quindi anche dell’errore standard delle stime dei parametri). L’opzione --print-final è utilizzabile solo nel contesto di un loop. L’effetto è quello di eseguire la regressione in modo silenzioso per tutte le iterazioni del loop tranne l’ultima. Si veda la Guida all’uso di gretl per i dettagli. È possibile salvare alcune variabili interne generate durante la stima, usando il comando genr subito dopo questo comando. La formula usata per generare gli errori standard robusti (quando viene usata l’opzione --robust) può essere modificata con il comando set. L’opzione --jackknife equivale a impostare hc_version a 3a, in modo da emulare il vecchio comando hccm. Accesso dal menù: /Modello/OLS - Minimi quadrati ordinari Accesso alternativo: Pulsante Beta-hat sulla barra degli strumenti Capitolo 1. Guida ai comandi 34 omit Argomento: lista-variabili Opzioni: --wald (esegue un test di Wald invece che un test F) --vcv (mostra la matrice di covarianza) --quiet (non mostra le stime per il modello ridotto) --silent (non mostra nulla) --auto[=alpha] (eliminazione sequenziale, si veda oltre) --inst (omette come strumento, solo per TSLS) --both (omette come regressore e come strumento, solo per TSLS) Esempi: omit 5 7 9 omit seasonals --quiet omit --auto omit --auto=0.05 Questo comando deve seguire un comando di stima e calcola un test per la significatività congiunta delle variabili nella lista-variabili, che deve essere un sottoinsieme delle variabili indipendenti del modello stimato in precedenza. In alternativa, se si usa l’opzione --auto viene attivata la procedura di eliminazione sequenziale: ad ogni passo viene omessa la variabile con il p-value più alto, fino a che tutte le variabili restanti hanno un p-value inferiore a una certa soglia. La soglia predefinita è del 10 per cento (con due code), che può essere modificata aggiungendo “=” e un valore tra 0 e 1 (senza spazi), come nel quarto esempio mostrato sopra. Se il modello originale è stato stimato con OLS, la statistica test è un valore F , basato sulle somme dei quadrati dei residui del modello vincolato e di quello originale, a meno che quest’ultimo sia stato stimato usando errori standard robusti. In questo caso, il valore F viene calcolato delle stime robuste della matrice di covarianza del modello originale (è la versione F di un test di Wald). Per gli stimatori diversi da OLS, o se si usa l’opzione --wald, la statistica usata è un valore chi-quadro asintotico di Wald, basato sulla matrice di covarianza del modello originale. Per impostazione predefinita, viene stimato il modello vincolato, vengono mostrate le stime e il modello vincolato rimpiazza quello originale come “modello attuale” nel caso si voglia, ad esempio, recuperare i residui con $uhat (o eseguire test ulteriori, come add o omit). Usando l’opzione Wald, il modello vincolato non viene stimato (quindi il modello attuale non viene rimpiazzato). L’opzione --quiet sopprime la stampa dei risultati del modello vincolato (se esso viene stimato): viene mostrato solo il risultato del test. Se il modello vincolato viene stimato e ne viene chiesta la stampa, l’opzione --vcv ha l’effetto di mostrare la matrice di covarianza dei coefficienti del modello vincolato, altrimenti quest’opzione è ignorata. Se si usa l’opzione --silent, non viene mostrato alcun risultato; tuttavia, i risultati del test possono essere recuperati usando le variabili speciali $test e $pvalue. Se il modello originale è stato stimato con i minimi quadrati a due stadi, può sorgere un’ambiguità: le nuove variabili vanno omesse come regressori, come strumenti o con entrambe le funzioni? Per risolvere l’ambiguità, nella modalità predefinita le variabili sono omesse dall’elenco dei regressori, se si usa l’opzione --inst sono omesse dall’elenco degli strumenti, mentre se si usa l’opzione --both sono rimosse totalmente dal modello. Queste due opzioni sono incompatibili con l’opzione --wald; se uno o più strumenti vengono omessi, il modello va ri-stimato. Accesso dal menù: Finestra del modello, /Test/OMIT - Ometti variabili Capitolo 1. Guida ai comandi 35 open Argomento: file-dati Opzioni: --www (usa un database sul server di gretl) Si veda oltre per le opzioni specifiche per i fogli elettronici Esempi: open data4-1 open voter.dta open fedbog --www Apre un file di dati. Se è già stato aperto un file di dati, esso viene sostituito da quello selezionato. Se non si specifica un percorso completo, il programma cercherà automaticamente il file in alcuni percorsi predefiniti. Se non si specifica un’estensione per il file, come nel primo degli esempi, gretl assume che si tratti di un file di dati standard, con estensione .gdt. A seconda del nome del file e di alcune sue caratteristiche, gretl cerca di indovinare il formato dei dati (standard, testo semplice, CSV, MS Excel, Stata, ecc). Quando si apre un file di un foglio elettronico (Gnumeric, Open Document o XLS), è possibile fornire fino a tre parametri aggiuntivi, oltre al nome del file. Per prima cosa, è possibile selezionare un particolare foglio di lavoro all’interno del file, indicando il suo numero con la sintassi --sheet=2, oppure indicando il suo nome tra virgolette doppie, usando la sintassi --sheet="MacroData". L’impostazione predefinita consiste nel leggere il primo foglio di lavoro del file. È anche possibile specificare la riga/colonna da cui iniziare a leggere, usando la sintassi --coloffset=3 --rowoffset=2 che indica a gretl di ignorare le prime 3 colonne e le prime 2 righe. L’impostazione predefinita consiste nel leggere tutte le celle del foglio, a partire dalla prima in alto a sinistra. Questo comando può essere usato anche per aprire un database (gretl, RATS 4.0 o PcGive) per la lettura. In questo caso, dev’essere seguito dal comando data per estrarre una particolare serie dal database. Se si usa l’opzione www, il programma cercherà di accedere al database specificato sul server di gretl — ad esempio il database Federal Reserve interest rates nel terzo degli esempi visti sopra. Accesso dal menù: /File/Apri dati Accesso alternativo: Trascinare un file di dati in gretl (MS Windows o Gnome) orthdev Argomento: lista-variabili Utilizzabile solo con dati panel. Per ognuna delle variabili nella lista-variabili viene generata una serie di deviazioni ortogonali in avanti, salvata col nome della variabile prefissata da o_. Quindi, orthdev x y crea le nuove variabili o_x e o_y. I valori sono salvati con un periodo di ritardo rispetto alla loro collocazione temporale (ossia, o_x all’osservazione t contiene la deviazione che, in senso stretto, corrisponde al periodo t − 1). Questo comportamento è coerente con quello delle differenze prime: viene persa la prima osservazione di ogni serie, non l’ultima. outfile Argomenti: file-output opzione Opzioni: --append (aggiunge al file) --close (chiude il file) --write (sovrascrive il file) Esempi: outfile --write regress.txt outfile --close Capitolo 1. Guida ai comandi 36 Scrive i risultati sul file-output, fino a nuovo ordine. Usando l’opzione --append, i risultati vengono aggiunti a un file esistente, mentre --write apre un nuovo file (o ne sovrascrive uno esistente). Può essere aperto solo un file alla volta. L’opzione --close può essere usata per chiudere un file di output aperto in precedenza, tornando a scrivere i risultati sul canale predefinito. Nel primo degli esempi precedenti viene aperto il file regress.txt, mentre nel secondo viene chiuso. Se prima del comando --close fosse eseguito un comando ols, i risultati della regressione verrebbero scritti su regress.txt invece che sullo schermo. Esiste una variante: se si usa la parola chiave null al posto di un nome di file insieme all’opzione --write, l’effetto è quello di sopprimere la stampa dei risultati fino alla successiva istruzione outfile --close. panel Opzioni: --vcv (mostra la matrice di covarianza) --fixed-effects (stima con effetti di gruppo fissi) --random-effects (effetti casuali o modello GLS) --between (stima il modello tra i gruppi) --time-dummies (include variabili dummy temporali) --unit-weights (minimi quadrati ponderati) --iterate (stima iterativa) --quiet (mostra meno risultati) --verbose (mostra più risultati) Stima un modello panel, per impostazione predefinita usando lo stimatore a effetti fissi; la stima è implementata sottraendo le medie di gruppo o delle unità dai dati originali. Se si usa l’opzione --random-effects, viene usato il modello GLS a effetti casuali, usando il metodo di Swamy e Arora. In alternativa, con l’opzione --unit-weights, il modello viene stimato con i minimi quadrati ponderati, con i pesi costruiti a partire dalla varianza residua per le rispettive unità cross section nel campione. Solo in questo caso, è possibile usare l’opzione --iterate per produrre stime iterative: nel caso di convergenza, le stime sono di massima verosimiglianza. Come ulteriore alternativa, se si usa l’opzione --between, viene stimato il modello tra i gruppi, ossia una regressione OLS usando le medie dei gruppi. Per maggiori dettagli sulla stima panel, si veda la Guida all’uso di gretl. Accesso dal menù: /Modello/Panel pca Argomento: lista-variabili Opzioni: --covariance (usa la matrice di covarianza) --save (salva le componenti principali) --save-all (salva tutte le componenti) Analisi delle componenti principali. Mostra gli autovalori della matrice di correlazione (o della matrice di covarianza, se si usa l’opzione --covariance) per le variabili nella lista-variabili, insieme alla proporzione della varianza comune spiegata da ogni componente. Mostra anche i corrispondenti autovettori (o “pesi della componente”). Usando l’opzione --save, le componenti con autovalori maggiori di 1.0 vengono salvati nel dataset come variabili, con i nomi PC1, PC2 e così via. Queste variabili artificiali sono definite come la somma del peso della componente moltiplicato per Xi standardizzato, dove Xi denota la i-esima variabile nella lista-variabili. Usando l’opzione --save-all, vengono salvate tutte le componenti, come descritto sopra. Capitolo 1. Guida ai comandi 37 Accesso dal menù: /Visualizza/Componenti principali Accesso alternativo: Pop-up nella finestra principale (selezione multipla) pergm Argomenti: nome-variabile [ banda ] Opzioni: --bartlett (usa la finestra di Bartlett) --log (usa una scala logaritmica) Calcola e mostra (graficamente se non si è in modalità batch) lo spettro della variabile specificata. Per impostazione predefinita viene mostrato il periodogramma nel campione, mentre usando l’opzione --bartlett, lo spettro viene stimato usando una finestra di Bartlett per i ritardi (si veda ad esempio Econometric Analysis di Greene per una discussione su questo argomento). L’ampiezza predefinita della fiestra di Bartlett è pari a due volte la radice quadrata dell’ampiezza campionaria, ma questo valore può essere impostato manualmente usando il parametro banda, fino a un massimo pari a metà dell’ampiezza campionaria. Usando l’opzione --log, lo spettro viene rappresentato su una scala logaritmica. Quando viene mostrato il periodogramma del campione, vengono mostrati anche due test per l’integrazione frazionale (“memoria lunga”) della serie, ossia il test di Geweke e Porter-Hudak (GPH), e lo stimatore locale di Whittle. L’ipotesi nulla in entrambi i casi è che l’ordine di integrazione sia zero. Per impostazione predefinita, l’ordine per questi test è il valore minore tra T /2 e T 0.6 ; anche questo valore può essere modificato con il parametro di banda. Accesso dal menù: /Variabile/Spettro Accesso alternativo: Menù pop-up nella finestra principale (selezione singola) poisson Argomenti: variabile-dipendente variabili-indipendenti [ ; offset ] Opzioni: --vcv (mostra la matrice di covarianza) --verbose (mostra i dettagli delle iterazioni) Esempi: poisson y 0 x1 x2 poisson y 0 x1 x2 ; S Stima una regressione di Poisson, in cui la variabile dipendente rappresenta le occorrenze di un qualche tipo di evento e può assumere solo valori interi non negativi. Se una variabile casuale discreta Y segue la distribuzione di Poisson, Pr(Y = y) = e−v v y y! per y = 0, 1, 2,. . . . La media e la varianza della distribuzione sono entrambe uguali a v. Nel modello di regressione di Poisson, il parametro v è rappresentato da una funzione di una o più varabili indipendenti. La versione più comune del modello (e l’unica supportata da gretl) ha v = exp(β0 + β1 x1 + β2 x2 + · · ·) ossia il logaritmo di v è una funzione lineare delle variabili indipendenti. Opzionalmente è possibile aggiungere una variabile “offset” alla specificazione, ossia una variabile di scala, il cui logaritmo viene aggiunto alla funzione di regressione lineare (con un coefficiente implicito di 1.0). Ciò ha senso se si ipotizza che il numero di occorrenze dell’evento in questione sia proporzionale a qualche fattore noto, a parità di altre condizioni. Ad esempio, il numero di incidenti stradali può essere ipotizzato proporzionale al volume del traffico, che potrebbe essere specificato come una variabile di “offset” in un modello di Poisson per il tasso di incidenti. La variabile di offset dev’essere strettamente positiva. Accesso dal menù: /Modello/Modelli non lineari/Poisson Capitolo 1. Guida ai comandi 38 plot Argomento: lista-variabili Opzione: --one-scale (forza l’uso di un’unica scala) Disegna i valori delle variabili indicate per l’intervallo di osservazioni attuale, usando simboli ASCII. Ogni riga rappresenta un’osservazione e i valori sono disegnati orizzontalmente. Il comportamento predefinito è di scalare la variabili in modo appropriato. Si veda anche gnuplot. print Argomenti: lista-variabili o stringa-letterale Opzioni: --byobs (per osservazione) --long (usa più cifre significative) --no-dates (usa i numeri delle osservazioni) Esempi: print x1 x2 --byobs print Questa è una stringa Se viene indicata una lista-variabili, stampa i valori delle variabili specificate, altrimenti stampa i valori di tutte le variabili nel dataset in uso. Usando l’opzione --byobs i dati vengono stampati per osservazione, altrimenti sono stampati per variabile. Usando l’opzione --long i dati vengono stampati per variabile in notazione scientifica, con una precisione superiore al normale. In questo caso di solito vengono mostrate 10 cifre significative, ma è possibile modificare questo numero con il comando set e l’argomento longdigits. Per avere maggiore controllo sul formato di stampa, si veda printf. Se si usa l’opzione --byobs e i dati sono mostrati per osservazione, il comportamento predefinito è quello di mostrare la data (per serie storiche) o il marcatore (se esiste) all’inizio di ogni riga. L’opzione --no-dates sopprime la visualizzazione delle date o dei marcatori: viene mostrato solo un semplice numero di osservazione. Se l’argomento di print è una stringa letterale (che deve iniziare con le virgolette doppie ), la stringa viene stampata così come è stata indicata. Si veda anche printf. Nota: c’è un “trucco” con questo comando, usando l’opzione --byobs, che può essere utile quando si lavora su un dataset con valori mancanti. Se si fornisce una lista di variabili seguite da un punto e virgola e da una variabile finale, la variabile finale non viene mostrata, ma viene usata per selezionare le osservazioni da mostrare. Le osservazioni per cui la variabile finale assume valore 0 non verranno mostrate. Ad esempio, si supponga di avere la serie giornaliera x e di volere la lista delle date per cui x ha valori mancanti. Si può procedere nel modo seguente: genr filt = missing(x) print x ; filt --byobs Accesso dal menù: /Dati/Mostra valori printf Argomenti: formato , argomenti Stampa valori scalari, serie, matrici o stringhe formattandoli secondo le indicazioni di una stringa di formato (che supporta un piccolo sottoinsieme del comando printf() del linguaggio di programmazione C). I formati numerici riconosciuti sono %e, %E, %f, %g, %G e %d, con i vari modificatori disponibili in C. Esempi: la stringa di formato %.10g stampa un valore con 10 cifre significative; %12.6f stampa un valore con 6 cifre decimali e una larghezza di 12 caratteri. Per formattare le stringhe occorre usare la stringa di formato %s. La stringa di formato deve essere racchiusa tra virgolette doppie, i valori da stampare devono seguire la stringa di formato, separati da virgole. I valori possono avere tre forme: a) nomi di variabili; b) espressioni valide per il comando genr; c) le funzioni speciali varname() o date(). L’esempio seguente stampa i valori di due variabili e quello di un’espressione calcolata: Capitolo 1. Guida ai comandi 39 ols 1 0 2 3 genr b = $coeff(2) genr se_b = $stderr(2) printf "b = %.8g, standard error %.8g, t = %.4f\n", b, se_b, b/se_b Le prossime righe mostrano l’uso delle funzioni varname e date, che rispettivamente mostrano il nome di una variabile dato il suo numero identificativo, e una stringa data, dato un numero di osservazione. printf "Il nome della variabile %d è %s\n", i, varname(i) printf "La data dell’osservazione %d è %s\n", j, date(j) Se si usa un argomento matrice insieme a un formato numerico, l’intera matrice verrà stampata usando per ogni elemento il formato numerico indicato. La stessa cosa vale per le serie, tranne per il fatto che l’intervallo di valori stampato è controllato dall’impostazione del campione corrente. La lunghezza massima di una stringa di formato è di 127 caratteri. Vengono riconosciute le sequenze di escape \n (newline), \t (tab), \v (tab verticale) e \\ (barra inversa). Per stampare un segno di percentuale, si usi %%. Come in C, i valori numerici che fanno parte del formato (larghezza e precisione) possono essere dati direttamente come numeri, come in %10.4f, o come variabili. Nell’ultimo caso, si inseriscono asterischi nella stringa di formato e si forniscono nell’ordine gli argomenti corrispondenti. Ad esempio: scalar larghezza = 12 scalar precisione = 6 printf "x = %*.*f\n", larghezza, precisione, x probit Argomenti: variabile-dipendente variabili-indipendenti Opzioni: --robust (errori standard robusti) --vcv (mostra la matrice di covarianza) --verbose (mostra i dettagli delle iterazioni) --p-values (mostra i p-value invece delle pendenze) Se la variabile dipendente è binaria (tutti i suoi valori sono 0 o 1), esegue una stima di massima verosimiglianza dei coefficienti delle variabili-indipendenti con il metodo “binary response model regression” (BRMR) descritto in Davidson e MacKinnon (2004). Visto che il modello è nonlineare, le pendenze dipendono dai valori delle variabili indipendenti: per impostazione predefinita, al posto dei p-value vengono mostrate le pendenze rispetto ad ognuna delle variabili indipendenti, calcolate in corrispondenza della media della variabile. Questo comportamento può essere soppresso usando l’opzione --p-values. La statistica chi-quadro testa l’ipotesi nulla che tutti i coefficienti tranne la costante siano pari a zero. In modalità predefinita, gli errori standard sono calcolati con l’inversa negativa dell’Hessiana. Se si usa l’opzione --robust, verranno calcolati gli errori standard QML o quelli di Huber–White. In questo caso, la matrice di covarianza stimata è un “sandwich” dell’inversa dell’Hessiana stimata e del prodotto esterno del gradiente. Per i dettagli, si veda Davidson e MacKinnon 2004, cap. 10. Se la variabile dipendente non è binaria, ma è discreta, si ottengono stime Logit ordinate. Se la variabile scelta come dipendente non è discreta, viene emesso un messaggio di errore. Il probit per l’analisi delle proporzioni non è ancora stato implementato in gretl. Accesso dal menù: /Modello/Modelli non lineari/Probit Capitolo 1. Guida ai comandi 40 pvalue Argomenti: distribuzione [ parametri ] valore-x Esempi: pvalue z zscore pvalue t 25 3.0 pvalue X 3 5.6 pvalue F 4 58 fval pvalue G forma scala x pvalue B bprob 10 6 pvalue P lambda x pvalue W shape scale x Calcola l’area alla destra del valore-x nella distribuzione indicata (z per la Gaussiana, t per la t di Student, X per la chi-quadro, F per la F , G per la gamma, B per la binomiale, P per la Poisson e W for Weibull). A seconda della distribuzione, occorre fornire le seguenti informazioni, prima del valore-x: per le distribuzioni t e chi-quadro occorre indicare i gradi di libertà; per la F sono richiesti i gradi di libertà al numeratore e al denominatore; per la gamma sono richiesti il parametro di forma e quello di scala; per la binomiale sono richieste la probabilità di “successo” e il numero di prove; per la distribuzione di Poisson va indicato il parametro λ (che rappresenta sia la media che la varianza); per la distribuzione Weibull, i parametri di forma e scala. Come si vede dagli esempi precedenti, gli argomenti numerici possono essere indicati sotto forma di numero o come nomi di variabili. Si noti che talvolta la distribuzione gamma viene caratterizzata dai parametri di media e varianza, invece che da quelli di forma e scala. La media è il prodotto di forma e scala, mentre la varianza è il prodotto tra la forma e il quadrato della scala. Quindi la scala si può ottenere come la varianza divisa per la media, mentre la forma come la media divisa per la scala. Accesso dal menù: /Strumenti/Calcola p-value qlrtest Per un modello stimato con OLS su serie storiche, esegue il test del rapporto di verosimiglianza di Quandt (QLR) per un break strutturale in un punto incognito del campione, escludendo il 15all’inizio e ella fine del campione. Per ogni possibile punto di rottura compreso nel 70osservazioni, viene eseguito un test di Chow (si veda chow). La statistica del test QLR è il massimo dei valori F di questi test; segue una distribuzione non standard, i cui valori critici sono presi da Introduction to Econometrics di Stock e Watson (2003). Se la statistica QLR eccede il valore critico per un dato livello di significatività, è possibile inferire che i parametri del modello non sono costanti. Questa statistica può essere usata per riconoscere forme di instabilità diverse da un singolo punto di rottura, ad esempio più punti di rottura o un lento cambiamento dei parametri. Accesso dal menù: Finestra del modello, /Test/QLR quantreg Argomenti: tau variabile-dipendente variabili-indipendenti Opzioni: --robust (errori standard robusti) --intervals[=level] (calcola gli intervalli di confidenza) --vcv (mostra la matrice di covarianza) Esempi: quantreg 0.25 y 0 xlist quantreg 0.5 y 0 xlist --intervals quantreg 0.5 y 0 xlist --intervals=.95 quantreg tauvec y 0 xlist --robust Vedi anche mrw_qr.inp Capitolo 1. Guida ai comandi 41 Regressione quantile. Il primo argomento, tau, è il quantile condizionale per cui si desiderano le stime. Può essere un valore numerico o il nome di una variabile scalare predefinita; il valore deve essere compreso nell’intervallo da 0.01 a 0.99 (in alternativa, può essere indicato un vettore di valori, si veda sotto per i dettagli). Gli argomenti dal secondo in poi compongono un elenco di regressori sul modello di quello usato in ols. Senza l’opzione --intervals, vengono mostrati gli errori standard per le stime quantili; questi sono calcolati con la formula asintotica di Koenker e Bassett (1978), ma se si usa l’opzione --robust, verrà usata la variante robusta per l’eteroschedasticità di Koenker e Zhao (1994). Se si usa l’opzione --intervals, gretl calcolerà gli intervalli di confidenza invece degli errori standard. Questi intervalli sono calcolati col metodo dell’inversione del rango e in generale sono asimmetrici rispetto alle stime puntuali dei parametri. Se non si usa l’opzione “–robust”, gli intervalli sono calcolati nell’ipotesi di errori IID (Koenker, 1994), mentre se viene indicata, sono calcolati con lo stimatore robusto sviluppato da Koenker e Machado (1999). Per impostazione predefinita vengono prodotti intervalli di confidenza al 90forma di frazione decimale), aggiungendolo all’opzione, come in --intervals=0.95. Invece di indicare tau come uno scalare, è possibile usare un vettore, indicando il nome di una matrice predefinita. In questo caso le stime vengono eseguite per tutti i valori di tau, e i risultati mostrano la sequenza delle stime quantili per ognuno dei regressori. Accesso dal menù: /Modello/Stima robusta/Regressione quantile quit Esce dal programma, dando la possibilità di salvare i risultati della sessione. Accesso dal menù: /File/Esci rename Varianti: rename numero-var nuovo-nome rename nome-var nuovo-nome Modifica il nome di una variabile con numero identificativo numero-var o nome nome-var in nuovo-nome. Il numero-var deve essere compreso tra 1 e il numero di variabili nel dataset. Il nuovo nome deve essere lungo al massimo 15 caratteri, deve iniziare con una lettera e deve essere composto di sole lettere, numeri e il carattere trattino basso. Accesso dal menù: /Variabile/Modifica attributi Accesso alternativo: Menù pop-up nella finestra principale (selezione singola) reset Opzioni: --quiet (non mostra la regressione ausiliaria) --squares-only (calcola il test coi soli quadrati) --cubes-only (calcola il test coi soli cubi) Va eseguito dopo la stima di un modello via OLS. Esegue il test RESET di Ramsey per la specificazione del modello (non-linearità), aggiungendo alla regressione il quadrato e/o il cubo dei valori stimati (a meno che non siano specificate le opzioni --squares-only o --cubes-only) e calcolando la statistica F per l’ipotesi nulla che i coefficienti dei due termini aggiunti siano pari a zero. Vengono aggiunti sia i quadrati che i cubi, a meno che siano usate le opzioni --squares-only o --cubes-only. Accesso dal menù: Finestra del modello, /Test/RESET - Ramsey Capitolo 1. Guida ai comandi 42 restrict Impone un insieme di vincoli lineari sull’ultimo modello stimato o su un sistema di equazioni definito in precedenza. La sintassi del comando è leggermente diversa in ognuno dei due casi. In entrambi i casi, l’insieme di vincoli deve essere racchiuso tra i comandi “restrict” e “end restrict”. Nel caso della singola equazione, i vincoli sono applicati implicitamente all’ultimo modello e vengono valutati appena viene terminato il comando “restrict”. Nel caso del sistema, il comando iniziale “restrict” deve essere seguito immediatamente dal nome di un sistema di equazioni definito in precedenza (si veda system). I vincoli vengono valutati nella successiva stima del sistema effettuata con il comando estimate. Ogni vincolo nell’insieme va indicato sotto forma di equazione con una combinazione lineare dei parametri al primo membro e un valore numerico al secondo. Nel caso della singola equazione, i parametri sono indicati con la sintassi b[i], dove i rappresenta la posizione nella lista dei regressori, a partire da uno, oppure con b[variabile], dove variabile è il nome del regressore in questione. estion. Nel caso del sistema, i parametri vengono indicati con la sintassi b seguita da due numeri tra parentesi quadre. Il primo numero rappresenta la posizione dell’equazione all’interno del sistema, mentre il secondo indica la posizione nella lista dei regressori. Ad esempio b[2,1] indica il primo parametro della seconda equazione, mentre b[3,2] il secondo parametro della terza equazione. I termini b nell’equazione che rappresenta un vincolo possono essere prefissati da un moltiplicatore numerico, usando il segno * per indicare la moltiplicazione, ad esempio 3.5*b[4]. Ecco un esempio di un insieme di vincoli per un modello stimato in precedenza: restrict b[1] = 0 b[2] - b[3] = 0 b[4] + 2*b[5] = 1 end restrict Ed ecco un esempio di un insieme di vincoli da applicare a un sistema (se il nome del sistema non contiene spazi, è possibile tralasciare le virgolette). restrict "Sistema 1" b[1,1] = 0 b[1,2] - b[2,2] = 0 b[3,4] + 2*b[3,5] = 1 end restrict Nel caso dell’equazione singola, i vincoli sono valutati attraverso un test F di Wald, usando la matrice di covarianza dei coefficienti del modello in questione. In modalità predefinita vengono mostrate le stime dei coefficienti vincolati; se si desidera solo la statistica test, basta aggiungere l’opzione --quiet al comando restrict iniziale. Nel caso del sistema, la statistica test dipende dallo stimatore scelto: un test del rapporto di verosimiglianza nel caso di un sistema stimato con un metodo di massima verosimiglianza, o un test F asintotico negli altri casi. Accesso dal menù: Modello, /Test/Vincoli lineari rmplot Argomento: nome-variabile Grafici Range–mean: questo comando crea un semplice grafico che aiuta a capire se una serie storica y(t) ha varianza costante o no. L’intero campione t=1,...,T viene diviso in piccoli sottocampioni di dimensione arbitraria k. Il primo sotto-campione è formato da y(1), ... ,y(k), il secondo da y(k+1), ... , y(2k), e così via. Per ogni sotto-campione, vengono calcolati la media e il campo di variazione (range: il valore massimo meno quello minimo) e viene costruito un grafico con le medie sull’asse orizzontale e i campi di variazione su quello verticale, in modo Capitolo 1. Guida ai comandi 43 che ogni sotto-campione sia rappresentato da un punto sul piano. Se la varianza della serie è costante, ci si aspetta che il campo di variazione del sotto-campione sia indipendente dalla media del sotto-campione; se i punti si dispongono su una linea crescente, la varianza della serie cresce al crescere della media, viceversa se i punti si dispongono su una linea decrescente. Oltre al grafico, gretl mostra anche le medie e i campi di variazione per ogni sotto-campione, insieme al coefficiente di pendenza della regressione OLS del campo di variazione sulla media e il p-value per l’ipotesi nulla che la pendenza sia zero. Se il coefficiente di pendenza è significativo al livello del 10 per cento, viene mostrata sul grafico la linea stimata della regressione del campo di variazione sulla media. Accesso dal menù: /Variabile/Grafico range-mean run Argomento: file-input Esegue i comandi nel file-input e restituisce il controllo al prompt interattivo. Questo comando si intende usato con il programma a riga di comando gretlcli, o con il “terminale di gretl” nel programma con interfaccia grafica. Si veda anche include. Accesso dal menù: Icona Esegui nella finestra comandi runs Argomento: nome-variabile Opzioni: --difference (usa la differenza prima della variabile) --equal (i valori positivi e negativi sono equiprobabili) Esegue il test non parametrico “delle successioni” per la casualità della variabile specificata, dove le successioni sono definite come sequenze di valori consecutivi positivi o negativi. Ad esempio, per testare la casualità delle deviazioni dalla mediana per una variabile chiamata x1, con una mediana diversa da zero, eseguire i comandi seguenti: genr signx1 = x1 - median(x1) runs signx1 Se si usa l’opzione --difference, la variabile viene differenziata prima dell’analisi, quindi le successioni sono interpretabili come sequenze di incrementi o decrementi consecutivi nel valore della variabile. Se si usa l’opzione --equal, l’ipotesi nulla incorpora l’assunzione che i valori positivi e negativi siano equiprobabili, altrimenti la statistica test è invariante rispetto all’“equilibrio” del processo che genera la sequenza, focalizzandosi solo sull’indipendenza. Accesso dal menù: /Strumenti/Test non parametrici scatters Argomenti: variabile-y ; lista-variabili-x o lista-variabili-y ; variabile-x Opzione: --with-lines (crea grafici lineari) Esempi: scatters 1 ; 2 3 4 5 scatters 1 2 3 4 5 6 ; 7 Produce grafici della variabile-y rispetto ad ognuna delle variabili nella lista-variabili-x, oppure di tutte le variabili nella lista-variabili-y rispetto alla variabile-x. Il primo esempio visto sopra assegna la variabile 1 all’asse y e produce quattro grafici, il primo con la variabile 2 sull’asse x, il secondo con la variabile 3 sull’asse x, e così via. Il secondo esempio rappresenta ognuna delle variabili da 1 a 6 rispetto alla variabile 7 sull’asse x. Questi gruppi di grafici sono utili nell’analisi esplorativa dei dati. È possibile creare fino a sei grafici alla volta, eventuali variabili in sovrappiù saranno ignorate. Capitolo 1. Guida ai comandi 44 Per impostazione predefinita vengono prodotti dei classici grafici a dispersione, ma se si usa l’opzione --with-lines vengono mostrate anche le linee di collegamento tra i punti del grafico. Accesso dal menù: /Visualizza/Grafici multipli sdiff Argomento: lista-variabili Calcola la differenza stagionale di ogni variabile della lista-variabili e salva il risultato in una nuova variabile con il prefisso sd_. Il comando è disponibile solo per serie storiche stagionali. Accesso dal menù: /Aggiungi/Differenze stagionali set Argomenti: variabile valore Esempi: set svd on set csv_delim tab set horizon 10 Imposta i valori di vari parametri del programma. Il valore impostato rimane in vigore per la durata della sessione di gretl, a meno di non essere modificato da un ulteriore esecuzione del comando set. I parametri che possono essere impostati in questo modo sono elencati di seguito. Si noti che le impostazioni di hac_lag, hc_version e hac_kernel sono usate quando viene data l’opzione --robust a un comando di stima. Un uso speciale di questo comando è set stopwatch. In questo modo viene avviata la misurazione del tempo della CPU, che viene fermata la prima volta che viene usata la variabile accessoria $stopwatch, ad esempio assegnandola a un’altra variabile, oppure stampandola. $stopwatch conterrà il numero di secondi usati dalla CPU, dal momento in cui è stato dato il comando set stopwatch. Se il comando set è usato senza parametri, vengono mostrate le impostazioni attuali per tutti i parametri rilevanti. Le impostazioni disponibili sono raggruppate in sei categorie: interazione col programma, metodi numerici, generazione di numeri casuali, stima robusta, filtri e stima di modelli per serie storiche. Interazione con il programma Queste impostazioni servono per controllare vari aspetti del modo in cui gretl interagisce con l’utente. • csv_delim: comma (virgola, valore predefinito), space (spazio), o tab. Imposta il delimitatore di colonna usato nel salvataggio di dati su file in formato CSV. • echo: off o on (valore predefinito). Sopprime o ripristina l’indicazione dei comandi eseguiti nell’output dei risultati. • force_decpoint: on o off (valore predefinito). Forza gretl a usare il carattere punto come separatore decimale, in un ambiente in cui il separatore standard è un’altro carattere (tipicamente la virgola). • halt_on_error: off o on (valore predefinito). Quando è attivo, se si verifica un errore all’interno di un loop, questo si interromperà. Se si usa il client a riga di comando, il programma terminerà. • longdigits: un valore intero positivo, minore o uguale a 20. Determina il numero di cifre usate per mostrare i valori delle variabili quando viene usata l’opzione --long (si veda print). Capitolo 1. Guida ai comandi 45 • loop_maxiter: un valore intero positivo. Imposta il numero massimo di iterazioni consentite prima che un loop di tipo while si fermi (si veda loop). Si noti che questa impostazione riguarda solo la variante while, visto che lo scopo è quello di interrompere possibili cicli infiniti. • max_verbose: on o off (valore predefinito). Attiva l’output aggiuntivo per la funzione BFGSmax (si veda la Guida all’uso per i dettagli). • messages: off o on (valore predefinito). Sopprime o ripristina l’indicazione dei messaggi informativi associati a vari comandi, ad esempio quando viene generata una nuova variabile o viene modificato l’intervallo del campione. • debug: 1, 2 o 0 (valore predefinito). Da usare per le funzioni definite dall’utente. Impostare debug a 1 equivale a impostare messages in tutte queste funzioni; impostando la variabile a 2 ha l’effetto aggiuntivo di impostare max_verbose in tutte le funzioni. • shell_ok: on o off (valore predefinito). Abilita l’esecuzione di programmi esterni da gretl attraverso la shell di sistema. Per motivi di sicurezza, la funzione è disabilitata per impostazione predefinita; inoltre è possibile abilitarla solo tramite l’interfaccia grafica (Strumenti/Preferenze/Generali). Una volta abilitata, l’impostazione rimarrà attiva per le successive sessioni, fino a che non sarà disabilitata esplicitamente. • shelldir: percorso. Imposta la directory di lavoro attuale per i comandi shell. • use_cwd: on o off (valore predefinito). Questa impostazione modifica il comportamento dei comandi outfile e store, che scrivono su file esterni. Normalmente, il file verrà scritto nella directory dati predefinita dell’utente: se si imposta use_cwd a on, al contrario, il file verrà creato nella directory di lavoro da cui gretl è stato eseguito. Metodi numerici Queste impostazioni vengono usate per controllare gli algoritmi numerici usati da gretl per la stima. • bhhh_maxiter: un intero. Imposta il massimo numero di iterazioni per la routine BHHH, che è usata dal comando arma. Se non viene raggiunta la convergenza dopo bhhh_maxiter, il programma segnala un errore. Il valore predefinito è 500. • bhhh_toler: un valore a virgola mobile, oppure la stringa default. Viene usato dalla routine BHHH di gretl per controllare se viene raggiunta la convergenza. L’algoritmo di calcolo ferma le iterazioni non appena l’incremento nella log-verosimiglianza tra le iterazioni è minore di bhhh_toler. Il valore predefinito è 1.0E−06; questo valore può essere reimpostato usando la stringa default invece di un valore numerico. • bfgs_maxiter: un valore intero. Rappresenta il massimo numero di iterazioni per la routine BFGS di gretl, usata da mle, gmm e altri stimatori. Se non si raggiunge la convergenza nel numero specificato di iterazioni, il programma produce un messaggio di errore. Il valore predefinito dipende dal contesto, ma tipicamente è nell’ordine delle 500 iterazioni. • bfgs_toler: un valore in virgola mobile, o la stringa default. Viene usato nella routine BFGS di gretl per controllare se si è raggiunta la convergenza. L’algoritmo si ferma appena l’incremento relativo nella funzione obiettivo tra un’iterazione e l’altra è minore di bfgs_toler. Il valore predefinito è pari alla precisione della macchina elevata alla potenza 3/4; questo valore può essere re-impostato usando la stringa default invece di un valore numerico. • initvals: una matrice pre-specificata. Permette di impostare manualmente le stime dei parametri ARMA. Per i dettagli, si veda la Guida all’uso di gretl. • lbfgs: on o off (valore predefinito). Usa la versione a memoria limitata di BFGS, al posto dell’algoritmo standard. Può essere vantaggioso quando la funzione da massimizzare non è globalmente concava. Capitolo 1. Guida ai comandi 46 • nls_toler: un valore in virgola mobile (il valore predefinito è pari alla precisione della macchina elevata alla potenza 3/4). Imposta la tolleranza usata per stabilire se è stata raggiunta la convergenza nelle procedure iterative di stima con i minimi quadrati non lineari usate dal comando nls. • svd: on o off (valore predefinito). Usa la decomposizione SVD invece di quella di Cholesky o della QR nel calcolo delle stime OLS. Questa opzione si applica alla funzione mols e a vari altri calcoli eseguiti internamente, ma non al comando ols. • fcp: on o off (valore predefinito). Usa l’algoritmo di Fiorentini, Calzolari e Panattoni al posto del codice interno di gretl per calcolare le stime GARCH. Generazione di numeri casuali • seed: un intero senza segno. Imposta il seme per il generatore di numeri pseudo-casuali. Di solito il seme viene impostato a partire dall’ora di sistema, ma se si intende generare sequenze ripetibili di numeri casuali occorre impostare il seme manualmente. Stima robusta • bootrep: un intero. Imposta il numero di replicazioni per il comando restrict con l’opzione --bootstrap. • garch_vcv: unset, hessian, im (matrice di informazione) , op (matrice dei prodotti esterni), qml (stimatore QML), bw (Bollerslev–Wooldridge). Specifica la variante da usare per stimare la matrice di covarianza dei coefficienti nei modelli GARCH. Se si usa unset (valore predefinito), viene usata l’Hessiana, a meno di usare l’opzione “robust” col comando garch, nel qual caso viene usato QML. • arma_vcv: hessian (predefinito) o op (prodotto esterno). Specifica la variante da usare per calcolare la matrice di covarianza per i modelli ARIMA. • force_hc: off (predefinito) o on. Lo stimatore HAC viene usato in modo predefinito con dati serie storiche e quando si usa l’opzione --robust di ols. Impostando invece force_hc a “on”, si forza l’uso della matrice di covarianza coerente con l’eteroschedasticità (che non tiene conto dell’autocorrelazione). • hac_lag: nw1 (valore predefinito), nw2, nw3, o un intero. Imposta il massimo valore di ritardo, o la larghezza di banda, p, usato nel calcolo degli errori standard HAC (Heteroskedasticity and Autocorrelation Consistent) con l’approccio Newey-West, per le serie storiche. nw1 e nw2 rappresentano due varianti di calcolo automatico basate sulla dimensione del campione, T : per nw1, p = 0.75 × T 1/3 , e per nw2, p = 4 × (T /100)2/9 . nw3 permette di selezionare la larghezza di banda basandosi sui dati. Si veda anche qs_bandwidth e hac_prewhiten. • hac_kernel: bartlett (valore predefinito), parzen, o qs (Quadratic Spectral). Imposta il kernel, o struttura di pesi, usato nel calcolo degli errori standard HAC. • hac_prewhiten: on o off (valore predefinito). Usa le procedure di “prewhitening” e “recoloring” di Andrews-Monahan nel calcolo degli errori standard HAC. Questo comporta anche la selezione della larghezza di banda basata sui dati. • hc_version: 0 (valore predefinito), 1, 2, 3 o 3a. Imposta la variante da usare nel calcolo degli errori standard HAC (Heteroskedasticity and Autocorrelation Consistent) con dati di tipo cross section. Le prime 4 opzioni corrispondono alle HC0, HC1, HC2 e HC3 discusse da Davidson e MacKinnon nel capitolo 5 di Econometric Theory and Methods. HC0 produce quelli che di solito vengono chiamati “errori standard di White”. La variante 3a è la procedura “jackknife” di MacKinnon–White. • pcse: off (impostazione predefinita) o on. Di solito, quando si stima un modello con pooled OLS su dati panel usando l’opzione --robust, viene usato lo stimatore di Arellano per la matrice di covarianza. Se si imposta pcse a “on”, verranno usati i Panel Corrected Standard Errors (PCSE) di Beck e Katz, che non tengono conto dell’autocorrelazione. Capitolo 1. Guida ai comandi 47 • qs_bandwidth: larghezza di banda per la stima HAC nel caso in cui si scelga il kernel Quadratic Spectral (a differenza dei kernel Bartlett e Parzen, la larghezza di banda QS non deve essere necessariamente un intero). Filtri • hp_lambda: auto (valore predefinito), o un valore numerico. Imposta il parametro di livellamento per il filtro di Hodrick–Prescott (si veda la funzione hpfilt sotto il comando genr). Il valore predefinito è 100 volte il quadrato della periodicità, ossia 100 per i dati annuali, 1600 per i dati trimestrali e così via. • bkbp_limits: due interi, il secondo maggiore del primo (i valori predefiniti sono 8 e 32). Imposta i limiti di frequenza per il filtro passa-banda di Baxter–King (si veda la funzione bkfilt nel comando genr). • bkbp_k: un intero (il valore predefinito è 8). Imposta l’ordine di approssimazione per il filtro passa-banda di Baxter–King. Serie storiche • horizon: un intero (il valore predefinito dipende dalla frequenza dei dati). Imposta l’orizzonte per le funzioni impulso-risposta e per la decomposizione della varianza nel contesto delle autoregressioni vettoriali. • vecm_norm: phillips (valore predefinito), diag, first o none. Usato nel contesto della stima VECM, attraverso il comando vecm per identificare i vettori di cointegrazione. Si veda la Guida all’uso per i dettagli. setinfo Argomenti: nome-variabile -d descrizione -n nome-grafici Opzioni: --discrete (marca la variabile come discreta) --continuous (marca la variabile come continua) Esempi: setinfo x1 -d Descrizione di x1 -n Nome nei grafici setinfo z --discrete Imposta fino a tre attributi di una variabile, nel modo seguente. Usando l’opzione -d seguita da una stringa tra virgolette doppie, la stringa verrà usata come etichetta descrittiva per la variabile indicata, che viene mostrata dal comando labels e anche nella finestra principale del programma. Usando l’opzione -n seguita da una stringa tra virgolette doppie, la stringa verrà usata nei grafici al posto del nome della variabile. Usando una delle opzioni --discrete o --continuous, viene impostato il carattere numerico della variabile. In modalità predefinita, tutte le variabili sono considerate come continue; marcando una variabile come discreta, essa viene trattata in modo speciale nei diagrammi di frequenza. Accesso dal menù: /Variabile/Modifica attributi Accesso alternativo: Menù pop-up nella finestra principale Capitolo 1. Guida ai comandi 48 setobs Varianti: setobs periodicità oss-iniziale setobs variabile-unità variabile-periodi Opzioni: --cross-section (interpreta come cross section) --time-series (interpreta come serie storiche) --stacked-cross-section (interpreta come panel) --stacked-time-series (interpreta come panel) --panel-vars (usa variabili indice (si veda oltre)) Esempi: setobs 4 1990:1 --time-series setobs 12 1978:03 setobs 1 1 --cross-section setobs 20 1:1 --stacked-time-series setobs unita anno --panel-vars Forza il programma a interpretare il dataset in uso secondo la struttura specificata. Nella prima forma del comando, la periodicità, che deve essere un valore intero, nel caso delle serie storiche rappresenta la frequenza delle osservazioni (1 = annuale; 4 = trimestrale; 12 = mensile; 52 = settimanale; 5, 6, o 7 = giornaliera; 24 = oraria). Nel caso di dati panel, la periodicità è il numero di righe per ogni blocco di dati, ossia il numero di unità cross section se i dati sono organizzati come pila di dati cross section, o il numero di periodi se i dati sono organizzati come pila di serie storiche. Nel caso di semplici dati cross section, la periodicità dev’essere impostata a 1. L’osservazione iniziale rappresenta la data iniziale nel caso delle serie storiche. Gli anni possono essere indicati con due o quattro cifre, mentre i sotto-periodi (ad esempio i trimestri o i mesi) devono essere separati dagli anni con un carattere due punti. Nel caso di dati panel, l’osservazione iniziale va indicata come 1:1, mentre nel caso di dati cross section come 1. L’osservazione iniziale per i dati giornalieri o settimanali va indicata nella forma AA/MM/GG o AAAA/MM/GG (oppure semplicemente 1 per i dati non datati). La seconda forma del comando (che richiede l’uso dell’opzione --panel-vars) può essere usata per imporre un’interpretazione panel dei dati, quando il dataset contiene variabili che identificano in modo univoco le unità cross section e i periodi. Il dataset verrà ordinato come pila di serie storiche, per valori crescenti della variabile che rappresenta le unità, variabile-unità. Se non viene usata nessuna opzione per indicare esplicitamente la struttura dei dati, il programma cercherà di riconoscerla automaticamente a partire dalle informazioni indicate. Accesso dal menù: Dati/Struttura dataset setmiss Argomenti: valore [ lista-variabili ] Esempi: setmiss -1 setmiss 100 x2 Imposta il programma in modo da interpretare un dato valore numerico (il primo parametro indicato al comando) come codice per i “valori mancanti” nei dati importati. Se questo valore è l’unico parametro fornito, come nel primo degli esempi precedenti, l’interpretazione verrà applicata a tutte le serie del dataset. Se valore è seguito da una lista di variabili, indicate per nome o numero, l’interpretazione è limitata solo alle variabili specificate. Così, nel secondo esempio, il valore 100 è interpretato come codice per “mancante”, ma solo per la variabile x2. Accesso dal menù: /Campione/Imposta codice valori mancanti Capitolo 1. Guida ai comandi 49 shell Argomento: comando-shell Esempi: ! ls -al ! notepad launch notepad Un !, o la parola chiave launch, all’inizio di una riga di comando è interpretato come passaggio all’interprete di comandi (shell) usato dall’utente nel sistema operativo. In questo modo è possibile eseguire comandi shell arbitrari dall’interno di gretl. Quando si usa !, il comando esterno viene eseguito in modalità sincrona, ossia gretl aspetta il termine della sua esecuzione prima di procedere. Se invece si vuole avviare un altro programma da dentro gretl senza aspettare che abbia completato la sua esecuzione (modalità asincrona), occorre usare launch. Per motivi di sicurezza, questa funzionalità è disabilitata in modalità predefinita. Per attivarla, occorre selezionare la casella “Abilita comandi shell” nel menù File, Preferenze. In questo modo si renderanno disponibili i comandi shell anche nella modalità a riga di comando di gretl (questo è l’unico modo per farlo). smpl Varianti: smpl oss-iniziale oss-finale smpl +i -j smpl variabile-dummy --dummy smpl condizione --restrict smpl --no-missing [ lista-variabili ] smpl n --random smpl full Esempi: smpl 3 10 smpl 1960:2 1982:4 smpl +1 -1 smpl x > 3000 --restrict smpl y > 3000 --restrict --replace smpl 100 --random Reimposta l’intervallo del campione. Il nuovo intervallo può essere definito in vari modi. Nel primo modo (corrispondente ai primi due esempi precedenti) oss-iniziale e oss-finale devono essere coerenti con la periodicità dei dati. Una delle due può essere sostituita da un punto e virgola per lasciare intatto il valore attuale. Nel secondo modo, gli interi i e j (che possono essere positivi o negativi e vanno indicati con il segno) sono presi come spostamenti relativi ai punti iniziale e finale del campione in uso. Nel terzo modo, variabile-dummy deve essere una variabile indicatrice che assume solo valori 0 o 1 e il campione verrà ristretto alle osservazioni per cui la variabile dummy vale 1. Il quarto modo, che usa --restrict, limita il campione alle osservazioni che soddisfano la condizione Booleana specificata secondo la sintassi del comando genr. Con la forma --no-missing, se viene specificata una lista-variabili, vengono selezionate le osservazioni per cui tutte le variabili nella lista-variabili hanno valori validi in corrispondenza dell’osservazione; altrimenti, se non viene indicata alcuna lista-variabili, vengono selezionate le osservazioni per cui tutte le variabili hanno valori validi (non mancanti). Con la forma --random, viene estratto casualmente dal dataset il numero indicato di osservazioni. Per essere in grado di replicare questa selezione, occorre per prima cosa impostare il seme del generatore di numeri casuali (si veda il comando set). La forma finale, smpl full, ripristina l’intervallo completo del campione. Si noti che i vincoli sul campione di solito sono cumulativi: il valore di riferimento di ogni comando smpl è il campione attuale. Se si vuole che il comando funzioni sostituendo i vin- Capitolo 1. Guida ai comandi 50 coli esistenti, così che ogni vincolo si aggiunga a quelli già impostati, occorre usare l’opzione --replace alla fine del comando. La variabile interna obs può essere usata con la forma --restrict di smpl per escludere particolari osservazioni dal campione. Ad esempio, smpl obs!=4 --restrict scarterà la quarta osservazione. Se le osservazioni sono identificate da etichette, smpl obs!="USA" --restrict scarterà l’osservazione a cui è associata l’etichetta “USA”. Per le forme --dummy, --restrict e --no-missing di smpl, occore tenere presente che tutte le informazioni “strutturali” contenute nel file dei dati (a proposito della struttura di serie storiche o di panel dei dati) vengono perse. È possibile reimpostare la struttura originale con il comando setobs. Si veda la Guida all’uso di gretl per ulteriori dettagli. Accesso dal menù: /Campione spearman Argomenti: xy Opzione: --verbose (mostra i dati ordinati) Mostra il coefficiente di correlazione di rango di Spearman per le variabili x e y. Le variabili non devono essere state ordinate manualmente in precedenza, se ne occupa la funzione. L’ordinamento automatico è dal massimo al minimo (ossia il valore massimo nei dati assume il rango 1). Se occorre invertire l’ordinamento, creare una variabile che è il negativo della variabile originale, ad esempio: genr altx = -x spearman altx y Accesso dal menù: /Modello/Stima robusta/SPEARMAN - Correlazione di rango sprintf Argomenti: var-stringa formato , argomenti Questo comando funziona esattamente come il comando printf, stampando gli argomenti nel modo controllato dalla stringa di formato, tranne per il fatto che il risultato è scritto nella stringa specificata, var-stringa. Per stampare la variabile stringa, basta usare il suo nome preceduto da @, come in questo esempio: sprintf variabile "%g", x print "variabile ha il valore @variabile" square Argomento: lista-variabili Opzione: --cross (genera anche i prodotti incrociati, oltre ai quadrati) Genera nuove variabili che sono i quadrati delle variabili nella lista-variabili (con anche i prodotti incrociati, se si usa l’opzione --cross). Ad esempio, square x y genera sq_x = x al quadrato, sq_y = y al quadrato e (opzionalmente) x_y = x per y. Se una particolare variabile è una dummy, non ne viene fatto il quadrato, visto che si otterrebbe la stessa variabile. Accesso dal menù: /Aggiungi/Quadrati delle variabili selezionate Capitolo 1. Guida ai comandi 51 sscanf Argomenti: stringa , formato , argomenti Analizza una stringa seguendo il formato indicato, assegnando zero o più valori agli argomenti indicati. È una versione semplificata della funzione sscanf del linguaggio di programmazione C. La stringa può essere una stringa vera e propria, racchiusa tra virgolette doppie, o il nome di una variabile stringa predefinita. Il formato è definito in modo simile alla stringa di formato del comando printf (si veda oltre). Gli argomenti sono una lista separata da virgole che contiene i nomi di variabili predefinite che verranno assegnate a seconda dei valori letti dalla stringa. Per chi conosce il C: è possibile prefissare con & i nomi delle variabili numeriche, ma non è richiesto. Le regole specificate nel formato vengono usate per analizzare la stringa. Le specifiche iniziano con un carattere %, e comprendono %f, %g o %lf per i numeri in virgola mobile; %d per gli interi; %s per le stringhe, e %m per le matrici. È possibile inserire un numero intero positivo dopo il carattere percento, per impostare il numero massimo di caratteri da leggere per ogni tipo di specifica (o il massimo numero di righe nel caso di conversione in matrici). In alternativa è possibile inserire un carattere * dopo il percento per sopprimere la conversione di un certo numero di caratteri della stringa. Ad esempio, %3d converte i 3 caratteri successivi della stringa in un numero intero, se possibile; %*g salta tutti i caratteri nella stringa che potrebbero essere convertiti in un numero a virgola mobile. La conversione in matrici funziona nel modo seguente: viene letta ogni riga dell’input e vengono contati i campi numerici (separati da spazi o tab). In questo modo viene definito il numero di colonne della matrice. Vengono quindi lette tutte le righe seguenti che contengono lo stesso numero di colonne numeriche; è anche possibile limitare il numero massimo di righe da leggere. Oltre alla conversione %s per le stringhe, è disponibile anche una versione semplificata del formato C %N [caratteri]. In questo formato, N è il numero massimo di caratteri da leggere, e caratteri è un insieme di caratteri accettabili, racchiusi tra parentesi quadre; la lettura si ferma se si raggiunge il limite di N o se si incontra un carattere non compreso nell’insieme ammissibile. La funzione dell’insieme caratteri può essere invertita specificando un accento circonflesso ^ come primo carattere dell’insieme; in questo caso, la lettura si ferma se si incontra un carattere dell’insieme specificato. Al contrario del C, il carattere trattino non ha alcuna funzione speciale in questo contesto. Se la stringa non corrisponde esattamente al formato specificato, il numero di conversioni effettuate può risultare diverso dal numero di argomenti indicati. Per gretl questo non è necessariamente un errore, tuttavia può essere utile voler controllare questa corrispondenza; è possibile farlo usando la variabile scalare interna $nscan, il cui valore viene aggiornato ogni volta che si usa sscanf. In caso di uso interattivo viene mostrato anche il numero di conversioni effettuate. Ecco alcuni esempi: scalar x scalar y sscanf "123456", "%3d%3d", x, y sprintf S "1 2 3 4\n5 6 7 8" S matrix m sscanf S, "%m", m print m Capitolo 1. Guida ai comandi 52 store Argomenti: file-dati [ lista-variabili ] Opzioni: --csv (usa il formato CSV) --omit-obs (si veda oltre, a proposito del formato CSV) --gnu-octave (usa il formato GNU Octave) --gnu-R (usa il formato GNU R) --traditional (usa il formato tradizionale ESL) --gzipped (comprime con gzip) --jmulti (usa il formato ASCII di JMulti) --dat (usa il formato ASCII di PcGive) --database (usa il formato database di gretl) --overwrite (cfr oltre, a proposito del formato dei database) Salva l’intero dataset, o un sottoinsieme delle variabili se è stata indicata una lista-variabili, nel file indicato con file-dati. L’impostazione predefinita è di salvare i dati nel formato “interno” di gretl, ma le opzioni del comando permettono di usare formati alternativi. I dati CSV (Comma-Separated Values, dati separati da virgole) possono essere letti dai programmi di foglio elettronico e possono essere modificati con un editor di testi. I formati Octave, R e PcGive sono destinati ad essere usati con i rispettivi programmi. La compressione con gzip può essere utile per grandi dataset. Si veda la Guida all’uso di gretl per i dettagli sui vari formati. L’opzione --omit-obs è applicabile solo quando si salvano dati in formato CSV. In modalità predefinita, se i dati sono serie storiche o panel, o se il dataset include marcatori per osservazioni specifiche, il file CSV comprende una prima colonna che identifica le osservazioni (ad esempio per data). Se si usa --omit-obs, questa colonna verrà omessa e verranno salvati solo i dati effettivi. Si noti che le variabili scalari non saranno salvate automaticamente: per salvarle occorre includerle esplicitamente nella lista-variabili. L’opzione di salvataggio in formato database di gretl è indicata se occorre costruire dei grandi dataset di serie, magari con frequenze diverse e diversi intervalli di osservazioni. Al momento questa opzione è disponibile solo per dati annuali, trimestrali o mensili. Salvando su un file che esiste già, il comportamento predefinito è quello di accodare le nuove serie al contenuto del database preesistente. In questo contesto, se una o più delle variabili da salvare hanno lo stesso nome di una delle variabili già presenti nel database si otterrà un messaggio di errore. L’opzione --overwrite permette invece di sovrascrivere eventuali variabili del dataset che hanno lo stesso nome delle nuove variabili, in modo che queste ultime rimpiazzino le variabili preesistenti. Accesso dal menù: /File/Salva dati; /File/Esporta dati summary Argomento: [ lista-variabili ] Mostra le statistiche descrittive per le variabili nella lista-variabili, o per tutte le variabili nel dataset, se non si indica una lista-variabili. L’output comprende media, scarto quadratico medio, coefficiente di variazione (= scarto quadratico medio / media), mediana, minimo, massimo, coefficiente di asimmetria, curtosi. Accesso dal menù: /Visualizza/Statistiche descrittive Accesso alternativo: Menù pop-up nella finestra principale Capitolo 1. Guida ai comandi 53 system Varianti: system method=stimatore nome-sistema <- system Esempi: Klein Model 1 <- system system method=sur system method=3sls Vedi anche klein.inp, kmenta.inp, greene14_2.inp Inizia un sistema di equazioni. Esistono due versioni del comando, a seconda che si voglia salvare il sistema per poterlo stimare in più modi diversi, oppure stimare il sistema una volta sola. Per salvare il sistema occorre dargli un nome, come nel primo esempio proposto (se il nome contiene spazi, occorre racchiuderlo tra virgolette). In questo caso, è possibile stimare il sistema con il comando estimate. Una volta che il sistema è stato salvato, è possibile imporre dei vincoli su di esso (compresi vincoli incrociati tra equazioni) usando il comando restrict. In alternativa, è possibile indicare uno stimatore per il sistema usando method= seguito da una stringa che identifica uno degli stimatori supportati: ols (ordinary least squares - minimi quadrati ordinari), tsls (two-stage least squares - minimi quadrati a due stadi), sur (seemingly unrelated regressions - regressioni apparentemente non collegate), 3sls (three-stage least squares - minimi quadrati a tre stadi), fiml (full information maximum likelihood - massima verosimiglianza con informazione completa) o liml (limited information maximum likelihood massima verosimiglianza con informazione limitata). In questo caso, il sistema viene stimato appena completata la sua definizione. Un sistema di equazioni termina con la riga end system. All’interno del sistema possono essere definiti i quattro tipi di istruzioni seguenti. • equation: specifica un’equazione del sistema. Occorre indicarne almeno due. • instr: per i sistemi da stimare con i minimi quadrati a tre stadi, indica la lista degli strumenti (indicati dal nome o dal numero della variabile). In alternativa, è possibile fornire questa informazione nella riga equation usando la stessa sintassi accettata dal comando tsls. • endog: per i sistemi di equazioni simultanee, indica la lista delle variabili endogene. È indicato principalmente per la stima FIML, ma può essere usato anche nella stima minimi quadrati a tre stadi al posto dell’istruzione instr: in questo modo tutte le variabili non identificate come endogene verranno usate come strumenti. • identity: per la stima FIML, un’identità che collega due o più variabili del sistema. Questo tipo di istruzione è ignorata se viene usato uno stimatore diverso da FIML. Dopo la stima eseguita con i comandi system o estimate è possibile recuperare informazioni aggiuntive dalle seguenti variabili accessorie: • $uhat: la matrice dei residui, una colonna per equazione. • $yhat: la matrice dei valori stimati, una colonna per equazione. • $coeff: il vettore colonna dei coefficienti (tutti i coefficienti della prima equazione, seguiti da quelli della seconda equazione, e così via). • $vcv: la matrice di covarianza dei coefficienti. Se il vettore $coeff ha k elementi, questa matrice ha dimensione k per k. • $sigma: la matrice di covarianza dei residui incrociata tra equazioni. • $sysGamma, $sysA e $sysB: matrici dei coefficienti in forma strutturale (si veda oltre). Capitolo 1. Guida ai comandi 54 Se si vuole salvare i residui o i valori stimati per una specifica equazione come serie di dati, basta selezionare la colonna dalla matrice $uhat o $yhat e assegnarla a una serie, come in series uh1 = $uhat[,1] Le matrici in forma strutturale corrispondono alla seguente rappresentazione di un modello ad equazioni simultanee: Γ yt = Ayt−1 + Bxt + t Se ci sono n variabili endogene e k variabili esogene, Γ è una matrice n × n e B è n × k. Se il sistema non contiene ritardi delle variabili endogene, la matrice A non è presente. Se il massimo ritardo di un regressore endogeno è p, la matrice A è n × np. Accesso dal menù: /Modello/Equazioni simultanee tabprint Argomento: [ -f nomefile ] Opzioni: --rtf (Produce RTF invece di LATEX) --complete (Crea un documento completo) --format="f1|f2|f3|f4" (Specifica un formato personalizzato) Va eseguito dopo la stima di un modello. Stampa il modello stimato sotto forma di tabella, in formato LATEX, o, se viene usata l’opzione --rtf, in formato RTF. Se viene specificato un nome di file dopo l’opzione -f, l’output viene scritto nel file, altrimenti viene scritto in un file col nome model_N.tex (o model_N.rtf), dove N è il numero dei modelli stimati finora nella sessione in corso. Le opzioni illustrate di seguito sono disponibili solo per il formato LATEX. Usando l’opzione --complete, il file LATEX è un documento completo, pronto per essere processato; altrimenti il file va incluso in un documento. Se si intende modificare lo stile del formato tabulare, è possibile specificare un formato personalizzato usando l’opzione --format, seguita da una stringa di formato. La stringa di formato va inclusa tra virgolette doppie e deve essere unita all’opzione con un segno di uguale. La composizione della stringa di formato è la seguente: ci sono quattro campi, che rappresentano il coefficiente, l’errore standard, il rapporto t e il p-value. Questi campi vanno separati usando barre verticali e possono contenere una specificazione di formato per valori numerici nello stile della funzione printf, oppure possono essere lasciati in bianco, in modo da sopprimere la visualizzazione del campo nella rispettiva colonna dela tabella (con l’unico vincolo che non è possibile lasciare in bianco tutti i campi). Ecco alcuni esempi: --format="%.4f|%.4f|%.4f|%.4f" --format="%.4f|%.4f|%.3f|" --format="%.5f|%.4f||%.4f" --format="%.8g|%.8g||%.4f" La prima specificazione stampa i valori di tutte le colonne usando 4 cifre decimali. La seconda sopprime il p-value e mostra il rapporto t con 3 cifre decimali. La terza omette il rapporto t, mentre l’ultima omette il rapporto t e mostra sia il coefficiente che l’errore standard con 8 cifre significative. Una volta che si imposta un formato in questo modo, esso viene ricordato e usato per tutta la sessione di lavoro. Per tornare ad usare il formato predefinito, basta usare la parola chiave --format=default. Accesso dal menù: Finestra del modello, /LaTeX testuhat Deve seguire un comando di stima. Mostra la distribuzione di frequenza dei residui del modello, insieme a un test chi-quadro per la normalità, basato sulla procedura suggerita da Doornik e Hansen (1994). Capitolo 1. Guida ai comandi 55 Accesso dal menù: Finestra del modello, /Test/Normalità dei residui tobit Argomenti: variabile-dipendente variabili-indipendenti Opzioni: --vcv (mostra la matrice di covarianza) --verbose (mostra i dettagli delle iterazioni) Stima un modello Tobit. Il modello può essere appropriato quando la variabile dipendente è “censurata”. Ad esempio, vengono osservati valori positivi o nulli della spesa dei consumatori per beni durevoli, ma non valori negativi; tuttavia le decisioni di spesa possono essere pensate come derivanti da una propensione al consumo, sottostante e non osservata, che può anche essere negativa in alcuni casi. Per i dettagli si veda il capitolo 20 di Econometric Analysis di Greene. Accesso dal menù: /Modello/Modelli non lineari/Tobit tsls Argomenti: variabile-dipendente variabili-indipendenti ; strumenti Opzioni: --vcv (mostra la matrice di covarianza) --robust (errori standard robusti) --liml (usa massima verosimiglianza a informazione limitata) --gmm (usa il metodo generalizzato dei momenti) Esempio: tsls y1 0 y2 y3 x1 x2 ; 0 x1 x2 x3 x4 x5 x6 Calcola le stime con variabili strumentali, per impostazione predefinita usando i minimi quadrati a due stadi (TSLS), ma è possibile scegliere altre opzioni. Occorre specificare la variabiledipendente, la lista di variabili-indipendenti (che si intende includere alcuni regressori endogeni), e infine gli strumenti, la lista completa delle variabili esogene e predeterminate. Se la lista degli strumenti non è lunga almeno quanto quella delle variabili-indipendenti, il modello non è identificato. Nell’esempio precedente, le y sono le variabili endogene e le x sono le variabili esogene e predeterminate. Si noti che eventuali regressori esogeni devono essere inclusi in entrambe le liste. L’output delle stime TSLS comprende il test di Hausman e, se il modello è sovra-identificato, il test di Sargan per la sovra-identificazione. Nel test di Hausman, l’ipotesi nulla è che le stime OLS siano consistenti, o in altre parole che non sia richiesta la stima per mezzo di variabili strumentali. Un modello di questo tipo è sovra-identificato se ci sono più strumenti di quelli strettamente necessari. Il test di Sargan è basato su una regressione ausiliaria dei residui del modello minimi quadrati a due stadi sull’intera lista degli strumenti. L’ipotesi nulla è che tutti gli strumenti siano validi, cosa di cui si dovrebbe dubitare se la regressione ausiliaria ha un significativo potere esplicativo. Davidson e MacKinnon (2004, capitolo 8) forniscono una buona spiegazione di entrambi i test. Il valore R-quadro mostrato i modelli stimati con i minimi quadrati a due stadi è il quadrato della correlazione tra la variabile dipendente e i valori stimati. In alternativa al metodo TSLS, il modello può essere stimato usando la massima verosimiglianza a informazione limitata (opzione --liml) o il metodo generalizzato dei momenti (opzione --gmm). Si noti che se il modello è esattamente identificato, questi metodi dovrebbero produrre gli stessi risultati del metodo TSLS, ma se il modello è sovraidentificato, i risultati saranno in genere diversi. Se si usa la stima GMM, è possibile usare le seguenti opzioni aggiuntive: • --two-step: esegue la stima GMM in due passi, invece che in un passo solo. • --iterate: itera il GMM fino alla convergenza. Capitolo 1. Guida ai comandi 56 • --weights=Pesi: specifica una matrice quadrata di pesi da usare nel calcolo della funzione criterio del GMM. La dimensione di questa matrice deve essere pari al numero di strumenti. L’impostazione predefinita consiste nell’usare una matrice identità di dimensione opportuna. Accesso dal menù: /Modello/TSLS - Minimi quadrati a due stadi var Argomenti: ordine lista-variabili [ ; lista-esogene ] Opzioni: --nc (non include una costante) --trend (include un trend) --seasonals (include variabili dummy stagionali) --robust (errori standard robusti) --impulse-responses (mostra impulso-risposta) --variance-decomp (mostra decomposizioni della varianza della previsione) --lagselect (mostra i criteri di informazione per la selezione dei ritardi) Esempi: var 4 x1 x2 x3 ; time mydum var 4 x1 x2 x3 --seasonals var 12 x1 x2 x3 --lagselect Imposta e stima (usando OLS) un’autoregressione vettoriale (VAR). Il primo argomento specifica l’ordine di ritardo (o il massimo ordine di ritardi se è stata usata l’opzione --lagselect). L’ordine può essere indicato numericamente o con il nome di una variabile scalare preesistente. Quindi segue l’impostazione della prima equazione. Non occorre includere i ritardi tra gli elementi della lista-variabili: verranno aggiunti automaticamente. Il punto e virgola separa le variabili stocastiche, per cui verrà incluso un numero di ritardi pari a ordine, dai termini deterministici o esogeni presenti nella lista-esogene. Si noti che viene inclusa automaticamente una costante, a meno che non si usi l’opzione --nc; inoltre è possibile aggiungere un trend con l’opzione --trend e variabili dummy stagionali con l’opzione --seasonals. Viene calcolata una regressione separata per ognuna delle variabili nella lista-variabili. Il risultato di ogni equazione include i test F per i vincoli di uguaglianza a zero su tutti i ritardi delle variabili, un test F per la significatività del ritardo massimo e, se è stata usata l’opzione --impulse-responses, la scomposizione della varianza della previsione e le funzioni di impulso-risposta. Le decomposizioni della varianza della previsione e le funzioni di impulso-risposta sono basate sulla decomposizione di Cholesky della matrice di covarianza contemporanea, e in questo contesto l’ordine in cui vengono date le variabili stocastiche conta. La prima variabile nella lista viene considerata come la “più esogena” all’interno del periodo. L’orizzonte per le decomposizioni della varianza e le funzioni di impulso-risposta può essere impostato usando il comando set. Se si usa l’opzione --lagselect, il primo parametro del comando var viene interpretato come il massimo ordine di ritardo. In questo caso, il comando non produce il solito risultato della stima del VAR, ma una tabella che mostra i valori dei criteri di informazione di Akaike (AIC), Schwartz (BIC) e Hannan–Quinn (HQC) calcolati per VAR dall’ordine 1 fino all’ordine massimo indicato, in modo da aiutare nella scelta dell’ordine di ritardo ottimale. Accesso dal menù: /Modello/Serie storiche/VAR - Autoregressione vettoriale varlist Mostra un elenco delle variabili disponibili. list e ls sono sinonimi. vartest Argomenti: var1 var2 Capitolo 1. Guida ai comandi 57 Calcola la statistica F per l’ipotesi nulla che le varianze della popolazione per le variabili var1 e var2 siano uguali e mostra il p-value. Accesso dal menù: /Modello/Modelli bivariati/Differenza delle varianze vecm Argomenti: ordine rango lista-y [ ; lista-x ] [ ; lista-rx ] Opzioni: --nc (senza costante) --rc (costante vincolata) --crt (costante e trend vincolato) --ct (costante e trend non vincolato) --seasonals (include dummy stagionali centrate) --impulse-responses (mostra impulso-risposta) --variance-decomp (mostra decomposizioni della varianza delle previsioni) Esempi: vecm 4 1 Y1 Y2 Y3 vecm 3 2 Y1 Y2 Y3 --rc vecm 3 2 Y1 Y2 Y3 ; X1 --rc Vedi anche denmark.inp, hamilton.inp Un VECM è un tipo di autoregressione vettoriale, o VAR (si veda var), applicabile quando le variabili del modello sono individualmente integrate di ordine 1 (ossia, sono “random walk” con o senza deriva), ma esibiscono cointegrazione. Questo comando è strettamente connesso al test di Johansen per la cointegrazione (si veda coint2). Il parametro ordine rappresenta l’ordine di ritardo del sistema VAR. Il numero di ritardi nel VECM (dove la variabile dipendente è data da una differenza prima) è pari a ordine meno uno. Il parametro rango rappresenta il rango di cointegrazione, o in altre parole il numero di vettori di cointegrazione. Questo deve essere maggiore di zero e minore o uguale (in genere minore) al numero di variabili endogene contenute nella lista-y. La lista-y rappresenta l’elenco delle variabili endogene, nei livelli. L’inclusione di trend deterministici nel modello è controllata dalle opzioni del comando. Se non si indica alcuna opzione, viene inclusa una “costante non vincolata”, che permette la presenza di un’intercetta diversa da zero nelle relazioni di cointegrazione e di un trend nei livelli delle variabili endogene. Nella letteratura originata dal lavoro di Johansen (si veda ad esempio il suo libro del 1995), si fa riferimento a questo come al “caso 3”. Le prime quattro opzioni mostrate sopra, che sono mutualmente esclusive, producono rispettivamente i casi 1, 2, 4 e 5. Il significato di questi casi e i criteri per scegliere tra di essi sono spiegati nella Guida all’uso di gretl. Le liste opzionali lista-x e lista-rx permettono di specificare insiemi di variabili esogene che entrano nel modello in modo non vincolato (lista-x) o in modo vincolato allo spazio di cointegrazione (lista-rx). Queste liste vanno separate dalla lista-y (e tra di loro) da caratteri punto e virgola. L’opzione --seasonals, che può accompagnare una qualsiasi delle altre opzioni, specifica l’inclusione di un gruppo di variabili dummy stagionali centrate. Questa opzione è disponibile solo per dati trimestrali o mensili. Il primo degli esempi mostrati sopra specifica un VECM con ordine di ritardo pari a 4 e un unico vettore di cointegrazione. Le variabili endogene sono Y1, Y2 e Y3. Il secondo esempio usa le stesse variabili ma specifica un ritardo di ordine 3 e due vettori di cointegrazione, oltre a specificare una “costante vincolata”, che è appropriata se i vettori di cointegrazione possono avere un’intercetta diversa da zero, ma le variabili Y non hanno trend. Accesso dal menù: /Modello/Serie storiche/VECM vif Deve seguire la stima di un modello che includa almeno due variabili indipendenti. Calcola e mostra i fattori di inflazione della varianza (Variance Inflation Factors - VIF) per i regressori. Il Capitolo 1. Guida ai comandi 58 VIF per il regressore j è definito come 1 1 − Rj2 dove R j è il coefficiente di correlazione multipla tra il regressore j e gli altri regressori. Il fattore ha un valore minimo di 1.0 quando la variabile in questione è ortogonale alle altre variabili indipendenti. Neter, Wasserman e Kutner (1990) suggeriscono di usare il VIF maggiore come test diagnostico per la collinearità; un valore superiore a 10 è in genere considerato indice di un grado di collinearità problematico. Accesso dal menù: Finestra del modello, /Test/collinearità wls Argomenti: variabile-pesi variabile-dipendente variabili-indipendenti Opzioni: --vcv (mostra la matrice di covarianza) --robust (errori standard robusti) --quiet (non mostra i risultati) Calcola stime con minimi quadrati ponderati (WLS - Weighted Least Squares), prendendo i pesi da variabile-pesi. In pratica, detta w la radice quadrata positiva della variabile-pesi, viene calcolata una regressione OLS di w * variabile-dipendente rispetto a w * variabili-indipendenti. L’R-quadro, comunque, è calcolato in un modo speciale, ossia come R2 = 1 − ESS WTSS dove ESS è la somma dei quadrati degli errori (somma dei quadrati dei residui) dalla regressione ponderata, mentre WTSS denota la “somma totale ponderata dei quadrati”, che è pari alla somma dei quadrati dei residui della regressione della variabile dipendente ponderata sulla sola costante ponderata. Se variabile-pesi è una variabile dummy, la stima WLS equivale a eliminare tutte le osservazioni per cui essa vale zero. Accesso dal menù: /Modello/Altri modelli lineari/WLS - Minimi quadrati ponderati xcorrgm Argomenti: var1 var2 [ maxlag ] Esempio: xcorrgm x y 12 Mostra il correlogramma incrociato per le variabili var1 e var2, che possono essere specificate per nome o per numero. I valori sono i coefficienti di correlazione campionari tra il valore presente di var1 e i valori ritardati e anticipati di var2. Se si indica un valore maxlag, la lunghezza del correlogramma è limitata al numero di ritardi e anticipi indicati, altrimenti è determinata automaticamente in funzione della frequenza dei dati e del numero di osservazioni. Accesso dal menù: /Visualizza/Correlogramma Accesso alternativo: Menù pop-up nella finestra principale (selezione multipla) xtab Argomenti: lista-y [ ; lista-x ] Opzioni: --row (mostra le percentuali per riga) --column (mostra le percentuali per colonna) --zeros (mostra i valori pari a zero) Mostra la tabella di contingenza, o la tabulazione incrociata, tra ogni combinazione delle variabili della lista-y ; se si indica anche una seconda lista, lista-x, ogni variabile della lista-y viene tabulata (per riga) rispetto ad ogni variabile della lista-x (per colonna). Le variabili in queste Capitolo 1. Guida ai comandi 59 liste possono essere referenziate per nome o per numero, e devono essere state marcate come discrete. Per impostazione predefinita le celle indicano la frequenza assoluta. Le opzioni --row e --column (che sono mutualmente esclusive) sostituiscono la frequenza assoluta con le frequenze in percentuale relativamente a ciascuna riga o colonna. Le celle con valore di frequenza nullo sono lasciate vuote, a meno che non venga usata l’opzione --zeros, che mostra esplicitamente i valori pari a zero; questa opzione può essere comoda se occorre importare la tabella in un altro programma, come un foglio di calcolo. Il test chi quadro di Pearson per l’indipendenza viene mostrato se la frequenza attesa nell’ipotesi di indipendenza è pari almeno a 1.0e-7 per tutte le celle. Una regola approssimativa usata spesso nel giudicare la validità di questa statistica richiede che la frequenza attesa sia superiore a 5 per almeno l’80 per cento delle celle; se questa condizione non viene soddisfatta viene mostrato un messaggio di avvertimento. Se la tabella di contingenza è 2 x 2, viene calcolato il test esatto di Fisher per l’indipendenza. Si noti che questo test si basa sull’ipotesi che i totali per riga e colonna siano fissi; questo può essere appropriato o meno a seconda di come sono stati generati i dati. Il p-value sinistro va usato nel caso in cui l’ipotesi alternativa a quella di indipendenza sia quella dell’associazione negativa (ossia i valori tendono ad accumularsi nelle celle che non appartengono alla diagonale della tabella), mentre il p-value destro va usato nell’ipotesi alternativa di associazione positiva. Il p-value a due code di questo test è calcolato seguendo il metodo (b) descritto in Agresti (1992, capitolo 2.1): esso è la somma delle probabilità di tutte le possibili tabelle che hanno i totali per riga e per colonna pari a quelli della tabella data e che hanno una probabilità minore o uguale a quella della tabella data. 1.3 Comandi raggruppati per argomento Di seguito, i comandi disponibili sono raggruppati per argomento. Stima ar Stima autoregressiva ar1 Stima AR(1) arbond Modelli panel dinamici arch Modello ARCH arima Stima ARMA/ARIMA equation Definisce un’equazione in un sistema estimate Stima sistemi di equazioni garch Stima GARCH gmm Stima GMM heckit Modello di selezione di Heckman hsk Stime corrette per l’eteroschedasticità intreg Modello di regressione per intervalli lad Stima con minime deviazioni assolute logistic Regressione logistica logit Regressione logit mle Stima di massima verosimiglianza mpols Stima OLS a precisione multipla nls Minimi quadrati non-lineari ols Minimi quadrati ordinari panel Modelli panel poisson Stima Poisson probit Stima probit quantreg Regressione quantile system Sistemi di equazioni tobit Stima Tobit tsls Stima minimi quadrati a due stadi var Autoregressione vettoriale vecm Modello vettoriale a correzione d’errore wls Minimi quadrati ponderati Test add Aggiunge variabili al modello adf Test Dickey-Fuller aumentato chow Test di Chow coeffsum Somma dei coefficienti Capitolo 1. Guida ai comandi 60 coint Test di cointegrazione di EngleGranger coint2 Test di cointegrazione di Johansen cusum Test CUSUM difftest Test non parametrici per le differenze hausman Diagnosi panel kpss Test KPSS di stazionarietà leverage Osservazioni influenti lmtest Test LM meantest Differenza delle medie normtest Test di normalità omit Omette variabili qlrtest Test del rapporto di verosimiglianza di Quandt reset Test RESET di Ramsey restrict Vincoli lineari runs Test delle successioni testuhat Normalità dei residui vartest Differenza delle varianze vif Fattori di inflazione della varianza Trasformazioni diff Differenze prime discrete Marca variabili discrete dummify Crea variabili dummy lags Crea ritardi ldiff Differenze logaritmiche logs Crea logaritmi orthdev Deviazioni ortogonali sdiff Differenziazione stagionale square Crea quadrati delle variabili Statistiche corr Coefficienti di correlazione corrgm Correlogramma freq Distribuzione di frequenza hurst Esponente di Hurst mahal Distanze di Mahalanobis pca Analisi delle componenti principali pergm Periodogramma spearman Correlazione di rango di Spearman summary Statistiche descrittive xcorrgm Correlogramma incrociato xtab Tabulazione incrociata Dataset append Aggiunge dati data Importazione da database dataset Manipola il dataset delete Elimina variabili genr Generazione di una nuova variabile info Informazioni sul dataset labels Mostra etichette delle variabili nulldata Creazione di un dataset vuoto open Apre un dataset rename Rinomina variabili setinfo Modifica degli attributi di una variabile setobs Frequenza e osservazione iniziale setmiss Codice dei valori mancanti smpl Imposta l’intervallo del campione store Salvataggio dei dati varlist Elenca variabili boxplot Grafici boxplot gnuplot Crea un grafico Gnuplot graph Crea un grafico ASCII plot Grafici ASCII rmplot Grafici range-mean scatters Grafici multipli per coppie di variabili Grafici Stampa Capitolo 1. Guida ai comandi 61 eqnprint Stampa un modello come equazione modprint Stampa un modello definito dall’utente outfile Stampa diretta su file print Stampa dati o stringhe printf Stampa formattata sprintf Stampa su una stringa tabprint Stampa modelli in forma tabulare Previsione fcast Genera previsioni Programmazione break Esce da un ciclo elif Strutture di controllo else Strutture di controllo end Chiude un blocco di comandi endif Strutture di controllo endloop Chiude un ciclo di comandi foreign Script esterni function Definisce una funzione if Strutture di controllo include Include definizioni di funzioni loop Apre un ciclo di comandi run Esegue uno script di comandi set Imposta parametri del programma sscanf Scansione di una stringa Utilità criteria Criteri di selezione dei modelli help Aiuto sui comandi modeltab Tabella modelli pvalue Calcola p-value quit Esce dal programma shell Esegue comandi shell Capitolo 2 Guida alle funzioni di gretl 2.1 Introduzione Questo capitolo contiene due elenchi alfabetici: quello degli “accessori”, che permettono all’utente di recuperare il valore di alcune variabili interne, e quello delle vere e proprie funzioni disponibili nel contesto del comando genr. 2.2 Accessori $ahat Risultato: serie Deve seguire la stima di un modello panel a effetti fissi. Produce le stime degli effetti fissi individuali (intercette delle singole unità). $aic Risultato: scalare Produce il criterio di informazione di Akaike per l’ultimo modello stimato. $bic Risultato: scalare Produce il criterio di informazione bayesiana di Schwarz per l’ultimo modello stimato. $coeff Risultato: scalare o matrice Argomento: s (nome del coefficiente, opzionale) L’accessorio $coeff può essere usato in due modi: senza argomenti produce un vettore colonna che contiene i coefficienti dell’ultimo modello stimato. Con l’argomento opzionale, produce uno scalare che corrisponde alla stima del coefficiente chiamato s. Vedi anche $stderr, $vcv. Esempio: open bjg arima 0 1 1 ; 0 1 1 ; lg b = $coeff macoef = $coeff(theta_1) Se il “modello” in questione è effettivamente un sistema (un VAR o un VECM, o un sistema di equazioni simultanee), $coeff senza parametri produce la matrice dei coefficienti, una colonna per equazione. $compan Risultato: matrice Deve seguire la stima di un VAR o un VECM; produce la matrice relativa. 62 Capitolo 2. Guida alle funzioni di gretl 63 $df Risultato: scalare Produce i gradi di libertà dell’ultimo modello stimato. $ess Risultato: scalare Produce la somma dei quadrati degli errori dell’ultimo modello stimato. $gmmcrit Risultato: scalare Deve seguire un blocco gmm. Produce il valore della funzione obiettivo al suo minimo. $h Risultato: serie Deve seguire un comando garch. Produce la varianza condizionale stimata. $hausman Risultato: vettore riga Deve seguire un comando tsls. Produce un vettore 1 × 3 contenente nell’ordine: il valore della statistica del test di Hausman, i corrispondenti gradi di libertà e p-value. $hqc Risultato: scalare Produce il criterio di informazione di Hannan-Quinn per l’ultimo modello stimato. $jalpha Risultato: matrice Deve seguire la stima di un VECM, e produce la matrice dei pesi, che contiene tante righe quante sono le variabili del VECM e tante colonne quanto è il rango di cointegrazione. $jbeta Risultato: matrice Deve seguire la stima di un VECM, e produce la matrice di cointegrazione, che contiene tante righe quante sono le variabili del VECM e tante colonne quanto è il rango di cointegrazione. $jvbeta Risultato: matrice quadrata Deve seguire la stima di un VECM, e produce la matrice di covarianza stimata per gli elementi dei vettori di cointegrazione. Nel caso di stima non vincolata, ha un numero di righe pari al numero di elementi non vincolati nello spazio di cointegrazione dopo la normalizzazione di Phillips. Se però si stima un sistema vincolato con il comando restrict e l’opzione --full, verrà prodotta una matrice singolare con nr righe (n è il numero delle variabili e r è il rango di cointegrazione). Esempio: il codice Capitolo 2. Guida alle funzioni di gretl 64 open denmark.gdt vecm 2 1 LRM LRY IBO IDE --rc --seasonals -q s0 = $jvbeta restrict --full b[1,1] = 1 b[1,2] = -1 b[1,3] + b[1,4] = 0 end restrict s1 = $jvbeta print s0 print s1 produce il risultato seguente. s0 (4 x 4) 0.019751 0.029816 -0.00044837 -0.12227 0.029816 0.31005 -0.45823 -0.18526 -0.00044837 -0.45823 1.2169 -0.035437 -0.12227 -0.18526 -0.035437 0.76062 s1 (5 x 5) 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.27398 -0.27398 -0.019059 0.0000 0.0000 -0.27398 0.27398 0.019059 0.0000 0.0000 -0.019059 0.019059 0.0014180 $lnl Risultato: scalare Produce la log-verosimiglianza dell’ultimo modello stimato (dove possibile). $ncoeff Risultato: scalare Produce il numero totale dei coefficienti stimati nell’ultimo modello. $nobs Risultato: scalare Produce il numero delle osservazioni nel campione selezionato. $nvars Risultato: scalare Produce il numero delle variabili nel dataset (inclusa la costante). $pd Risultato: scalare Produce la frequenza o la periodicità dei dati (es. 4 per dati trimestrali). Capitolo 2. Guida alle funzioni di gretl 65 $pvalue Risultato: scalare Produce il p-value della statistica test generata dall’ultimo comando esplicito di test di ipotesi (es. chow). Si veda Guida all’uso di gretl per i dettagli. Vedi anche $test. $rho Risultato: scalare Argomento: n (scalare, opzionale) Senza argomenti, produce il coefficiente autoregressivo del prim’ordine per i residui dell’ultimo modello. Dopo aver stimato un modello con il comando ar, la sintassi $rho(n) produce la corrispondente stima di ρ(n). $rsq Risultato: scalare Produce l’R 2 non corretto dell’ultimo modello stimato. $sargan Risultato: vettore riga Deve seguire un comando tsls. Produce un vettore 1 × 3 che contiene nell’ordine: il valore della statistica del test di Sargan per la sovraidentificazione, i corrispondenti gradi di libertà e il p-value. $sigma Risultato: scalare Ritorna lo scarto quadratico medio dei residui dell’ultimo modello stimato. $stderr Risultato: scalare o matrice Argomento: s (nome del coefficiente, opzionale) L’accessore $stderr può usarsi in due modi: senza argomenti, ritorna un vettore colonna che contiene le stime dei coefficienti per l’ultimo modello stimato. Con il parametro opzionale, ritorna uno scalare contentente la stima del parametro s. Vedi anche $coeff, $vcv. $stopwatch Risultato: scalare Must be preceded by the set stopwatch command, which activates the measurement of CPU time. The “clock” stops when the accessor $stopwatch is used, either in assigning it to a variable or simply by printing it. The accessor $stopwatch yields the seconds of CPU time that have elapsed since the set stopwatch statement command. $T Risultato: scalare Number of observations used in estimating the last model. Capitolo 2. Guida alle funzioni di gretl 66 $t1 Risultato: scalare The 1-based index of the first observation in the currently selected sample. $t2 Risultato: scalare The 1-based index of the last observation in the currently selected sample. $test Risultato: scalare Returns the value of the test statistic that was generated by the last explicit hypothesis-testing command, if any (e.g. chow). See Guida all’uso di gretl for details. Vedi anche $pvalue. $trsq Risultato: scalare Returns T R 2 (sample size times R-squared) from the last model. $uhat Risultato: serie Returns the residuals from the last model. This may have different meanings for different estimators. For example, after an ARMA estimation $uhat will contain the one-step-ahead forecast error; after a probit model, it will contain the generalized residuals. If the “model” in question is actually a system (a VAR or VECM, or system of simultaneous equations), $uhat with no parameters retrieves the matrix of residuals, one column per equation. $vcv Risultato: scalare o matrice Argomenti: s1 (nome del coefficiente, opzionale) s2 (nome del coefficiente, opzionale) The $stderr accessor can be used in two ways: with no arguments, it returns a square matrix containing the estimated covariance matrix for the coefficients of the last model. With the optional arguments, it returns a scalar, which is the estimated covariance between the parameters named s1 and s2. Vedi anche $coeff, $stderr. If the “model” in question is actually a system (a VAR or VECM, or system of simultaneous equations), $vcv with no parameters returns the cross-equation covariance matrix. $yhat Risultato: serie Returns the fitted values from the last regression. 2.3 Functions proper abs Risultato: stesso tipo dell’argomento Argomento: x (scalare, serie o matrice) Absolute value. Capitolo 2. Guida alle funzioni di gretl 67 atan Risultato: stesso tipo dell’argomento Argomento: x (scalare, serie o matrice) Arctangent. BFGSmax Risultato: scalare Argomenti: b (vettore) s (stringa) Numerical maximization via the method of Broyden, Fletcher, Goldfarb and Shanno. The vector b should hold the initial values of a set of parameters, and the string s should specify a call to a function that calculates the (scalar) criterion to be maximized, given the current parameter values and any other relevant data. If the object is in fact minimization, this function should return the negative of the criterion. On successful completion, BFGSmax returns the maximized value of the criterion, and b holds the parameter values which produce the maximum. For more details and examples see the chapter on special functions in genr in Guida all’uso di gretl. Vedi anche fdjac. bkfilt Risultato: serie Argomento: y (serie) Extracts the cyclical component of series y via the Baxter–King bandpass filter, a two-sided symmetric filter. See Guida all’uso di gretl for details. Vedi anche hpfilt. cdemean Risultato: matrice Argomento: X (matrice) Centers the columns of matrix X around their means. cdf Risultato: stesso tipo dell’argomento Argomenti: c (carattere) . . . (vedi sotto) x (scalare, serie o matrice) Esempi: p1 = cdf(N, -2.5) p2 = cdf(X, 3, 5.67) p3 = cdf(D, 0.25, -1, 1) Cumulative distribution function calculator. Returns P (X ≤ x), where the distribution X is determined by the character c. Between the arguments c and x, zero or more additional arguments are required to specify the parameters of the distribution, as follows. Capitolo 2. Guida alle funzioni di gretl 68 Distribution c Arg 2 Arg 3 Standard normal z, n or N – – Bivariate normal D ρ – Student’s t (central) t degrees of freedom – Chi square c, x or X degrees of freedom – Snedecor’s F f or F df (num.) df (den.) Gamma g or G shape scale Binomial b or B probability trials Poisson p or P mean – Note that most cases have aliases to help memorizing the codes. The bivariate normal case is special: the syntax is x = cdf(D, rho, z1, z2) where rho is the correlation between the variables z1 and z2. The parametrization gretl uses for the Gamma random variate implies that its density function can be written as x k−1 e−x/θ f (x; k, θ) = θ k Γ (k) where k > 0 is the shape parameter and θ > 0 is the scale parameter. Vedi anche critical, invcdf, pvalue. cdiv Risultato: matrice Argomenti: X (matrice) Y (matrice) Complex division. The two arguments must have the same number of rows, n, and either one or two columns. The first column contains the real part and the second (if present) the imaginary part. The return value is an n × 2 matrix or, if the result has no imaginary part, an n-vector. Vedi anche cmult. ceil Risultato: stesso tipo dell’argomento Argomento: x (scalare, serie o matrice) Ceiling function: returns the smallest integer greater than or equal to x. Vedi anche floor, int. cholesky Risultato: matrice quadrata Argomento: A (matrice quadrata) Peforms a Cholesky decomposition of the matrix A, which is assumed to be symmetric and positive definite. The result is a lower-triangular matrix K which satisfies A = KK 0 . The function will fail if A is not symmetric or not positive definite. cmult Risultato: matrice Argomenti: X (matrice) Y (matrice) Complex multiplication. The two arguments must have the same number of rows, n, and either one or two columns. The first column contains the real part and the second (if present) the imaginary part. The return value is an n × 2 matrix, or, if the result has no imaginary part, an n-vector. Vedi anche cdiv. Capitolo 2. Guida alle funzioni di gretl 69 cnorm Risultato: stesso tipo dell’argomento Argomento: x (scalare, serie o matrice) Returns the cumulative distribution function for a standard normal. Vedi anche dnorm, qnorm. cols Risultato: scalare Argomento: X (matrice) The number of columns of X. Vedi anche mshape, rows, unvech, vec, vech. corr Risultato: scalare Argomenti: y1 (serie) y2 (serie) Computes the correlation coefficient between y1 and y2. Vedi anche cov, mcov, mcorr. cos Risultato: stesso tipo dell’argomento Argomento: x (scalare, serie o matrice) Cosine. cov Risultato: scalare Argomenti: y1 (serie) y2 (serie) Computes the covariance between y1 and y2. Vedi anche corr, mcov, mcorr. critical Risultato: stesso tipo dell’argomento Argomenti: c (carattere) . . . (vedi sotto) p (scalare, serie o matrice) Esempi: c1 = critical(t, 20, 0.025) c2 = critical(F, 4, 48, 0.05) Critical value calculator. Returns x such that P (X > x) = p, where the distribution X is determined by the character c. Between the arguments c and p, zero or more additional arguments are required to specify the parameters of the distribution, as follows. Distribution c Arg 2 Arg 3 Standard normal z, n or N – – Student’s t (central) t degrees of freedom – Chi square c, x or X degrees of freedom – Snedecor’s F f or F df (num.) df (den.) Binomial b or B p n Vedi anche cdf, invcdf, pvalue. Capitolo 2. Guida alle funzioni di gretl 70 cum Risultato: stesso tipo dell’argomento Argomento: x (serie o matrice) Pt Cumulates x. When x is a series, produces a series yt = s=m xs ; the starting point of the summation, m, is the first non-missing observation of the currently selected sample. If any missing values are encountered in x, subsequent values of y will be set to missing. When x is a matrix, its elements are cumulated by columns. Vedi anche diff. det Risultato: scalare Argomento: A (matrice quadrata) Returns the determinant of A, computed via the LU factorization. Vedi anche ldet, rcond. diag Risultato: matrice Argomento: X (matrice) Returns the principal diagonal of X in a column vector. Note: if X is an m×n marix, the number of elements of the output vector is min(m, n). Vedi anche tr. diff Risultato: stesso tipo dell’argomento Argomento: y (serie, matrice o lista) Computes first differences. If y is a series, or a list of series, starting values are set to NA. If y is a matrix, differencing is done by columns and starting values are set to 0. Vedi anche cum, ldiff, sdiff. dnorm Risultato: stesso tipo dell’argomento Argomento: x (scalare, serie o matrice) Returns the density function for a standard normal. Vedi anche cnorm, qnorm. dsort Risultato: stesso tipo dell’argomento Argomento: x (serie o vettore) Sorts x in descending order, skipping observations with missing values when x is a series. Vedi anche sort, values. eigengen Risultato: matrice Argomenti: A (matrice quadrata) &U (riferimento a matrice, o null) Computes the eigenvalues, and optionally the right eigenvectors, of the n × n matrix A. If all the eigenvalues are real, an n × 1 matrix is returned; otherwise, the result is an n × 2 matrix, the first column holding the real components and the second column the imaginary components. Capitolo 2. Guida alle funzioni di gretl 71 The second argument must be either the name of an existing matrix preceded by & (to indicate the “address” of the matrix in question), in which case an auxiliary result is written to that matrix, or the keyword null, in which case the auxiliary result is not produced. If a non-null second argument is given, the specified matrix will be over-written with the auxiliary result. (It is not required that the existing matrix be of the right dimensions to receive the result.) It will be organized as follows: • If the i-th eigenvalue is real, the i-th column of U will contain the corresponding eigenvector; • If the i-th eigenvalue is complex, the i-th column of U will contain the real part of the corresponding eigenvector and the next column the imaginary part. The eigenvector for the conjugate eigenvalue is the conjugate of the eigenvector. In other words, the eigenvectors are stored in the same order as the eigenvalues, but the real eigenvectors occupy one column, whereas complex eigenvectors take two (the real part comes first); the total number of columns is still n, because the conjugate eigenvector is skipped. Vedi anche eigensym, qrdecomp, svd. eigensym Risultato: vettore colonna Argomenti: A (matrice quadrata) &U (riferimento a matrice, o null) Computes the eigenvalues, and optionally the right eigenvectors, of the n × n symmetrix matrix A; the second argument must be either the name of an existing matrix preceded by & (to indicate the “address” of the matrix in question), in which case an auxiliary result is written to that matrix, or the keyword null, in which case the auxiliary result is not produced. If the second argument is not null, the specified matrix will be over-written with the auxiliary result. (It is not required that the existing matrix be of the right dimensions to receive the result.) Vedi anche eigengen, qrdecomp, svd. exp Risultato: stesso tipo dell’argomento Argomento: x (scalare, serie o matrice) Exponential. Note: in case of matrices, the function acts element by element. For the matrix exponential function, see mexp. fdjac Risultato: matrice Argomenti: b (vettore colonna) s (stringa) Calculates the (forward-difference approximation to the) Jacobian associated with the vector b and the transformation function defined by the function call in the string s. For more details and examples see the chapter on special functions in genr in Guida all’uso di gretl. Vedi anche BFGSmax. fft Risultato: matrice Argomento: X (matrice) Capitolo 2. Guida alle funzioni di gretl 72 Discrete real Fourier transform. If the input matrix X has n columns, the output has 2n columns, where the real parts are stored in the odd columns and the complex parts in the even ones. Should it be necessary to compute the Fourier transform on several vectors with the same number of elements, it is numerically more efficient to group them into a matrix rather than invoking fft for each vector separately. Vedi anche ffti. ffti Risultato: matrice Argomento: X (matrice) Inverse discrete real Fourier transform. It is assumed that X contains n complex column vectors, with the real part in the odd columns and the imaginary part in the even ones, so the total number of columns should be 2n. A matrix with n columns is returned. Should it be necessary to compute the inverse Fourier transform on several vectors with the same number of elements, it is numerically more efficient to group them into a matrix rather than invoking ffti for each vector separately. Vedi anche fft. firstobs Risultato: scalare Argomento: y (serie) First non-missing observation for the variable y. Note that if some form of subsampling is in effect, the value returned may be smaller than the dollar variable $t1. Vedi anche lastobs. floor Risultato: stesso tipo dell’argomento Argomento: y (scalare, serie o matrice) Floor function: returns the greatest integer less than or equal to x. Note: int and floor differ in their effect for negative arguments: int(-3.5) gives −3, while floor(-3.5) gives −4. fracdiff Risultato: serie Argomenti: y (serie) d (scalare) ∆d yt = yt − ∞ X ψi yt−i i=1 where ψi = Γ (i − d) Γ (−d)Γ (i + 1) Note that in theory fractional differentiation is an infinitely long filter. In practice, presample values of y t are assumed to be zero. gammafun Risultato: stesso tipo dell’argomento Argomento: x (scalare, serie o matrice) Returns the gamma function of x. Capitolo 2. Guida alle funzioni di gretl 73 genpois Risultato: serie Argomento: µ (scalare o serie) Generates a series of Poisson pseudo-random variates. If µ is a scalar, all the elements are drawn from the same distribution P (xt = a) = e−µ µa a! Otherwise, if µ is a series, the above becomes P (xt = a) = e−µt µta a! Vedi anche randgen, normal, uniform, mnormal, muniform. gini Risultato: scalare Argomento: y (serie) Returns Gini’s inequality index for the series y. ginv Risultato: matrice Argomento: A (matrice) Returns A+ , the Moore–Penrose or generalized inverse of A, computed via the singular value decomposition. This matrix has the properties AA+ A = A + = A+ + A AA Vedi anche inv, svd. hpfilt Risultato: serie Argomento: y (serie) Returns the cycle from the Hodrick–Prescott filter applied to series y. See Guida all’uso di gretl for details. Vedi anche bkfilt. I Risultato: matrice quadrata Argomento: n (scalare) Returns an identity matrix with n rows and columns. imaxc Risultato: vettore riga Argomento: X (matrice) Returns a vector containing the row indices of the maxima of the columns of X. Vedi anche imaxr, iminc, maxc. Capitolo 2. Guida alle funzioni di gretl 74 imaxr Risultato: vettore colonna Argomento: X (matrice) Returns a vector containing the column indices of the maxima of the rows of X. Vedi anche imaxc, iminr, maxr. iminc Risultato: vettore riga Argomento: X (matrice) Returns the row indices of the minima of the columns of X. Vedi anche imaxc, iminr, minc. iminr Risultato: vettore colonna Argomento: X (matrice) Returns the column indices of the maxima of the rows of X. Vedi anche imaxr, iminc, minr. infnorm Risultato: scalare Argomento: X (matrice) Returns the ∞-norm of the r × c matrix X, namely, kXk∞ = max i c X |Xij | j=1 Vedi anche onenorm. int Risultato: stesso tipo dell’argomento Argomento: x (scalare, serie o matrice) Truncates the fractional part of x. Note: int and floor differ in their effect for negative arguments: int(-3.5) gives −3, while floor(-3.5) gives −4. Vedi anche ceil. inv Risultato: matrice Argomento: A (matrice quadrata) Returns the inverse of A. If A is singular or not square, an error message is produced and nothing is returned. Note that gretl checks automatically the structure of A and uses the most efficient numerical procedure to perform the inversion. The matrix types gretl checks for are: identity; diagonal; symmetric and positive definite; symmetric but not positive definite; and triangular. Vedi anche ginv, invpd. invcdf Risultato: stesso tipo dell’argomento Argomenti: c (carattere) . . . (vedi sotto) p (scalare, serie o matrice) Capitolo 2. Guida alle funzioni di gretl 75 Inverse cumulative distribution function calculator. Returns x such that P (X ≤ x) = p, where the distribution X is determined by the character c; Between the arguments c and p, zero or more additional arguments are required to specify the parameters of the distribution, as follows. Distribution code, c Arg 2 Arg 3 Standard normal z, n or N – – Student’s t (central) t degrees of freedom – Chi square c, x or X degrees of freedom – Snedecor’s F f or F df (num.) df (den.) Binomial b or B p n Vedi anche cdf, critical, pvalue. invpd Risultato: matrice quadrata Argomento: A (matrice simmetrica) Returns the inverse of the symmetric, positive definite matrix A. This function is slightly faster than inv for large matrices, since no check for symmetry is performed; for that reason it should be used with care. islist Risultato: scalare Argomento: s (stringa) Returns 1 if s is the identifier for a currently defined list. Mainly used for checking arguments passed to functions. Vedi anche isnull, isseries, isstring. isnull Risultato: scalare Argomento: s (stringa) Returns 0 if s is the identifier for a currently defined object, be it a scalar, a series, a matrix or a list. Mainly used for checking arguments passed to functions. Vedi anche islist, isseries, isstring. isseries Risultato: scalare Argomento: s (stringa) Returns 1 if s is the identifier for a currently defined series. Mainly used for checking arguments passed to functions. Vedi anche islist, isnull, isstring. isstring Risultato: scalare Argomento: s (stringa) Returns 1 if s is the identifier for a currently defined series. Mainly used for checking arguments passed to functions. Vedi anche islist, isnull, isseries. Capitolo 2. Guida alle funzioni di gretl 76 lags Risultato: lista Argomenti: p (scalare) y (serie o lista) Generates lags 1 to p of the series y, or if y is a list, of all variables in the list. If p = 0, the maximum lag defaults to the periodicity of the data; otherwise p must be positive. lastobs Risultato: scalare Argomento: y (serie) Last non-missing observation for the variable y. Note that if some form of subsampling is in effect, the value returned may be larger than the dollar variable $t2. Vedi anche firstobs. ldet Risultato: scalare Argomento: A (matrice quadrata) Returns the natural log of the determinant of A, computed via the LU factorization. Vedi anche det, rcond. ldiff Risultato: stesso tipo dell’argomento Argomento: y (serie o lista) Computes log differences; starting values are set to NA. log Risultato: stesso tipo dell’argomento Argomento: x (scalare, serie, matrice o lista) Natural logarithm; produces NA for non-positive values. Note: ln is an acceptable alias for log. lngamma Risultato: stesso tipo dell’argomento Argomento: x (scalare, serie o matrice) Log of the gamma function of x. log10 Risultato: stesso tipo dell’argomento Argomento: x (scalare, serie o matrice) Base-10 logarithm; produces NA for non-positive values. log2 Risultato: stesso tipo dell’argomento Argomento: x (scalare, serie o matrice) Base-2 logarithm; produces NA for non-positive values. Capitolo 2. Guida alle funzioni di gretl 77 lower Risultato: matrice quadrata Argomento: A (matrice) Returns an n × n lower triangular matrix B for which Bij = Aij if i ≥ j, and 0 otherwise. Vedi anche upper. lrvar Risultato: scalare Argomenti: y (serie) k (scalare) Returns the long-run variance of y, calculated using a Bartlett kernel with window size k. In formulae: T −k k 1 XX ω̂ (k) = wi (yt − X̄)(yt−i − Ȳ ) T t=k i=−k 2 with wi = 1 − |i| k+1 makemask Risultato: vettore colonna Argomento: y (serie) Produces a column vector containing the observation numbers corresponding to the non-zero entries in the series y. This function is typically useful for filtering out rows of a matrix built from data series. max Risultato: scalare o serie Argomento: y (serie) The maximum of the non-missing observations in series y. maxc Risultato: vettore riga Argomento: X (matrice) Returns the maxima of the columns of X. Vedi anche imaxc, maxr, minc. maxr Risultato: vettore colonna Argomento: X (matrice) Returns the maxima of the rows of X. Vedi anche imaxr, maxc, minr. mcorr Risultato: matrice Argomento: X (matrice) Computes a correlation matrix treating each column of X as a variable. Vedi anche corr, cov, mcov. Capitolo 2. Guida alle funzioni di gretl 78 mcov Risultato: matrice Argomento: X (matrice) Computes a covariance matrix treating each column of X as a variable. Vedi anche corr, cov, mcorr. mean Risultato: scalare o serie Argomento: y (serie) The sample mean of the non-missing observations in series y. meanc Risultato: vettore riga Argomento: X (matrice) Returns the means of the columns of X. Vedi anche meanr, sumc. meanr Risultato: vettore colonna Argomento: X (matrice) Returns the means of the rows of X. Vedi anche meanc, sumr. median Risultato: scalare Argomento: y (serie) The median of the non-missing observations in series y. Vedi anche quantile. mexp Risultato: matrice quadrata Argomento: A (matrice quadrata) Matrix exponential, eA = ∞ X Ak I A A2 A3 = + + + + ··· k! 0! 1! 2! 3! k=0 (This series is sure to converge.) The algorithm used is 11.3.1 from Golub and Van Loan (1996). min Risultato: scalare o serie Argomento: y (serie) The minimum of the non-missing observations in series y. minc Risultato: vettore riga Argomento: X (matrice) Returns the minima of the columns of X. Vedi anche iminc, maxc, minr. Capitolo 2. Guida alle funzioni di gretl 79 minr Risultato: vettore colonna Argomento: X (matrice) Returns the minima of the rows of X. Vedi anche iminr, maxr, minc. missing Risultato: stesso tipo dell’argomento Argomento: x (scalare o serie) Returns a binary variable holding 1 if x is NA. If x is a series, the comparison is done element by element. Vedi anche misszero, ok, zeromiss. misszero Risultato: stesso tipo dell’argomento Argomento: x (scalare o serie) Converts NAs to zeros. If x is a series, the conversion is done element by element. Vedi anche missing, ok, zeromiss. mlag Risultato: matrice Argomenti: X (matrice) p (scalare) Shifts up or down the elements of X. If p > 0 the returned matrix Y has typical element Yi,j = Xi−p,j for i ≥ p and zero otherwise. In other words, the columns of X are shifted down by p rows and the first p rows are filled with zeros. If p is a negative number, X is shifted up and the last rows are filled with zeros. mnormal Risultato: matrice Argomenti: r (scalare) c (scalare) Returns a matrix with r rows and c columns, filled with standard normal pseudo-random variates. Vedi anche normal, muniform. mols Risultato: matrice Argomenti: Y (matrice) X (matrice) &U (riferimento a matrice, o null) Returns the OLS estimates obtained by regressing the T × n matrix Y on the T × k matrix X. The Cholesky decomposition is used. If the third argument is not null, the matrix U will contain the residuals. movavg Risultato: serie Argomenti: x (serie) p (scalare) Capitolo 2. Guida alle funzioni di gretl Calcola la media mobile a p termini per la serie x, vale a dire yt = 80 1 p Pp−1 i=0 xt−i . Il risultato è una media mobile non centrata. Se si desidera una media mobile centrata, si può usare l’operatore anticipo sulla serie risultato. Ad esempio:: tmp = movavg(x,3) y = tmp(+1) mread Risultato: matrice Argomento: s (stringa) Reads a matrix from a text file. The string s must contain the name of the (plain text) file from which the matrix is to be read. The file in question must conform to the following rules: • The columns must be separated by spaces or tab characters. • The decimal separator must be the dot character, “.”. • The first line in the file must contain two integers, separated by a space or a tab, indicating the number of rows and columns, respectively. Should an error occur (such as the file being badly formatted or inaccessible), an empty matrix is returned. Vedi anche mwrite. mshape Risultato: matrice Argomenti: X (matrice) r (scalare) c (scalare) Rearranges the elements of X into a matrix with r rows and c columns. Elements are read from X and written to the target in column-major order. If X contains fewer than k = r c elements, the elements are repeated cyclically; otherwise, if X has more elements, only the first k are used. Vedi anche cols, rows, unvech, vec, vech. muniform Risultato: matrice Argomenti: r (scalare) c (scalare) Returns a matrix with r rows and c columns, filled with uniform (0,1) pseudo-random variates. Note: the preferred method for generating a scalar uniform r.v. is recasting the output of muniform to a scalar, as in scalar x = muniform(1,1) Vedi anche mnormal, uniform. Capitolo 2. Guida alle funzioni di gretl 81 mwrite Risultato: scalare Argomenti: X (matrice) s (stringa) Writes the matrix X to a plain text file named s. The file will contain on the first line two integers, separated by a tab character, with the number of rows and columns; on the next lines, the matrix elements in scientific notation, separated by tabs (one line per row). If file s already exists, it will be overwritten. The return value is 0 on successful completion; if an error occurs, such as the file being unwritable, the return value will be non-zero. Matrices stored via the mwrite command can be easily read by other programs; see Guida all’uso di gretl for details. Vedi anche mread. mxtab Risultato: matrice Argomenti: x (serie o vettore) y (serie o vettore) Returns a matrix holding the cross tabulation of the values contained in x (by row) and y (by column). The two arguments should be of the same type (both series or both column vectors), and because of the typical usage of this function, are assumed to contain integer values only. Vedi anche values. nelem Risultato: scalare Argomento: L (lista) Returns the number of items in list L. nobs Risultato: scalare Argomento: y (serie) Returns the number of non-missing observations for the variable y in the currently selected sample. normal Risultato: serie Argomenti: µ (scalare) σ (scalare) Generates a series of Gaussian pseudo-random variates with mean µ and standard deviation σ . If no arguments are supplied, standard normal variates N(0,1) are produced. Vedi anche randgen, normal, genpois, mnormal, muniform. nullspace Risultato: matrice Argomento: A (matrice) Computes the right nullspace of A, via the singular value decomposition: the result is a matrix B such that AB = [0], except when A has full column rank, in which case an empty matrix is returned. Otherwise, if A is m × n, B will be an n × (n − r ) matrix, where r is the rank of A. Capitolo 2. Guida alle funzioni di gretl 82 Vedi anche rank, svd. obs Risultato: serie Returns a series of consecutive integers, setting 1 at the start of the dataset. Note that the result is invariant to subsampling. This function is especially useful with time-series datasets. Note: you can write t instead of obs with the same effect. Vedi anche obsnum. obsnum Risultato: scalare Argomento: s (stringa) Returns an integer corresponding to the observation specified by the string s. Note that the result is invariant to subsampling. This function is especially useful with time-series datasets. For example, the following code open denmark k = obsnum(1980:1) yields k = 25, indicating that the first quarter of 1980 is the 25th observation in the denmark dataset. Vedi anche obs. ok Risultato: stesso tipo dell’argomento Argomento: x (scalare, serie o lista) Returns a binary variable holding 1 if x is not NA. If x is a series, the comparison is done element by element. If x is a list of series, the output is a series with 0 at the observations for which at least one series in the list is missing, and 1 otherwise. Vedi anche missing, misszero, zeromiss. onenorm Risultato: scalare Argomento: X (matrice) Returns the 1-norm of the r × c matrix X : kXk1 = max j r X |Xij | i=1 Vedi anche infnorm, rcond. ones Risultato: matrice Argomenti: r (scalare) c (scalare) Outputs a matrix with r rows and c columns, filled with ones. Vedi anche seq, zeros. Capitolo 2. Guida alle funzioni di gretl 83 orthdev Risultato: serie Argomento: y (serie) Only applicable if the currently open dataset has a panel structure. Computes the forward orthogonal deviations for variable y, that is s Ti X Ti − t + 1 1 yi,s yi,t − ỹi,t = Ti − t Ti − t − 1 s=t+1 This transformation is sometimes used instead of differencing to remove individual effects from panel data. Vedi anche diff. pmean Risultato: serie Argomento: y (serie) Only applicable if the currently open dataset has a panel structure. Computes the per-unit mean for variable y ; that is, Ti 1 X yi,t ȳi = Ti t=1 where Ti is the number of valid observations for unit i. Missing values are skipped. Vedi anche psd. princomp Risultato: matrice Argomenti: X (matrice) p (scalare) Let the matrix X be T × k, containing T observations on k variables. The argument p must be a positive integer less than or equal to k. This function returns a T × p matrix, P , holding the first p principal components of X. The elements of P are computed as Ptj = k X (j) Zti vi i=1 where Zti is the standardized value of variable i at observation t, Zti = (Xti − X̄i )/σ̂i , and v (j) is the jth eigenvector of the correlation matrix of the Xi s, with the eigenvectors ordered by decreasing value of the corresponding eigenvalues. Vedi anche eigensym. psd Risultato: serie Argomento: y (serie) Only applicable if the currently open dataset has a panel structure. Computes the per-unit sample standard deviation for variable y, that is v u Ti u X u 1 σi = t (yi,t − ȳi )2 Ti − 1 t=1 The above formula holds for Ti ≥ 2, where Ti is the number of valid observations for unit i; if Ti = 0, NA is returned; if Ti = 1, 0 is returned. Capitolo 2. Guida alle funzioni di gretl 84 Note: this function makes it possible to check whether a given variable (say, X) is time-invariant via the condition max(psd(X)) = 0. Vedi anche pmean. pvalue Risultato: stesso tipo dell’argomento Argomenti: c (carattere) . . . (vedi sotto) x (scalare, serie o matrice) Esempi: p1 = pvalue(z, 2.2) p2 = pvalue(X, 3, 5.67) p2 = pvalue(F, 3, 30, 5.67) P -value calculator. Returns P (X > x), where the distribution X is determined by the character c. Between the arguments c and x, zero or more additional arguments are required to specify the parameters of the distribution; see cdf for details. The distributions supported by the pval function are the standard normal, t, Chi square, F , gamma, binomial and Poisson. Vedi anche critical, invcdf. qform Risultato: matrice Argomenti: x (matrice) A (matrice simmetrica) Computes the quadratic form Y = xAx 0 . Using this function instead of ordinary matrix multiplication guarantees more speed and better accuracy. If x and A are not conformable, or A is not symmetric, an error is returned. qnorm Risultato: stesso tipo dell’argomento Argomento: x (scalare, serie o matrice) Returns quantiles for the standard normal distribution. If x is not between 0 and 1, NA is returned. Vedi anche cnorm, dnorm. qrdecomp Risultato: matrice Argomenti: X (matrice) &R (riferimento a matrice, o null) Computes the QR decomposition of an m × n matrix X, that is X = QR where Q is an m × n orthogonal matrix and R is an n × n upper triangular matrix. The matrix Q is returned directly, while R can be retrieved via the optional second argument. Vedi anche eigengen, eigensym, svd. quantile Risultato: scalare o vettore riga Argomenti: y (serie o matrice) p (scalare tra 0 e 1) Capitolo 2. Guida alle funzioni di gretl 85 Given a series argument, returns the p-quantile for the series. For example, when p = 0.5, the median is returned. Given a matrix argument, returns a row vector containing the p-quantiles for the columns of y ; that is, each column is treated as a series. For a series of length n, the p-quantile, q, is defined as: q = y[k] + (n · p − k)(y[k+1] − y[k] ) where k is the integer part of n · p and y[i] is the i-th element of the series when sorted from smallest to largest. rank Risultato: scalare Argomento: X (matrice) Returns the rank of X, numerically computed via the singular value decomposition. Vedi anche svd. ranking Risultato: serie Argomento: y (serie) Returns a series with the ranks of y. The rank for observation i is the number of elements in the series that are less than y i plus one half the number of elements in the series that are equal to y i . (Intuitively, you may think of chess points, where victory gives you one point and a draw gives you half a point.) One is added so the lowest rank is 1 instead of 0. Formally, rank(yi ) = 1 + Xh I(yj < yi ) + 0.5 · I(yj = yi ) i j6=i where I denotes the indicator function. Vedi anche sort, sortby. randgen Risultato: serie Argomenti: c (carattere) a (scalare) b (scalare) Esempi: series x = randgen(u, 0, 100) series t14 = randgen(t, 14) series y = randgen(B, 0.6, 30) series g = randgen(G, 1, 1) All-purpose random number generator. The parameter c is a character, which specifies from which distribution the pseudo-random numbers should be drawn; a and, in some cases, b gauge the shape of the distribution. Capitolo 2. Guida alle funzioni di gretl 86 Distribution c a b Uniform (continuous) u or U minimum maximum Normal z, n or N mean standard deviation Student’s t t degrees of freedom – Chi square c, x or X degrees of freedom – Snedecor’s F f or F df (num.) df (den.) Gamma g or G shape scale Binomial b or B p n Poisson p or P mean – Vedi anche normal, uniform, genpois. rcond Risultato: scalare Argomento: A (matrice simmetrica) Returns the reciprocal condition number for A, which must be symmetric and positive definite, with respect to the 1-norm. In many circumstances, this is a better measure of the sensitivity of A to numerical operations such as inversion than the determinant. Given that A is non-singular, we may define κ(A) = ||A||1 · ||A−1 ||1 This function returns κ(A)−1 . Vedi anche det, ldet, onenorm. resample Risultato: stesso tipo dell’argomento Argomento: x (serie o matrice) Resamples from x with replacement. In the case of a series argument, each value of the returned series, y t , is drawn from among all the values of x t with equal probability. When a matrix argument is given, each row of the returned matrix is drawn from the rows of x with equal probability. round Risultato: stesso tipo dell’argomento Argomento: x (scalare, serie o matrice) Rounds to the nearest integer. Note that when x lies halfway between two integers, rounding is done away from zero, so for example 2.5 rounds to 3, but round(-3.5) gives −4. This is a common convention in spreadsheet programs, but other software may yield different results. Vedi anche ceil, floor, int. rows Risultato: scalare Argomento: X (matrice) Number of rows of the matrix X. Vedi anche cols, mshape, unvech, vec, vech. sd Risultato: scalare o serie Argomento: y (serie) Capitolo 2. Guida alle funzioni di gretl 87 Sample standard deviation of the non-missing observations in series y. Vedi anche var. sdiff Risultato: stesso tipo dell’argomento Argomento: y (serie o lista) Computes seasonal differences: yt − yt−k , where k is the periodicity of the current dataset (see $pd). Starting values are set to NA. selifc Risultato: matrice Argomenti: A (matrice) b (vettore riga) Selects from A only the columns for which the corresponding element of b is non-zero. b must be a row vector with the same number of columns as A. Vedi anche selifr. selifr Risultato: matrice Argomenti: A (matrice) b (vettore colonna) Selects from A only the rows for which the corresponding element of b is non-zero. b must be a column vector with the same number of rows as A. Vedi anche selifc. seq Risultato: vettore riga Argomenti: a (scalare) b (scalare) Returns a row vector filled with consecutive integers, with a as first element and b last. If a is greater than b the sequence will be decreasing. If either argument is not integral its fractional part is discarded. Vedi anche ones, zeros. sin Risultato: stesso tipo dell’argomento Argomento: x (scalare, serie o matrice) Sine. Vedi anche cos, tan, atan. sort Risultato: stesso tipo dell’argomento Argomento: x (serie o vettore) Sorts x in ascending order, skipping observations with missing values when x is a series. Vedi anche dsort, values. Capitolo 2. Guida alle funzioni di gretl 88 sortby Risultato: serie Argomenti: y1 (serie) y2 (serie) Returns a series containing the elements of y2 sorted by increasing value of the first argument, y1. Vedi anche sort, ranking. sqrt Risultato: stesso tipo dell’argomento Argomento: x (scalare, serie o matrice) Square root of x; produces NA for negative values. sst Risultato: scalare Argomento: y (serie) Sum of squared deviations from the mean for the non-missing observations in series y. Vedi anche var. sum Risultato: scalare Argomento: y (serie) Sum of the non-missing observations in series y. sumc Risultato: vettore riga Argomento: X (matrice) Returns the sums of the columns of X. Vedi anche meanc, sumr. sumr Risultato: vettore colonna Argomento: X (matrice) Returns the sums of the rows of X. Vedi anche meanr, sumc. svd Risultato: vettore riga Argomenti: X (matrice) &U (riferimento a matrice, o null) &V (riferimento a matrice, o null) Performs the singular values decomposition of the r × c matrix X: X =U σ1 σ2 .. V . σn , where n = min(r , c). U is r × n and V is n × c, with U 0 U = I and V V 0 = I. Capitolo 2. Guida alle funzioni di gretl 89 The singular values are returned in a row vector. The left and/or right singular vectors U and V may be obtained by supplying non-null values for arguments 2 and 3, respectively. For any matrix A, the code s = svd(A, &U, &V) B = (U .* s) * V should yield B identical to A (apart from machine precision). Vedi anche eigengen, eigensym, qrdecomp. tan Risultato: stesso tipo dell’argomento Argomento: x (scalare, serie o matrice) Tangent. tr Risultato: scalare Argomento: A (matrice quadrata) Returns the trace of the square matrix A, namely P i Aii . Vedi anche diag. transp Risultato: matrice Argomento: X (matrice) Matrix transposition. Note: this is rarely used; in order to get the trasnpose of a matrix, in most cases you can just use the prime operator: X’. uniform Risultato: serie Argomenti: a (scalare) b (scalare) Generates a series of uniform pseudo-random variates in the interval (a, b), or, if no arguments are supplied, in the interval (0,1). The algorithm used is the Mersenne Twister by Matsumoto and Nishimura (1998). Vedi anche randgen, normal, genpois, mnormal, muniform. unvech Risultato: matrice quadrata Argomenti: v (vettore) b (scalare) Returns an n × n symmetric matrix obtained by rearranging the elements of v. The number of elements in v must be a triangular integer — i.e., a number k such that an integer n exists with the property k = n(n + 1)/2. This is the inverse of the function vech. Vedi anche mshape. Capitolo 2. Guida alle funzioni di gretl 90 upper Risultato: matrice quadrata Argomento: A (matrice quadrata) Returns an n × n upper triangular matrix B for which Bij = Aij if i ≤ j and 0 otherwise. Vedi anche lower. values Risultato: vettore colonna Argomento: x (serie o vettore) Returns a vector containing the distinct elements of x sorted in ascending order. Note: because of its typical usage, x is assumed to contain integer values only. If not, the fractional part is truncated, so values(x) is always identical to values(int(x)). Vedi anche dsort, sort. var Risultato: scalare o serie Argomento: y (serie) Sample variance of the non-missing observations in y; the sum of squared deviations from the mean is divided by (n − 1) for n > 1. If n = 1, zero is returned; if n = 0, NA is returned. Vedi anche sd. vec Risultato: vettore colonna Argomento: X (matrice) Stacks the columns of X as a column vector. Vedi anche mshape, unvech, vech. vech Risultato: vettore colonna Argomento: A (matrice quadrata) Returns in a column vector the elements of A on and above the diagonal. Typically, this function is used on symmetric matrices; in this case, it can be undone by the function unvech. Vedi anche vec. zeromiss Risultato: stesso tipo dell’argomento Argomento: x (scalare o serie) Converts zeros to NAs. If x is a series, the conversion is done element by element. Vedi anche missing, misszero, ok. zeros Risultato: matrice Argomenti: r (scalare) c (scalare) Outputs a zero matrix with r rows and c columns. Vedi anche ones, seq. Capitolo 3 Opzioni, argomenti e percorsi 3.1 Avvio di gretl gretl (in MS Windows, gretlw32.exe)1 — Apre il programma e aspetta l’input dall’utente. gretl filedati — Avvia il programma caricando nello spazio di lavoro il file di dati indicato. Il file può essere in uno dei vari formati supportati (si veda la Guida ai comandi di gretl): il programma cercherà di riconoscere il formato del file e di trattarlo in modo appropriato. Si veda anche la Sezione 3.4 per quanto riguarda la ricerca dei percorsi. gretl --help (o gretl -h) — Mostra un breve riepilogo delle modalità di uso ed esce. gretl --version (o gretl -v) — Mostra le informazioni sulla versione del programma ed esce. gretl --english (o gretl -e) — Forza l’utilizzo della versione inglese invece di quella italiana. gretl --run file (o gretl -r file) — Avvia il programma e apre una finestra che mostra il file di comandi indicato, pronto per essere eseguito. Si veda la Sezione 3.4 per quanto riguarda la ricerca dei percorsi. gretl --db database (o gretl -d database) — Avvia il programma e apre una finestra che mostra il database indicato. Se i file del database (il file .bin e il relativo file .idx, si veda la Guida ai comandi di gretl) non sono nella directory predefinita dei database, occorre specificare il percorso completo dei file. gretl --dump (o gretl -c) — Scrive le informazioni di configurazione del programma in un file di testo (il nome del file è mostrato nello standard output). Può essere utile nella risoluzione di problemi di funzionamento. gretlw32 --debug (o gretlw32 -g) — (solo MS Windows) Apre una finestra di terminale per mostrare eventuali messaggi inviati allo “standard output” o allo “standard error”. Questi messaggi, che di solito non sono visibili in Windows, possono essere utili per risolvere problemi di funzionamento. 3.2 Menù preferenze Varie funzionalità di gretl sono configurabili nel menù Strumenti, Preferenze menu. Il menù contiene opzioni per la scelta del carattere a larghezza fissa da usare nelle schermate di gretl, e, su alcune piattaforme, il carattere usato per i menù e per gli altri messaggi. Le altre opzioni sono organizzate in cinque pagine, nel modo seguente. Pagina Generali: qui è possibile configurare la directory base per i file condivisi di gretl. Inoltre, 1 In Linux viene installato uno script “wrapper” chiamato gretl. Questo script controlla se sia impostata la variabile di ambiente DISPLAY e in caso positivo lancia la versione grafica del programma, altrimenti lancia la versione a riga di comando, gretlcli. 91 Capitolo 3. Opzioni, argomenti e percorsi 92 ci sono alcune caselle di testo: selezionando “Avvisa in caso di aggiornamenti di gretl”, gretl cercherà di connettersi al server dei database appena avviato; de-selezionando “Mostra la barra degli strumenti di gretl”, la barra degli strumenti sarà disabilitata. Se l’impostazione locale del proprio sistema non usa il punto (“.”) come separatore delle cifre decimali, de-selezionando “Usa le impostazioni locali per il punto decimale”, gretl userà comunque il carattere punto. Selezionando “Abilita comandi shell” sarà possibile invocare comandi della shell all’interno degli script e nel terminale di gretl (questa funzionalità è disabilitata in modalità predefinita per motivi di sicurezza). Inoltre, in “Generali” è possibile scegliere l’algoritmo usato da gretl per calcolare le stime dei minimi quadrati. La scelta predefinita è la decomposizione di Cholesky, che è veloce, relativamente economica in termini di requisiti di memoria, e accurata per la maggior parte delle applicazioni. L’alternativa è la decomposizione QR, che è computazionalmente più impegnativa e richiede una maggiore quantità di memoria, ma è più accurata. È poco probabile dover avere bisogno dell’accuratezza ulteriore fornita dalla decomposizione QR, a meno che non si abbia a che fare con dati molto mal-condizionati e si sia interessati a valori dei coefficienti e degli errori standard precisi per più di 7 cifre decimali2 . Pagina Database: è possibile selezionare la directory in cui iniziare a cercare i database in formato interno di gretl e quella per i database in formato RATS 4; il nome host del server dei database di gretl a cui connettersi, e l’indirizzo IP e il numero di porta del proxy HTTP da usare per contattare il server dei database, se necessario (se si è dietro a un firewall). Pagina Programmi: è possibile specificare i nomi o i percorsi per alcuni programmi esterni che possono essere chiamati da gretl in alcuni casi. Si noti che la voce “Comando per compilare file TEX” può essere impostata come latex o pdflatex: se si sceglie latex, le anteprime dei documenti TEX saranno in formato DVI; se si sceglie pdflatex, le anteprime saranno in formato PDF. Pagina HCCME: contiene le preferenze riguardanti la stima robusta della matrice di covarianza. Si veda la Guida ai comandi di gretl per i dettagli. Pagina Manuali: è possibile scegliere la lingua preferita per la documentazione completa di gretl in formato PDF (al momento sono supportati solo inglese e italiano). Se si usa la documentazione inglese è possibile scegliere anche il formato della pagina, US letter o A4. Le impostazioni scelte usando il menù preferenze sono conservate da una sessione di gretl all’altra. Su MS Windows vengono salvate nel registro di Windows, mentre su altre piattaforme sono salvate in un file di testo chiamato .gretlrc nella directory principale dell’utente. 3.3 Avvio di gretlcli gretlcli — Apre il programma e attende l’input dall’utente. gretlcli filedati — Avvia il programma caricando nello spazio di lavoro il file di dati indicato. Il file può essere in uno qualsiasi dei formati supportati da gretl (si veda la Guida ai comandi di gretl per i dettagli). Il programma cercherà di riconoscere il formato del file e di trattarlo in modo appropriato. Si veda anche la Sezione 3.4 per quanto riguarda la ricerca dei percorsi. gretlcli --help (o gretlcli -h) — Mostra un breve riepilogo delle modalità di uso ed esce. gretlcli --version (o gretlcli -v) — Mostra informazioni sulla versione del programma ed esce. gretlcli --english (o gretlcli -e) — Forza l’utilizzo della versione inglese invece di quella italiana. gretlcli --run file (o gretlcli -r file) 2 L’uso della decomposizione QR è attivabile anche impostando la variabile di ambiente GRETL_USE_QR a un qualsiasi valore non nullo. Capitolo 3. Opzioni, argomenti e percorsi 93 — Esegue i comandi contenuti nel file e aspetta ulteriore input dalla riga di comando. Si veda la Sezione 3.4 per quanto riguarda la ricerca dei percorsi. gretlcli --batch file (o gretlcli -b file) — Esegue i comandi contenuti nel file ed esce; tipicamente questa opzione viene usata redirigendo i risultati del comando a un file. Si veda la Sezione 3.4 per quanto riguarda la ricerca dei percorsi. Se si usano le opzioni --run e --batch, il file richiamato deve indicare un file di dati da aprire. Ciò può essere fatto usando il comando open nel file. 3.4 Ricerca dei percorsi Quando si indica il nome di un file di dati o di comandi a gretl o gretlcli sulla riga di comando, il file viene cercato nel modo seguente: 1. “Esattamente come viene specificato”. Ossia, nella directory di lavoro attuale, o, se viene indicato un percorso completo, nella posizione indicata. 2. Nella directory gretl dell’utente (si veda la Tabella 3.1 per i valori predefiniti). Si noti che la la parola chiave PERSONAL viene interpretata da Windows a seconda dell’utente e della lingua del sistema: ad esempio su un sistema in lingua inglese, verrà interpretata come la directory “My Documents”. 3. In qualsiasi directory immediatamente contenuta nella directory gretl dell’utente. 4. Nel caso di un file di dati, la ricerca continua nella directory principale dei dati di gretl. Nel caso di un file di comandi, la ricerca continua nella directory principale dei file di comandi. Si veda la Tabella 3.1 per i valori predefiniti. PREFIX indica la directory base scelta al momento dell’installazione di gretl. 5. Nel caso dei file di dati, la ricerca continua in tutte le directory immediatamente contenute nella directory principale dei dati. Tabella 3.1: Impostazioni predefinite dei percorsi Linux MS Windows Directory gretl dell’utente $HOME/gretl PERSONAL\gretl Directory di sistema dei dati PREFISSO/share/gretl/data PREFIX\gretl\data Directory di sistema dei file di comandi PREFIX/share/gretl/scripts PREFIX\gretl\scripts Non è quindi necessario specificare il percorso completo per un file di dati o di comandi, a meno che non si voglia fare a meno del meccanismo di ricerca automatico (ciò è valido anche per gretlcli quando si indica un nome di file come argomento per il comando open o il comando run) Quando un file di comandi contiene l’istruzione di aprire un file di dati, l’ordine di ricerca per il file è quello descritto sopra, con l’eccezione che il file viene cercato anche nella directory che contiene lo script, immediatamente dopo aver tentato di cercare il file di dati “esattamente come viene specificato”. MS Windows In MS Windows le informazioni di configurazione per gretl e gretlcli sono scritte nel registro di Windows. Quando gretl è installato per la prima volta, viene creata un’appropriata serie di voci di registro; successivamente le impostazioni possono essere modificate attraverso il menù Strumenti, Preferenze di gretl. Se occorre eseguire delle modifiche manuali dei valori, le voci di Capitolo 3. Opzioni, argomenti e percorsi 94 registro possono essere trovate (usando il programma standard di Windows regedit.exe) sotto Software\gretl in HKEY_LOCAL_MACHINE (la directory principale di gretl e i percorsi per i vari programmi ausiliari) e in HKEY_CURRENT_USER (tutte le altre variabili configurabili). Capitolo 4 Parole riservate Le parole riservate, che non possono essere usate come nomi di variabili, appartengono a una delle categorie seguenti: • Nomi di costanti: CONST, NA, const, null, pi. • Nomi di variabili interne e tipi di dati: matrix, obs, scalar, series, t. • Nomi di funzioni, come mostrato nella Tabella 4.1. Tabella 4.1: Nomi di funzioni BFGSmax I abs boxcox cdemean cdf colnames cols corr det diag diff exp fdjac fft gammafun genpois imaxr invpd acos argname asin atan bkfilt cdiv ceil cholesky cmult cnorm corrgm cos cov critical cum dnorm dsort dummify eigengen eigensym ffti filter firstobs floor fracdiff getenv gini ginv grab hpfilt imaxc imhof iminc iminr infnorm int inv invcdf islist isnull isscalar isseries isstring lags lastobs ldet ldiff lincomb ljungbox ln lngamma log log10 log2 lower lrvar makemask max maxc maxr mcorr mcov mcovg mean meanc meanr median mexp min minc minr missing misszero mlag mnormal mols movavg mpols mread mshape msortby muniform mwrite mxtab nelem nobs normal nullspace obslabel obsnum ok onenorm ones orthdev pdf pmax pmean pmin pnobs polroots princomp psd pvalue qform qnorm qrdecomp quantile randgen rank ranking rcond readfile resample round rows sd sdc sdiff selifc selifr seq sin sort sortby sqrt sst strlen strstr sum sumc sumr svd tan toepsolv tr transp trimr uniform unvech upper urcpval values var varname varnum vec vech wmean wsd wvar xmax xmin xpx zeromiss zeros 95