1headings 10 2Tests 24 3add 4adf 5bds 6bkw 7chow 8coeffsum 9coint 10cusum 11difftest 12johansen 13kpss 14leverage 15levinlin 16meantest 17modtest 18normtest 19omit 20panspec 21qlrtest 22reset 23restrict 24runs 25vartest 26vif 27Graphs 10 28boxplot 29gnuplot 30graphpg 31hfplot 32panplot 33plot 34qqplot 35rmplot 36scatters 37textplot 38Statistics 13 39anova 40corr 41corrgm 42fractint 43freq 44hurst 45mahal 46pca 47pergm 48spearman 49summary 50xcorrgm 51xtab 52Dataset 18 53append 54data 55dataset 56delete 57genr 58info 59join 60labels 61markers 62nulldata 63open 64rename 65setinfo 66setmiss 67setobs 68smpl 69store 70varlist 71Estimation 34 72ar 73ar1 74arch 75arima 76arma 77biprobit 78dpanel 79duration 80equation 81estimate 82garch 83gmm 84heckit 85hsk 86intreg 87lad 88logistic 89logit 90midasreg 91mle 92mpols 93negbin 94nls 95ols 96panel 97poisson 98probit 99quantreg 100system 101tobit 102tsls 103var 104vecm 105wls 106Programming 19 107break 108catch 109clear 110elif 111else 112end 113endif 114endloop 115flush 116foreign 117funcerr 118function 119if 120include 121loop 122makepkg 123run 124set 125setopt 126Transformations 10 127diff 128discrete 129dummify 130lags 131ldiff 132logs 133orthdev 134sdiff 135square 136stdize 137Utilities 7 138eval 139help 140modeltab 141pkg 142pvalue 143quit 144shell 145Printing 7 146eqnprint 147modprint 148outfile 149print 150printf 151sprintf 152tabprint 153Prediction 1 154fcast 155 156# add Tests 157 158Argomento: lista-variabili 159Opzioni: --lm (effettua un test LM (solo OLS)) 160 --quiet (non mostra le stime del modello aumentato) 161 --silent (non mostra nulla) 162 --vcv (mostra la matrice di covarianza) 163 --both (aggiunge come regressore e come strumento, solo per TSLS) 164Esempi: add 5 7 9 165 add xx yy zz --quiet 166 167Va invocato dopo un comando di stima. Esegue un test congiunto per 168l'aggiunta delle variabili specificate all'ultimo modello stimato; si può 169avere accesso ai risultati del test tramite "$test" e "$pvalue". 170 171Di default, aggiunge al modello precedente le variabili nella 172lista-variabili e stima il nuovo modello. Il test è un test di Wald sul 173modello aumentato, che rimpiazza quello originale come "ultimo modello" per 174quanto riguarda,ad esempio, il contenuto di $uhat o test ulteriori. 175 176Alternativamente, con l'opzione --lm (disponibile solo per i modelli stimati 177via OLS), viene effettuato un test LM. Viene eseguita una regressione 178ausiliaria in cui la variabile dipendente è il residuo dell'ultimo modello 179e le variabili indipendenti sono quello del modello originale più 180lista-variabili. Sotto l'ipotesi nulla che le variabili aggiuntive non hanno 181potere esplicativo, il prodotto fra l'R-quadro non aggiustato della 182regressione ausiliaria e il numero di osservazioni si distribuisce come una 183chi quadro con tanti gradi di libertà quante sono le variabili in 184lista-variabili. In questo caso, il modello originale non viene rimpiazzato. 185 186L'opzione --both è specifica per le stime con i minimi quadrati a due 187stadi: essa indica che le nuove variabili vanno aggiunte sia alla lista dei 188regressori che a quella degli strumenti; di default, infatti, la 189lista-variabili viene aggiunta soltanto ai regressori. 190 191Accesso dal menù: Finestra del modello, /Test/ADD - Aggiungi variabili 192 193# adf Tests 194 195Argomenti: ordine lista-variabili 196Opzioni: --nc (test senza costante) 197 --c (solo con la costante) 198 --ct (con costante e trend) 199 --ctt (con costante, trend e trend al quadrato) 200 --seasonals (include variabili dummy stagionali) 201 --gls (rimuove la media o il trend usando GLS) 202 --verbose (mostra i risultati della regressione) 203 --quiet (non mostra i risultati) 204 --difference (usa la differenza prima della variabile) 205 --test-down[=criterio] (ordine di ritardo automatico) 206 --perron-qu (si veda di seguito) 207Esempi: adf 0 y 208 adf 2 y --nc --c --ct 209 adf 12 y --c --test-down 210 Vedi anche jgm-1996.inp 211 212Le opzioni precedenti e la discussione seguente si riferiscono per lo più 213all'uso del comando adf con serie storiche vere e proprie. La discussione 214dell'uso con dati panel è esposta nella sezione "Dati Panel". 215 216Calcola una serie di test Dickey-Fuller sulle variabili specificate, 217assumendo come ipotesi nulla che le variabili abbiano una radice unitaria. 218Se si usa l'opzione --difference, i test vengono condotti sulla differenza 219prima delle variabili e la discussione che segue va riferita a questa 220trasformazione delle variabili. 221 222Per impostazione predefinita, vengono mostrate due varianti del test: una 223basata su una regressione che contiene solo una costante, e una che include 224la costante e un trend lineare. È possibile controllare le varianti 225specificando una o più fra le opzioni --nc, --c, --ct, --ctt. 226 227L'opzione --gls può essere utilizzata congiuntamente alle opzioni --c e 228--ct. L'effetto di questa opzione è che la rimozione della media o del 229trend lineare dalla variabile che deve essere testata è fatta utilizzando 230la procedura GLS suggerita da Elliott, Rothenberg e Stock (1996), la quale 231restituisce un test di potenza superiore al test standard di Dickey-Fuller. 232Questa opzione non è compatibile con --nc,--ctt o --seasonals. 233 234In tutti i casi, la variabile dipendente nella regressione usata per 235calcolare il test è la differenza prima della variabile specificata, y, e 236la variabile dipendente più importante è il ritardo (di ordine uno) di y. 237Il modello è costruito in modo che il coefficiente della variabile 238ritardata y è pari a 1 meno la radice. Ad esempio, il modello con una 239costante può essere scritto come 240 241 (1 - L)y(t) = b0 + (a-1)y(t-1) + e(t) 242 243Sotto l'ipotesi nulla di radice unitaria il coefficiente della y ritardata 244è nullo; sotto l'alternativa che y sia stazionaria il coefficiente è 245negativo. Di conseguenza, questo test è intrinsecamente a una coda. 246 247Selezione dell'ordine dei ritardi 248 249Nella versione più semplice del test Dickey-Fuller test si assume che il 250termine di errore nella regressione di test sia serialmente incorrelato. 251Poiché questo è spesso implausibile, la specificazione viene spesso estesa 252includendo uno o più ritardi della variabile dipendente, dando così luogo 253al cosiddetto test ADF (Augmented Dickey-Fuller). L'argomento ordine indica 254il numero di tali ritardi, k, che può dipendere dall'ampiezza campiopnaria 255T. 256 257 Per selezionare un k fisso, basta inserire un numero non negativo per 258 ordine. 259 260 Per avere un numero di ritardi dipendente da T, specificare come order il 261 numero -1. In questo caso, l'ordine viene automaticamente scelto secondo 262 l'indicazione di Schwert (1989), ossia la parte intera di 12(T/100)^0.25. 263 264In generale, però, non si sa quanti ritardi siano necessari per "sbiancare" 265i residui Dickey-Fuller. Spesso si specifica il valore massimo di k e si 266lascia decidere ai dati il numero di ritardi effettivo. Per fare questo, 267c'è l'opzione --test-down: il criterio usato per scegliere il k ottimale è 268determinato dal parametro dato a questa opzione, che deve essere uno fra AIC 269(default), BIC o tstat. 270 271Quando si testa "all'indietro" con lo AIC o il BIC, l'ordine dei ritardi 272finale viene scelto in modo da ottimizzare rispettivamente una versione 273modificata del Criterio di Informazione di Akaike o del Criterio Bayesiano 274di Schwartz. La procedura varia a seconda se si sia scelta l'opzione --gls: 275con la de-trendizzazione GLS, i valori AIC e BIC sono quelli "modificati" 276descritti in Ng e Perron (2001), altrimenti sono quelli standard. Nel caso 277GLS è disponibile un'ulteriore opzione, e cioè --perron-qu; essa fa sì 278che i criteri di informazione modificati sono calcolati secondo il metodo 279raccomandato in Perron e Qu (2007). In quest'ultimo caso, i dati sono prima 280centrati in media o detrendizzati via OLS; il GLS viene applicato dopo aver 281scelto l'ordine dei ritardi. 282 283Quando si testa "all'indietro" usando la statistica t, la procedura è la 284seguente: 285 2861. Stima la regressione Dickey-Fuller con k ritardi della variabile 287 dipendente. 288 2892. Se questo ordine di ritardi è significativo, esegue il test con l'ordine 290 di ritardo k. Altrimenti, prova il test con k = k - 1; se k = 0, esegue 291 il test con ordine di ritardo 0, altrimenti va al punto 1. 292 293Durante il punto 2 spiegato sopra, "significativo" significa che la 294statistica t per l'ultimo ritardo abbia un p-value asintotico a due code per 295la distribuzione normale pari a 0.10 o inferiore. 296 297In sostanza, se accettiamo i vari argomenti di Perron, Ng, Qu e Schwert 298citati sopra, il comando più appropriato per testare una serie y è 299qualcosa del tipo: 300 301 adf -1 y --c --gls --test-down --perron-qu 302 303(Sosotituendo --ct a --c se la serie contiene un trend evidente.) L'ordine 304dei ritardi del test verrà determinato testando all'indietro con il 305criterio AIC modificato partendo del massimo di Schwert maximum, col 306raffinamento di Perron-Qu. 307 308I p-value per questo test sono basati su stime della superficie di risposta. 309Se non si usa il GLS, essi sono tratti da MacKinnon (1996). Altrimenti, si 310usa Cottrell (2015) o, quando si testa all'indietro, Sephton (2021). I 311P-value sono specifici per ampiezza campionaria, a meno che non vengano 312dichiarati come asintotici nell'output. 313 314Dati panel 315 316Quando il comando adf è usato con dati panel per calcolare un test panel di 317radici unitarie le opzioni applicabili sono piuttosto diverse. 318 319In primo luogo, mentre nel caso di serie storiche pure è possibile indicare 320un elenco di variabili da testare, con dati panel ciascun comando può 321esaminare una sola variabile alla volta. Secondo, le opzioni che governano 322l'inclusione di trend deterministici diventano mutualmente esclusive: è 323necessario scegliere fra il caso senza costante, quello con solo la 324costante, e quello che la costante e il trend; il default è il secondo. 325L'opzione --seasonals, inoltre, non è disponibile. Terzo, l'opzione 326--verbose ha un significato diverso: produce un breve resoconto del test per 327ciascuna singola serie storica (il default prevede di mostrare solo il 328risultato complessivo). 329 330Il test complessivo (ipotesi nulla: la variabile in questione ha una radice 331unitaria per tutte le unità panel) viene calcolata in uno o in entrambi i 332modi disponibili: usando il metodo di Im, Pesaran e Shin (Journal of 333Econometrics, 2003) oppure quello di Choi (Journal of International Money 334and Finance, 2001). Il test di Choi richiede che siano disponibili i P-value 335dei test singoli; se così non fosse, per via delle opzioni selezionate, 336esso viene omesso. La statistica riportata per il test di Im, Pesaran e Shin 337varia come segue: se l'ordine di ritardi per il test è positivo, viene 338riportata la statistica W; altrimenti, viene riportata la statistica Z se la 339lunghezza delle serie è diversa fra individui, quella t barrato se è 340uguale per tutte le unità. vedi anche il comando "levinlin". 341 342Accesso dal menù: /Variabile/Test di radice unitaria/Test Dickey-Fuller 343 aumentato 344 345# anova Statistics 346 347Argomenti: response treatment [ block ] 348Opzione: --quiet (non stampa i risultati) 349 350Analisi della varianza: response è una serie che misura un effetto di 351interesse e treatment deve essere una variabile discreta che identifica due 352o più tipi di trattamento (o non trattamento). Nel caso dell'ANOVA a due 353vie, la variabile block (anch'essa discreta) identifica i valori di qualche 354variabile di controllo. 355 356Se non è stata selezionata l'opzione --quiet, questo comando stampa una 357tabella che mostra le somme e le medie dei quadrati, nonché un test F. Il 358test F e il suo p-value possono essere recuperati rispettivamente con gli 359accessori "$test" e "$pvalue". 360 361L'ipotesi nulla del test F è che la risposta media sia invariante rispetto 362al tipo di trattamento; in altre parole, che il trattamento non abbia alcun 363effetto. Formalmente, la validità del test richiede che la varianza della 364risposta sia la stessa per tutti i tipi di trattamento. 365 366Si noti che i risultati prodotti da questo comando costituiscono in realtà 367un sottoinsieme dell'informazione fornita dalla procedura seguente, 368facilmente implementabile in gretl. Create un insieme di variabili dummy 369associate a tutti i tipi di trattamento, tranne uno. Nel caso dell'ANOVA a 370due vie, create anche un insieme di variabili dummy associate a tutti i 371"blocchi", tranne uno. Una volta fatto questo, regredite response su una 372costante e le dummy usando "ols". Per un'analisi a una via la tabella ANOVA 373può essere creata ricorrendo all'opzione --anova del comando ols. Nel caso 374di un'analisi a due vie il test F può essere calcolato usando il comando 375"omit". Per esempio, se assumiamo che y sia la risposta, xt identifichi il 376trattamento e xb identifichi i blocchi: 377 378 # analisi a una via 379 list dxt = dummify(xt) 380 ols y 0 dxt --anova 381 # analisi a due vie 382 list dxb = dummify(xb) 383 ols y 0 dxt dxb 384 # test di significatività congiunta di dxt 385 omit dxt --quiet 386 387Accesso dal menù: /Modello/Altri modelli lineari/ANOVA 388 389# append Dataset 390 391Argomento: file-dati 392Opzioni: --time-series (si veda oltre) 393 --fixed-sample (si veda oltre) 394 --update-overlap (si veda oltre) 395 --quiet (non stampa nulla) 396 Si veda oltre per opzioni speciali addizionali 397 398Apre un file di dati e aggiunge il suo contenuto al dataset attuale, se i 399nuovi dati sono compatibili. Il programma cerca di riconoscere il formato 400del file di dati (interno, testo semplice, CSV, Gnumeric, Excel, ecc.). 401 402I dati aggiunti possono avere la forma di osservazioni aggiuntive su 403variabili già presenti nel dataset, o di nuove variabili. In quest'ultimo 404caso occorre che il numero delle nuove osservazioni sia pari a quello delle 405osservazioni presenti nel dataset, oppure che i nuovi dati includano 406informazioni precise sulle osservazioni in modo che gretl possa capire come 407aggiungere i valori. 408 409Attenzione: non è supportato il caso i nuovo dati inizino prima e finiscano 410dopo quelli originali. Per aggiungere nuove serie in tal caso bisogna usare 411l'opzione --fixed-sample; ciò ha l'effetto di di sopprimere l'aggiunta di 412osservazioni, e quindi restringere l'operazione all'aggiunta di nuove serie. 413 414Nel caso di aggiunta di dati a un dataset panel, c'è una possibilità 415speciale. Siano n il numero di unità cross-section, T il numero di periodi 416temporali, e m il numero di nuove osservazioni da aggiungere. Se m = n i 417nuovi dati saranno considerati invarianti nel tempo, e saranno copiati per 418ognuno dei periodi temporali. D'altra parte, se m = T i dati saranno 419trattati come invarianti tra le unità. Se il panel è "quadrato", ed m è 420pari sia ad n che a T, il comportamento predefinito consiste nel trattare i 421nuovi casi come invarianti nel tempo, ma è possibile forzare 422l'interpretazione dei nuovi dati come serie storiche usando l'opzione 423--time-series (che verrà ignorata in tutti gli altri casi). 424 425Quando viene scelto per l'aggiunta un file di dati, potrebbe esserci una 426parziale sovrapposizione con il dataset esistente; in altre parole, una o 427più serie potrebbero avere osservazioni in comune dalle due fonti. Se viene 428passata l'opzione --update-overlap, il comando append sostituirà le 429osservazioni in comune con quelle provenienti dal file dei dati; se no, i 430valori presenti nel dataset in quel momento saranno lasciati inalterati. 431 432Le opzioni specializzate aggiuntive --sheet, --coloffset, --rowoffset e 433--fixed-cols funzionano come quelle corrispondenti per il comando "open". 434 435Vedi anche "join" per una gestione più sofisticata di più di un file di 436dati esterno. 437 438Accesso dal menù: /File/Aggiungi dati 439 440# ar Estimation 441 442Argomenti: ritardi ; variabile-dipendente variabili-indipendenti 443Opzioni: --vcv (mostra la matrice di covarianza) 444 --quiet (non riporta i parametri stimati) 445Esempio: ar 1 3 4 ; y 0 x1 x2 x3 446 447Calcola le stime parametriche usando la procedura iterativa generalizzata di 448Cochrane-Orcutt (si veda il Capitolo 9.5 di Ramanathan (2002). La procedura 449termina quando le somme dei quadrati degli errori consecutivi non 450differiscono per più dello 0.005 per cento, oppure dopo 20 iterazioni. 451 452"ritardi" è una lista di ritardi nei residui, conclusa da un punto e 453virgola. Nell'esempio precedente, il termine di errore è specificato come 454 455 u(t) = rho(1)*u(t-1) + rho(3)*u(t-3) + rho(4)*u(t-4) 456 457Accesso dal menù: /Modello/Serie storiche/AR - Stima autoregressiva 458 459# ar1 Estimation 460 461Argomenti: depvar indepvars 462Opzioni: --hilu (usa la procedura di Hildreth-Lu) 463 --pwe (usa lo stimatore di Prais-Winsten) 464 --vcv (mostra la matrice di covarianza) 465 --no-corc (non affinare i risultati con Cochrane-Orcutt) 466 --loose (usa un criterio di convergenza più blando) 467 --quiet (non stampa nulla) 468Esempi: ar1 1 0 2 4 6 7 469 ar1 y 0 xlist --hilu --no-corc 470 ar1 y 0 xlist --pwe 471 472Calcola stime feasible GLS per un modello in cui il termine di errore segue 473un processo autoregressivo del prim'ordine. 474 475Il metodo predefinito è la procedura iterativa di Cochrane-Orcutt (si veda 476ad esempio il capitolo 9.4 di Ramanathan, 2002). La procedura termina quando 477le stime successive del coefficiente di autocorrelazione non differiscono 478per più di 0.001, oppure dopo 20 iterazioni. Sarà segnalato un errore se 479la convergenza non è avvenuta dopo 100 iterazioni. Se ciò non si verifica 480entro la 100esima iterata verrà stampato un messaggio di errore. 481 482Se si usa l'opzione --pwe, viene usato lo stimatore di Prais-Winsten, che 483prevede una procedura simile a quella di Cochrane-Orcutt; la differenza è 484che mentre Cochrane-Orcutt tralascia la prima osservazione, Prais-Winsten ne 485fa uso. Per i dettagli, si veda per esempio il capitolo 13 di Econometric 486Analysis di Greene (2000). 487 488Se si usa l'opzione --hilu, verrà usata la procedura di ricerca di 489Hildreth-Lu. I risultati sono quindi ottimizzati con la procedura iterativa 490di Cochrane-Orcutt, a meno che non si usi l'opzione --no-corc (che viene 491ignorata se non viene specificata --hilu). 492 493Accesso dal menù: /Modello/Serie storiche/Cochrane-Orcutt 494Accesso dal menù: /Modello/Serie storiche/Hildreth-Lu 495Accesso dal menù: /Modello/Serie storiche/Prais-Winsten 496 497# arch Estimation 498 499Argomenti: ordine variabile-dipendente variabili-indipendenti 500Opzione: --quiet (non stampa nulla) 501Esempio: arch 4 y 0 x1 x2 x3 502 503Questo comando è attualmente mantenuto per ragioni di compatibilità con le 504versioni precedenti, ma è preferibile usare lo stimatore di massima 505verosimiglianza disponibile mediante il comando "garch"; per un modello ARCH 506puro, fissate a 0 il primo parametro GARCH. 507 508Stima il modello specificato tenendo conto della possibile 509eteroschedasticità condizionale autoregressiva (ARCH, Autoregressive 510Conditional Heteroskedasticity). Per prima cosa il modello viene stimato con 511OLS, quindi viene eseguita una regressione ausiliaria, in cui i quadrati dei 512residui della prima regressione vengono regrediti sui loro valori ritardati. 513Il passo finale è una stima con minimi quadrati ponderati, in cui i pesi 514sono i reciproci delle varianze dell'errore della regressione ausiliaria (se 515la varianza prevista di qualche osservazione nella regressione ausiliaria 516non risulta positiva, viene usato il corrispondente residuo al quadrato). 517 518I valori alpha mostrati sotto i coefficienti sono i parametri del processo 519ARCH stimati nella regressione ausiliaria. 520 521Si veda anche "garch" e "modtest" (l'opzione --arch). 522 523Accesso dal menù: /Modello/Serie storiche/ARCH 524 525# arima Estimation 526 527Argomenti: p d q [ ; P D Q ] ; variabile-dipendente [ variabili-indipendenti ] 528Opzioni: --verbose (mostra i dettagli delle iterazioni) 529 --quite (non mostra i risultati) 530 --vcv (mostra la matrice di covarianza) 531 --hessian (si veda sotto) 532 --opg (si veda sotto) 533 --nc (non include l'intercetta) 534 --conditional (usa la massima verosimiglianza condizionale) 535 --x-12-arima (usa X-12-ARIMA, o X13, per la stima) 536 --lbfgs (usa il massimizzatore L-BFGS-B) 537 --y-diff-only (speciale per ARIMAX, si veda sotto) 538Esempi: arima 1 0 2 ; y 539 arima 2 0 2 ; y 0 x1 x2 --verbose 540 arima 0 1 1 ; 0 1 1 ; y --nc 541 542Nota: arma è un sinomimo di questo comando. 543 544Se non viene fornita una lista di variabili-indipendenti, stima un modello 545autoregressivo integrato a media mobile (ARIMA: Autoregressive, Integrated, 546Moving Average) univariato. I valori p, d e q rappresentano rispettivamente 547gli ordini dei termini autoregressivi (AR), l'ordine di differenziazione, e 548quello dei termini a media mobile (MA). Questi valori possono essere 549indicati in forma numerica o con i nomi di variabili scalari preesistenti. 550Ad esempio, un valore d pari a 1 significa che prima di stimare i parametri 551ARMA occorre prendere la differenza della variabile dipendente. 552 553Se si vuole includere solo alcuni specifici ritardi AR o MA (invece che 554tutti i ritardi fino all'ordine specificato) è possibile sostituire p e/o q 555in due modi: col nome di una matrice predefinita che contiene un insieme di 556valori interi, oppure con un'espressione come {1 4}, ossia un insieme di 557ritardi separati da spazi e racchiusi tra parentesi graffe. 558 559I valori interi opzionali P, D e Q rappresentano rispettivamente, l'ordine 560dei termini AR stagionali, l'ordine di differenziazione stagionale e 561l'ordine dei termini MA stagionali. Essi sono rilevanti solo la frequenza 562dei dati è superiore a 1 (ad esempio, dati trimestrali o mensili). Questi 563valori devono essere indicati in forma numerica o come variabili scalari. 564 565Nel caso univariato la scelta predefinita include un'intercetta nel modello, 566ma questa può essere soppressa con l'opzione --nc. Se vengono aggiunte 567delle variabili-indipendenti, il modello diventa un ARMAX: in questo caso 568occorre indicare esplicitamente la costante se si desidera un'intercetta 569(come nel secondo degli esempi proposti). 570 571È disponibile una sintassi alternativa per questo comando: se non si 572intende applicare alcuna operazione di differenziazione (stagionale o non 573stagionale), è possibile omettere totalmente i termini d e D, invece che 574impostarli esplicitamente pari a 0. Inoltre, arma è un sinonimo di arima, 575quindi ad esempio il comando seguente è un modo valido per specificare un 576modello ARMA(2,1): 577 578 arma 2 1 ; y 579 580Il funzionamento predefinito utilizza la funzionalità ARMA "interna" di 581gretl, che usa la stima di massima verosimiglianza esatta usando il filtro 582di Kalman; come opzione è possibile usare la stima di massima 583verosimiglianza condizionale. Se è stato installato il programma X-12-ARIMA 584è possibile usare questo al posto del codice interno di gretl. Per i 585dettagli su queste opzioni si veda la guida all'uso di gretl (il capitolo 58631). 587 588Quando si usa il codice ARMA interno, le deviazioni standard sono stimate 589basandosi su un'approssimazione numerica all'inversa negativa dell'Hessiana, 590passando automaticamente al prodotto esterno del gradiente (OPG) in caso di 591problemi numerici. Se si usa l'opzione --opg il prodotto esterno del 592gradiente viene usato in ogni caso. L'opzione --hessian, invece, disabilita 593il passaggio automatico all'OPG in caso di problemi. Si noti, peraltro, che 594l'impossibilità di calcolare numericamente l'hessiana è per solito indice 595di un modello mal specificato. 596 597L'opzione --lbfgs è riservata alla stima basata su codice ARMA nativo e MV 598esatta; quando viene indicata, la stima usa l'algoritmo L-BFGS a "memoria 599limitata" anziché l'ottimizzatore BFGS consueto. Questa variante può 600essere utile in alcune situazioni nelle quali la convergenza all'ottimo è 601problematica. 602 603L'opzione --y-diff-only è riservata alla stima di modelli ARIMAX (modelli 604con ordine di integrazione non nullo e che includono regressori esogeni), e 605si applica solo con la stima di MV esatta nativa di gretl. Per questi 606modelli il comportamento di default consiste nel differenziare sia la 607variabile dipendente che i regressori, ma quando viene indicata questa 608opzione viene differenziata solo la variabile dipendente, mentre i 609regressori restano nei livelli. 610 611Il valore AIC mostrato nei modelli ARIMA è calcolato secondo la definizione 612usata in X-12-ARIMA, ossia 613 614 AIC = -2L + 2k 615 616dove L è la log-verosimiglianza e k è il numero totale di parametri 617stimati. Si noti che X-12-ARIMA non produce criteri di informazione come 618l'AIC quando la stima è effettuata col metodo della massima verosimiglianza 619condizionale. 620 621Le radici AR e MA mostrate in occasione della stima ARMA sono basate sulla 622seguente rappresentazione di un processo ARMA(p,q): 623 624 (1 - a_1*L - a_2*L^2 - ... - a_p*L^p)Y = 625 c + (1 + b_1*L + b_2*L^2 + ... + b_q*L^q) e_t 626 627Di conseguenza le radici AR sono la soluzione di 628 629 1 - a_1*z - a_2*z^2 - ... - a_p*L^p = 0 630 631e la stazionarietà del processo richiede che queste radici si trovino al di 632fuori del cerchio di raggio unitario. 633 634Il valore di "frequenza" mostrato insieme alle radici AR e MA è il valore 635di lambda che risolve z = r * exp(i*2*pi*lambda)dove z è la radice in 636questione e r è il suo modulo. 637 638Accesso dal menù: /Modello/Serie Storiche/ARIMA 639Accesso alternativo: Menù pop-up nella finestra principale (selezione singola) 640 641# arma Estimation 642 643Vedi "arima"; arma è un alias. 644 645# bds Tests 646 647Argomenti: ordine x 648Opzioni: --corr1=rho (vedi sotto) 649 --sdcrit=multiple (vedi sotto) 650 --boot=N (vedi sotto) 651 --matrix=m (usa una matrice come input) 652 --quiet (non mostra i risultati) 653Esempi: bds 5 x 654 bds 3 --matrix=m 655 bds 4 --sdcrit=2.0 656 657Esegue il test BDS (Brock, Dechert, Scheinkman and LeBaron, 1996) per la 658nonlinearità della serie x. In un contesto econometrico il suo uso è 659tipicamente associato all'analisi dei residui per la violazione della 660condizione IID. Il test si basa su un insieme di integrali di correlazione, 661pensati per rintracciare la nonlinearità in dimensioni via via più ampie, 662e l'argomento ordine indica il numero di tali integrali. Esso deve essere 663almeno 2; il primo integrale stabilisce una base ma non può essere usato 664per calcolare il test. Il test è di tipo generico: rintraccia ogni tipo di 665deviazione dalla linearità ma non è informativo sul perché questa 666condizione venisse eventualmente violata. 667 668Il test può essere calcolato su un vettore (riga o colonna) anziché su una 669serie usando l'opzione --matrix. 670 671Criterio di contiguità 672 673Gli integrali di correlazione sono, in sostanza, misure di "contiguità", 674ove due punti sono considerati vicini se la differenza fra loro non eccede 675ε. Per specificare ε, di default gretl segue la raccomandazione di Kanzler 676(1999): ε è scelto in modo tale che l'integrale di correlazione del primo 677ordine sia intorno a 0.7. Una possibile alternativa (meno intensiva 678computazionalmente) è quella di specificare ε come multiplo delle scarto 679quadratico medio della serie in esame. L'opzione --sdcrit è usata per 680quest'ultimo metodo; nel terzo esempio fornito sopra ε è posto al doppio 681dello sqm di x. L'opzione --corr1 implica invece l'uso del metodo di 682Kanzler's ma consente di specificare un valore di scala diverso da 0.7. 683Ovviamente, queste due opzioni non possono essere usate insieme. 684 685Bootstrap 686 687Le statistiche test sono asintoticamente distribuite come N(0,1) ma il test 688tende a sovra-rigettare la nulla in piccoli campioni. Per questa ragione, i 689P-values sono ottenuti con una procedura di bootstrap se la lunghezza di x 690fosse minore di 600 (in caso contrario, si fa riferimento alla normale 691standard). Per usare il bootstrap in campioni più grandi basta dare un 692valore non zero all'opzione --boot. Al contrario, per evitare il bootstrap 693in piccoli campioni, basta settarla a 0. 694 695Il default per il numero di iterazioni bootstrap è di 1999, ma questo 696settaggio può essere modificato dandolo come argomento all'opzione --boot. 697 698Matrice accessore 699 700Se il comando va a buon fine, "$result" conterrà i risultati sotto forma di 701una matrice con due righe e maxdim - 1 colonne. La prima riga contiene le 702statistiche test, mentre la seconda contiene i P-values per ognuna delle 703dimensioni, sotto l'ipotesi nulla per cui x sia lineare/IID. 704 705# biprobit Estimation 706 707Argomenti: depvar1 depvar2 indepvars1 [ ; indepvars2 ] 708Opzioni: --vcv (stampa la matrice di covarianze) 709 --robust (errori standard robusti) 710 --cluster=clustvar (vedi "logit" per una spiegazione) 711 --opg (vedi sotto) 712 --save-xbeta (vedi sotto) 713 --verbose (stampa informazione extra) 714Esempi: biprobit y1 y2 0 x1 x2 715 biprobit y1 y2 0 x11 x12 ; 0 x21 x22 716 Vedi anche biprobit.inp 717 718Stima un modello probit bivariato massimizzando la verosimiglianza con il 719metodo di Newton-Raphson. 720 721L'elenco degli argomenti inizia con due variabili dipendenti (binarie), 722seguite da una lista di regressori. Un'eventuale seconda lista, separata 723dalla precedente da un punto e virgola, viene interpretata come contenente 724l'insieme dei regressori specifici alla seconda equazione, mentre indepvars1 725è specifica alla prima equazione; in caso contrario il comando assume che 726indepvars1 rappresenti un insieme di regressori comuni alle due equazioni. 727 728Per default, gli errori standard sono calcolati usando l'Hessiana analitica 729calcolata in corrispondenza delle stime dei parametri. L'opzione --opg 730permette di stimare la matrice di covarianza usando il prodotto esterno del 731gradiente (Outer Product of the Gradient, OPG); l'opzione --robust permette 732di calcolare gli standard error QML a partire dalla matrice di covarianza 733"sandwich" che usa sia l'inversa dell'Hessiana che la matrice OPG. 734 735Si noti che la stima di rho, il coefficiente di correlazione fra i due 736termini di disturbo, è incluso nel vettore dei coefficienti, all'ultimo 737posto, con le ovvie conseguenze sugli accessori coeff, stderr e vcv. 738 739Una volta completata con successo la stima, l'accessore "$uhat" consente di 740recuperare una matrice di due colonne contenente i residui generalizzati 741delle due equazioni; in altre parole, i valori attesi degli errori 742condizionali ai valori osservati delle variabili dipendenti e delle 743covariate. Di default "$yhat" restituisce una matrice di quattro colonne 744contenente le stime delle probabilità dei quattro possibili esiti congiunti 745per (y_1, y_2), nell'ordine (1,1), (1,0), (0,1), (0,0). In alternativa, se 746il comando è seguito dall'opzione --save-xbeta , "$yhat" ha due colonne 747contenenti i valori delle funzioni indice delle rispettive equazioni. 748 749L'output comprende un test dell'ipotesi che gli errori delle due equazioni 750siano incorrelati fra loro. Il test è un test di tipo LR, a meno che lo 751stimatore sia inteso come stimatore QMLE e quindi venga usata l'opzione 752--robust; in questo caso, si usa un test di Wald. 753 754# bkw Tests 755 756Opzione: --quiet (non stampa nulla) 757Esempi: longley.inp 758 759Deve seguire la stima di un modello che includa almeno due variabili 760indipendenti. Calcola e mostra le informazioni relative alla collinearità, 761ovvero la tabella BKW, basandosi sul lavoro di Belsley, Kuh e Welsch (1980). 762Questa tabella riporta una sofisticata analisi del grado di collinearità e 763delle sue fonti, attraverso l'analisi degli autovalori ed autovettori 764dell'inversa della matrice di correlazione. Per un resoconto completo circa 765l'approccio BKW con riferimento a gretl, ed a diversi altri esempi, si veda 766Adkins, Waters e Hill (2015). 767 768Utilizzando l'accessore "$result" è possibile recuperare la tabella BKW 769come matrice. Si veda anche il comando "vif" per un approccio semplificato 770alla diagnostica della collinearità. 771 772Esiste anche una funzione chiamata "bkw" che offre maggior flessibilità. 773 774Accesso dal menù: Finestra del modello, /Analisi/Collinearità 775 776# boxplot Graphs 777 778Argomento: lista-variabili 779Opzioni: --notches (mostra l'intervallo di confidenza al 90 per cento per la mediana) 780 --factorized (vedi sotto) 781 --panel (vedi sotto) 782 --matrix=name (opera su colonne di una matrice) 783 --output=filename (manda l'output a un file specificato) 784 785Questo tipo di grafici (da Tukey e Chambers) mostra la distribuzione di una 786variabile. La "scatola" centrale (box) racchiude il 50 per cento centrale 787dei dati, ossia è delimitato dal primo e terzo quartile. I "baffi" 788(whiskers) si estendono fino un valore dato da una volta e mezzo il range 789interquartile a partire dai bordi della scatola. Valori esterni a tale 790intervallo sono considerati "outlier" e rappresentati con dei punti. Una 791linea trasversale sulla scatola indica la mediana, mentre un segno "+" 792indica la media. Se viene selezionata l'opzione di mostrare un intervallo di 793confidenza per la mediana, questo viene calcolato via bootstrap e mostrato 794sotto forma di lnee tratteggiate orizzontali sopra e sotto la mediana. 795 796L'opzione "factorized" permette di esaminare la distribuzione di una 797variabile condizionata ai valori di un fattore discreto. Ad esempio, se un 798dataset contiene salari e una variable binaria per il genere, si può 799scegliere di analizzare la distribuzione del salario condizionata al genere 800e visualizzare boxplot dei salari per i maschi e per le femmine uno di 801fianco all'altro, come ad esempio 802 803 boxplot wage gender --factorized 804 805Si noti che, in questo caso, bisogna specificare esattamente due variabili, 806col fattore per secondo. 807 808Se il dataset corrente è un panel ed è stata specificata una sola 809variabile, l'opzione --panel produce una serie di grafici boxplot 810affiancati, uno per ogni "unità" o gruppo panel. 811 812In generale l'argomento varlist è necessario e deve indicare una o più 813variabili nel dataset corrente (usando il nome o il numero di ID). Se viene 814fornita una matrice usando l'opzione --matrix, tuttavia, questo argomento 815diventa opzionale: di default viene mostrato un grafico per ciascuna delle 816colonne della matrice specificata. 817 818Il grafici boxplot di gretl sono generati usando gnuplot, ed è possibile 819arricchire il grafico specificando altri comandi gnuplot, includendoli fra 820parentesi graffa. Per maggiori dettagli consultate per favore l'help del 821comando "gnuplot". 822 823In modalità interattiva il risultato viene mostrato immediatamente. In 824batch il comportamento di default di gretl è di scrivere nella directory di 825lavoro dell'utente un file di comandi gnuplot chiamato gpttmpN.plt, 826iniziando da N = 01. I grafici veri e propri possono essere generati in 827seguito usando gnuplot (in MS Windows, wgnuplot). Questo comportamento può 828essere modificato usando l'opzione --output=filename. Per ulteriori 829dettagli, si veda il comando "gnuplot". 830 831Accesso dal menù: /Visualizza/Grafico/Boxplot 832 833# break Programming 834 835Esce da un ciclo. Questo comando può essere usato solo all'interno di un 836ciclo e causa l'immediata interruzione dell'esecuzione del ciclo (o di 837quello più interno, nel caso di cicli nidificati). Si veda anche il comando 838"loop". 839 840# catch Programming 841 842Sintassi: 843 catch command 844 845Non si tratta di un vero e proprio comando, quanto piuttosto di un prefisso 846applicabile alla maggior parte dei comandi consueti; il suo effetto è 847quello di prevenire l'interruzione di uno script nel caso in cui si 848verifichi un errore nell'esecuzione di un comando. Un eventuale errore viene 849registrato in un codice d'errore interno cui è possibile accedere con 850"$error" (un valore nullo indica che l'esecuzione ha avuto successo). Il 851valore di "$error" dovrebbe sempre essere controllato subito dopo aver usato 852catch, in modo da adottare le misure più opportune nel caso in cui il 853comando non dovesse aver avuto successo. 854 855catch non può essere usato prima di if, elif o endif. Inoltre, non può 856essere neanche usato per chiamate a funzioni definite dall'utente; il suo 857uso è limitato ai comandi di gretl e alle chiamate a funzioni od operatori 858"nativi". 859 860# chow Tests 861 862Varianti: chow obs 863 chow dummyvar --dummy 864Opzioni: --dummy (usa una variabile dummy preesistente) 865 --quiet (non mostra le stime del modello aumentato) 866 --limit-to=lista (limita il test a un sottoinsieme di regressori) 867Esempi: chow 25 868 chow 1988:1 869 chow female --dummy 870 871Va eseguito dopo una regressione OLS e fornisce un test per l'ipotesi nulla 872che non esista un break strutturale del modello in corrispondenza del punto 873di rottura specificato. La procedura consiste nel creare una variabile dummy 874che vale 1 a partire dal punto di rottura specificato da osservazione fino 875alla fine del campione, 0 altrove; inoltre vengono creati dei termini di 876interazione tra questa dummy e i regressori originali. Viene quindi stimata 877una regressione che include questi termini. 878 879Per impostazione predefinita viene calcolata una statistica F, prendendo la 880regressione aumentata come non vincolata e la regressione originale come 881vincolata. Se il modello originale usa uno stimatore robusto per la matrice 882di covarianza, come statistica test viene usato un valore chi-quadro di 883Wald, basato su uno stimatore robusto della matrice di covarianza della 884regressione aumentata. 885 886L'opzione --limit-to si può usare per limitare l'insieme di regressori che 887verrà interagito con la dummy di sottocampionamento a un sottoinsieme di 888quelli originali. Il parametro di questa opzione dev'essere una lista 889pre-definita, contenente un sottoinsieme delle variabili esplicative; la 890costante non può farne parte. 891 892Accesso dal menù: Finestra del modello, /Test/CHOW 893 894# clear Programming 895 896Opzioni: --dataset (cancella solo il dataset) 897 --other (cancella tutto fuorché il dataset) 898 899Senza alcuna opzione, cancella dalla memoria tutti gli oggetti salvati, 900compreso l'eventuale campione corrente. Si noti che anche aprire un nuovo 901dataset o usare il comando "nulldata" per creare un dataset vuoto ha lo 902stesso effetto; per questo motivo di solito non è necessario usare "clear". 903 904Con l'opzione --dataset viene cancellato dalla memoria solo il dataset; 905tutti gli altri oggetti, come matrici e scalari salvati in precedenza, 906vengono conservati. 907 908# coeffsum Tests 909 910Argomento: lista-variabili 911Opzione: --quiet (non stampa nulla) 912Esempi: coeffsum xt xt_1 xr_2 913 Vedi anche restrict.inp 914 915Deve essere usato dopo una regressione. Calcola la somma dei coefficienti 916delle variabili nella lista-variabili e ne mostra l'errore standard e il 917p-value per l'ipotesi nulla che la loro somma sia zero. 918 919Si noti la differenza tra questo test e "omit", che assume come ipotesi 920nulla l'uguaglianza a zero di tutti i coefficienti di un gruppo di variabili 921indipendenti. 922 923L'opzione --quiet potrebbe risultare utile se si vuole accedere ai valori 924"$test" e "$pvalue", che vengono registrati al completamento della 925procedura. 926 927Accesso dal menù: Finestra del modello, /Test/Somma dei coefficienti 928 929# coint Tests 930 931Argomenti: ordine variabile-dipendente variabili-indipendenti 932Opzioni: --nc (non include la costante) 933 --ct (include la costante e il trend) 934 --ctt (include la costante e il trend quadratico) 935 --seasonals (include dummy stagionali) 936 --skip-df (non esegue i test DF sulle variabili individuali) 937 --test-down[=criterio] (scelta automatica dell'ordine dei ritardi) 938 --verbose (mostra dettagli extra sulle regressioni) 939 --silent (non stampa nulla) 940Esempi: coint 4 y x1 x2 941 coint 0 y x1 x2 --ct --skip-df 942 943Test di cointegrazione di Engle-Granger. La procedura predefinita è la 944seguente: (1) eseguire dei test Dickey-Fuller aumentati, sull'ipotesi nulla 945che ognuna delle variabili elencate abbia una radice unitaria; (2) stimare 946la regressione di cointegrazione; (3) eseguire un test DF sui residui della 947regressione di cointegrazione. Se si usa l'opzione --skip-df, il passo (1) 948viene saltato. 949 950Se l'ordine di ritardo specificato è positivo, tutti i test Dickey-Fuller 951utilizzano questo ordine. Se l'ordine indicato viene preceduto da un segno 952meno, viene interpretato come l'ordine massimo, e l'ordine utilizzato 953effettivamente viene ricavato con la stessa procedura di test "all'indietro" 954descritta per il comando "adf". 955 956L'impostazione predefinita consiste nell'includere una costante nella 957regressione di cointegrazione; se si vuole omettere la costante, basta usare 958l'opzione --nc. Se si vuole aggiungere all'elenco dei termini deterministici 959della regressione un trend lineare o quadratico, basta usare le opzioni --ct 960o --ctt. Queste opzioni sono mutualmente esclusive. Volendo, se i dati sono 961trimestrali o mensili, la regressione può comprendere dummy stagionali. 962 963Test di cointegrazione di Engle-Granger. La procedura predefinita è la 964seguente: (1) eseguire dei test Dickey-Fuller aumentati, sull'ipotesi nulla 965che ognuna delle variabili elencate abbia una radice unitaria; (2) stimare 966la regressione di cointegrazione; (3) eseguire un test DF sui residui della 967regressione di cointegrazione. Se si attiva la casella Salta i test DF 968iniziali, il passo (1) viene saltato. 969 970I pvalue per questo test si basano su MacKinnon (1996). Il codice relativo 971è stato incluso per gentile concessione dell'autore. 972 973Per il test di cointegrazione di Søren Johansen, si veda il comando 974"johansen". 975 976Accesso dal menù: /Modello/Serie storiche/Test di cointegrazione/Engle-Granger 977 978# corr Statistics 979 980Varianti: corr [ lista-variabili ] 981 corr --matrix=nome-matrice 982Opzioni: --uniform (assicura l'uniformità del campione) 983 --spearman (Rho di Spearman) 984 --kendall (Tau di Kendall) 985 --verbose (mostra i ranghi) 986 --plot=modo o nome del file (si veda di seguito) 987 --triangle (si veda di seguito) 988Esempi: corr y x1 x2 x3 989 corr ylist --uniform 990 corr x y --spearman 991 992Per impostazione predefinita, mostra le coppie di coefficienti di 993correlazione (la correlazione del prodotto dei momenti di Pearson) per le 994variabili date nella lista-variabili, o per tutte le variabili del dataset 995se non viene specificata alcuna lista-variabili. Il comportamento 996predefinito consiste nell'usare tutte le osservazioni disponibili per 997calcolare ognuno dei coefficienti, ma se si usa l'opzione --uniform il 998campione verrà limitato (se necessario) in modo che per tutti i 999coefficienti venga usato lo stesso insieme di osservazioni. Questa opzione 1000ha effetto solo se le diverse variabili contengono un numero diverso di 1001valori mancanti. 1002 1003Le opzioni (mutualmente esclusive) --spearman e --kendall producono 1004rispettivamente, la correlazione di rango di Spearman (rho) e la 1005correlazione di rango di Kendall (tau), invece del solito coefficiente di 1006Pearson. Quando si usa una di queste opzioni, la lista-variabili deve 1007contenere solo due variabili. 1008 1009Quando viene calcolata la correlazione di rango, si può usare l'opzione 1010--verbose per mostrare i dati originali e ordinati (altrimenti questa 1011opzione verrà ignorata). 1012 1013Se lista-variabili contiene più di due serie e il programma non è in 1014modalità batch, verrà mostrato un grafico a "temperatura" della matrice di 1015correlazione, regolato dall'opzione --plot. Per questa opzione, i parametri 1016possibili sono none (per non averlo), display (per mostrarlo a video anche 1017in modo batch), o un nome di file. Quest'ultima scelta ha effetti uguali a 1018quelli dell'opzione --output per il comando "gnuplot". L'opzione --triangle 1019fa sì che il grafico contenga solo il triangolo inferiore della matrice. 1020 1021Se si usa la forma alternativa, dando come argomento un nome di matrice 1022piuttosto che una lista variabili, le opzioni --spearman e --kendall non 1023sono disponibili -- si veda quindi la funzione "npcorr". 1024 1025L'accessore "$result" può essere utilizzato per ottenere le correlazioni 1026risultati dal comando sottoforma di matrice utilizzabile. 1027 1028Accesso dal menù: /Visualizza/Matrice di correlazione 1029Accesso alternativo: Menù pop-up nella finestra principale (selezione multipla) 1030 1031# corrgm Statistics 1032 1033Argomenti: variabile [ max-ritardo ] 1034Opzioni: --bartlett (usa gli errori standard di Bartlett) 1035 --plot=modo o nome di file (si veda sotto) 1036 --quiet (non mostra il grafico) 1037Esempio: corrgm x 12 1038 1039Mostra i valori della funzione di autocorrelazione per la variabile 1040specificata (dal nome o dal numero). I valori sono definiti come rho(u_t, 1041u_t-s) dove u_t è la t-esima osservazione della variabile u e s è il 1042numero dei ritardi. 1043 1044Vengono mostrate anche le autocorrelazioni parziali (calcolate con 1045l'algoritmo di Durbin-Levinson), ossia al netto dell'effetto dei ritardi 1046intermedi. Il comando produce anche un grafico del correlogramma e mostra la 1047statistica Q di Ljung-Box per testare l'ipotesi nulla che la serie sia 1048"white noise" (priva di autocorrelazione). La statistica si distribuisce 1049asintoticamente come chi-quadro con gradi di libertà pari al numero di 1050ritardi specificati. 1051 1052La significatività statistica delle singole autocorrelazioni viene indicata 1053per mezzo di asterischi. Di default, essa è calcolata per mezzo della 1054radice inversa dell'ampiezza campionaria, ma con l'opzione --bartlett 1055vengono usate le formule di Bartlett per l'ACF. Quest'opzione, se 1056applicabile, controlla anche la banda di confidenza mostrata nel grafico. 1057 1058Se viene specificato un valore max-ritardo, la lunghezza del correlogramma 1059viene limitata al numero di ritardi specificato, altrimenti viene scelta 1060automaticamente in funzione della frequenza dei dati e del numero di 1061osservazioni. 1062 1063Di default viene mostrato un grafico del correlogramma: un grafico gnuplot 1064in modalità interattiva o un grafico ASCII in modalità batch. Questo 1065comportamento può essere modificato con l'opzione --plot. Per questa 1066opzione i parametri accettabili sono none (per eliminare il grafico); ascii 1067(per produrre un grafico in formato testo anche in modalità interattiva); 1068display (per produrre un grafico gnuplot anche in modalità batch); oppure 1069il nome di un file. In quest'ultimo caso l'effetto è quello descritto per 1070l'opzione --output del comando "gnuplot". 1071 1072Se il comando va a buon fine, gli accessori "$test" e "$pvalue" conterranno 1073i valori corrispondenti per la statistica di Ljung-Box, per l'ordine 1074max-ritardo. Peraltro, se si vuole semplicemente calcolare la statistica Q 1075senza che il programma produca alcun output, consigliamo di usare la 1076funzione "ljungbox" anziché questo comando. 1077 1078Accesso dal menù: /Variabile/Correlogramma 1079Accesso alternativo: Menù pop-up nella finestra principale (selezione singola) 1080 1081# cusum Tests 1082 1083Opzioni: --squares (esegue il test CUSUMSQ) 1084 --quiet (stampa solamente il test di Harvey-Collier) 1085 --plot=output (vedi sotto) 1086 1087Va eseguito dopo la stima di un modello OLS. Esegue il test CUSUM (o, se si 1088usa l'opzione --squares, il test CUSUMSQ) per la stabilità dei parametri. 1089Viene calcolata una serie di errori di previsione per il periodo successivo, 1090attraverso una serie di regressioni: la prima usa le prime k osservazioni e 1091viene usata per generare la previsione della variabile dipendente per 1092l'osservazione k + 1; la seconda usa le prime k + 1 osservazioni per 1093generare una previsione per l'osservazione k + 2 e cos via (dove k è il 1094numero dei parametri nel modello originale). 1095 1096Viene mostrata, anche graficamente, la somma cumulata degli errori scalati 1097di previsione (o dei quadrati degli errori). L'ipotesi nulla della 1098stabilità dei parametri è rifiutata al livello di significatività del 5 1099per cento se la somma cumulata va al di fuori delle bande di confidenza al 110095 per cento. 1101 1102Nel caso di test CUSUM, viene mostrata anche la statistica t di 1103Harvey-Collier per testare l'ipotesi nulla della stabilità dei parametri. 1104Si veda il Capitolo 7 di Econometric Analysis di Greene, per i dettagli. Per 1105il test CUSUMSQ, la banda di confidenza al 95% è calcolata usando 1106l'algoritmo descritto in Edgerton e Wells (1994). 1107 1108Di default, se il programma non è in modalità batch, viene mostrato un 1109grafico della series cumulata con la sua banda di confidenza. Questo 1110comportamento può essere modificato tramite l'opzione --plot, che può 1111prendere come parametri none (per non produrre il grafico); display (per 1112mostrarlo anche quando si è in modo batch); oppure, un nome di file. 1113Nell'ultimo caso l'effetto è lo stesso dell'opzione --output del comando 1114"gnuplot". 1115 1116Accesso dal menù: Finestra del modello, /Test/CUSUM(SQ) 1117 1118# data Dataset 1119 1120Argomento: lista-variabili 1121Opzioni: --compact=metodo (specifica un metodo di aggregazione) 1122 --interpolate (interpola i dati a bassa frequenza) 1123 --quiet (non mostra i risultati tranne che in caso di errore) 1124 --name=identificatore (rinomina le serie importate) 1125 --odbc (importa via ODBC) 1126 --no-align (specifico per ODBC, vedi sotto) 1127 1128Legge le variabili nella lista-variabili da un database (gretl, RATS 4.0 o 1129PcGive), che deve essere stato precedentemente aperto con il comando "open". 1130Il comando data è anche usat pe rimportare dati da DB.NOMICS o da una fonte 1131dati ODBC; per maggiori dettugli su queste varianti si vedano 1132rispettivamente gretl + DB.NOMICS e la guida all'uso di gretl (il capitolo 113342). 1134 1135La frequenza dei dati e l'intervallo del campione possono essere impostati 1136usando i comandi "setobs" e "smpl" prima di questo comando. Ecco un esempio 1137completo: 1138 1139 open fedstl.bin 1140 setobs 12 2000:01 1141 smpl ; 2019:12 1142 data unrate cpiaucsl 1143 1144Questi comandi aprono il database chiamato fedstl.bin (fornito con gretl), 1145impostano un dataset mensile che va da gennaio 2000 a dicembre 2019 e infine 1146importano le serie unrate e cpiaucsl. 1147 1148Se non si specificano setobs e smpl nel modo descritto, la frequenza dei 1149dati e l'intervallo del campione vengono impostati usando la prima variabile 1150letta dal database. 1151 1152Se le serie da leggere hanno frequenza maggiore di quella impostata nel 1153dataset, è possibile specificare un metodo di compattamento, come mostrato 1154di seguito 1155 1156 data LHUR PUNEW --compact=average 1157 1158I cinque metodi di compattamento disponibili sono "average" (usa la media 1159delle osservazioni ad alta frequenza), "last" (usa l'ultima osservazione), 1160"first", "sum" e "spread". Se non si specifica alcun metodo, verrà usata la 1161media delle osservazioni. Il metodo "spread" è speciale: l'informazione, 1162anziché essere condensata, verrà suddivisa su più serie, una per 1163sottoperiodo. Ad esempio, l'aggiunta di una serie mensile ad un dataset 1164trimestrale provoca la creazione di tre, serie, una per ogni mese del 1165trimestre; nei loro nomi compaiono i suffissi m01, m02 e m03. 1166 1167Se la serie in ingresso è a frequenza più bassa di quella del dataset, il 1168default è ripetere il valore dei dati in ingresso; in seguito, si può 1169usare la funzione "tdisagg" per disaggregare temporalmente la serie. 1170 1171Se il database è in formato nativo gretl, i caratteri "glob" * e ? can be 1172used in varlist, nella ricerca delle serie da importare. L'esempio che segue 1173importerà tutte le serie i cui nomi comiciano per cpi: 1174 1175 data cpi* 1176 1177L'opzione --name può essere utilizzata per impostare un nome diverso 1178dall'originale per le nuove serie storiche importate nel dataset. Il 1179parametro deve essere un identificatore valido. Questa opzione è 1180circoscritta al caso in cui è stata specificata una singola serie storica 1181per l'importazione. 1182 1183L'opzione --no-align produce effetti solo quando si importano serie via 1184ODBC. Per impostazione predefinita, la query ODBC deve ritornare delle 1185informazioni con cui gretl possa piazzare i dati in ingresso nelle righe 1186appropriate del dataset -- o per lo meno, che il numero di cifre in entrata 1187coincida con la lunghezza del dataset o del sottocampione attuale. Con 1188l'opzione --no-align questo requisito viene allentato: se le condizioni di 1189cui sopra non sono rispettate, i datri in ingresso sono semplicemente messi 1190all'inizio del dataset, partendo dalla prima riga. Se i dati in ingresso 1191sono meno della dimensione del campione, le righe in eccesso saranno 1192riempite con NAs; altrimenti, i dati in più verranno buttati via. Per 1193maggiori dettagli sull'importazione via ODBC, si veda la guida all'uso di 1194gretl (il capitolo 42). 1195 1196Accesso dal menù: /File/Database 1197 1198# dataset Dataset 1199 1200Argomenti: parola-chiave parametri 1201Opzione: --panel-time (vedi oltre, sotto addobs) 1202Esempi: dataset addobs 24 1203 dataset insobs 10 1204 dataset compact 1 1205 dataset compact 4 last 1206 dataset expand 1207 dataset transpose 1208 dataset sortby x1 1209 dataset resample 500 1210 dataset renumber x 4 1211 dataset pad-daily 7 1212 dataset clear 1213 1214Esegue varie operazioni sull'intero dataset, a seconda della parola-chiave 1215usata, che può essere addobs, insobs, clear, compact, expand, transpose, 1216sortby, dsortby, resample, renumber o pad-daily. Nota: ad eccezione del 1217comando clear questi comandi non sono disponibili quando sul dataset è 1218definito un sotto-campione ottenuto selezionando le osservazioni con un 1219criterio Booleano. 1220 1221addobs: deve essere seguito da n, un intero positivo. Aggiunge n 1222osservazioni alla fine del dataset, tipicamente a scopo di ottenere delle 1223previsioni. I valori della maggior parte delle variabili nell'intervallo 1224aggiunto sono impostati come valori mancanti, ma alcune variabili 1225deterministiche, ad esempio le tendenze lineari e le variabili dummy 1226periodiche, sono riconosciute ed estese. Se il dataset aperto è di tipo 1227panel, l'opzione --panel-time è quella di allungare il campione di n 1228osservazioni per ogni unità cross-sezionale (mentre il default è di 1229aggiungere nunità). 1230 1231insobs: Deve essere seguito da un intero positivo inferiore o uguale al 1232numero corrente di osservazioni. Inserisce una singola osservazione nella 1233posizione specificata. Tutti i dati successivi sono spostati di una 1234posizione e il dataset è allungato di un'osservazione. In corrispondenza 1235della nuova osservazione a tutte le variabili, a parte la costante, vengono 1236assegnati valori mancanti. Questa azione non è disponibile in dataset 1237panel. 1238 1239clear: Non richiede parametri. Elimina il campione corrente e riporta gretl 1240al suo stato iniziale senza dati. 1241 1242compact: deve essere seguito da un intero positivo che rappresenta la nuova 1243frequenza dei dati, che dovrebbe essere minore di quella attuale (ad esempio 1244un valore 4 quando la frequenza attuale è 12 significa che si compatterà 1245un dataset mensile in uno trimestrale). Questo comando è disponibile solo 1246se il dataset contiene serie storiche: compatta tutte le serie del dataset 1247alla nuova frequenza. È possibile dare un secondo parametro, tra sum, 1248first, last o spread, per specificare, rispettivamente, di compattare usando 1249la somma dei valori alla frequenza maggior, i valori di inizio periodo o 1250fine periodo, o di "spalmare" i valori ad alta frequenza su più serie (una 1251per sottoperiodo). Il comportamento predefinito consiste nel prendere la 1252media dei valori sul periodo. 1253 1254expand: Questo comando è disponibile solo per serie storiche annuali o 1255trimestrali. I dati annuali vengono espansi a trimestrali, quelli 1256trimestrali a mensili. Tutte le serie nel dataset verranno espanse ripetendo 1257il valore a bassa frequenza. Se il dataset originale è annual l'espansione 1258di defaultè trimestrale ma si può far seguire expand dal numero 12 per 1259effettuare l'espansione a mensile. 1260 1261transpose: non richiede parametri aggiuntivi. Traspone il dataset attuale: 1262ogni osservazione (riga) del dataset attuale diventerà una variabile 1263(colonna), e ogni variabile un'osservazione. Questo comando è utile quando 1264si importano da fonti esterne dei dati organizzati con le variabili disposte 1265per riga. 1266 1267sortby: richiede il nome di una variabile o di una lista. Con una variabile, 1268questa viene usata come criterio di ordinamento. Le osservazioni di tutte le 1269altre variabili del dataset sono riordinate secondo valori crescenti della 1270variabile indicata. Nel caso di una lista, il comando procede 1271gerarchicamente: il primo criterio di ordinamento è la prima variabile, nel 1272caso in cui si arrivi ad una situazione di stallo si passa alla seconda 1273variabile della lista per risolvere il problema, e se il problema persiste 1274si passa alla terza e così via, finchè lo stallo non si esaurisce o si 1275esauriscono le variabili presenti nella lista. Questo comando è disponibile 1276solo per dati non datati. 1277 1278dsortby: funziona come sortby ma riordina le osservazioni secondo i valori 1279decrescenti della variabile specificata. 1280 1281resample: costruisce un nuovo dataset attraverso un campionamento causale, 1282con reimmissione, delle righe del dataset attuale. È richiesto un 1283argomento, ossia il numero di righe da includere, che può essere minore, 1284uguale o maggiore del numero di osservazioni nei dati originali. Il dataset 1285originale può essere recuperato usando il comando smpl full. 1286 1287renumber: Richiede il nome di una variabile esistente seguito da un intero 1288compreso fra 1 e il numero delle variabili nel campione meno 1. Sposta la 1289serie specificata nel dataset nella posizione indicata, rinumerando le altre 1290variabili di conseguenza. (La posizione 0 è occupata dalla costante che non 1291può essere spostata.) 1292 1293pad-daily: valido solamente se il dataset corrente contiene dei dati 1294giornalieri di un calendario incompleto. L'effetto prodotto dal comando 1295sarà quello di riempire il calendario aggiungendo le date mancanti come 1296righe vuote (in pratica significa creare delle righe vuote contenenti 1297solamente valori NA). Quest'opzione richiede un parametro intero, ovvero il 1298numero di giorni della settimana (che deve essere un numero tra 5, 6 o 7), e 1299deve essere maggiore, o uguale, alle correnti frequenze del dataset. Una 1300volta avvenuto con successo il completamento, il calendario dei dati 1301risulterà "completo" relativamente al valore del parametro dato. Ad 1302esempio, se i giorni della settimana sono 5 allora tutti i giorni della 1303settimana verranno rappresentati, sia che i dati per questi giorni siano 1304disponibili oppure no. 1305 1306Accesso dal menù: /Dati 1307 1308# delete Dataset 1309 1310Varianti: delete varlist 1311 delete varname 1312 delete --type=type-name 1313 delete pkgname 1314Opzioni: --db (rimuove dal database aperto) 1315 --force (vedi sotto) 1316 1317Questo comando è uno strumento multi-uso per eliminare oggetti. Deve essere 1318usato con cautela: non viene chiesta alcuna conferma. 1319 1320Utilizzandolo nella sua prima forma, varlist è un lista di variabili aventi 1321un nome ed un numero identificativo (ID). Si noti che quando si elimina una 1322serie tutte le restanti serie con un ID maggiore della precedente vengono 1323rinumerate dopo l'eliminazione di quelle selezionate. Se si utilizza 1324l'opzione --db con questo comando verranno eliminate le liste di variabili 1325non dal corrente dataset ma dal database di gretl, assumendo che un database 1326sia stato aperto e che l'utente abbia il permesso scritto per il file in 1327questione. Si veda anche il comando "open". 1328 1329Nella seconda forma, il nome di uno scalare, matrice, stringa o bundle può 1330essere dato al comando per la cancellazione. In questo caso l'opzione --db 1331non è applicabile. Si noti che serie e variabili di tipo diverso non 1332dovrebbero essere mixate all'interno della chiamata delete. 1333 1334Nella terza forma l'opzione --type deve essere accompagnata da uno dei 1335seguenti qualificatori:matrix, bundle, string, list, scalar o array. 1336L'effetto è quello di eliminare tutte le variabili di un certo tipo. In 1337questo caso nessun altro argomento è richiesto oltre l'opzione successiva 1338richiesta. 1339 1340La quarta forma può essere utilizzata per rimuovere un pacchetto di 1341funzioni. In questo caso il suffisso .gfn deve essere fornito, come ad 1342esempio 1343 1344 delete somepkg.gfn 1345 1346Si noti che non elimina il pacchetto, quanto piuttosto lo deselezione e lo 1347rimuove dalla memoria. 1348 1349Cancellazione di variabili in un loop 1350 1351In generale, non è permesso cancellare variabili durante un loop, poiché 1352questo può mettere a repentaglio l'integrità del codice. Ciononostante, se 1353siete sicuri che l'operazione è senza rischi, questa proibizione può 1354essere disattivata usando l'opzione --force. 1355 1356Accesso dal menù: Pop-up nella finestra principale (selezione singola) 1357 1358# diff Transformations 1359 1360Argomento: lista-variabili 1361Esempi: penngrow.inp, sw_ch12.inp, sw_ch14.inp 1362 1363Calcola la differenza prima di ogni variabile nella lista-variabili e la 1364salva in una nuova variabile il cui nome è prefissato con d_. Quindi "diff 1365x y" crea le nuove variabili 1366 1367 d_x = x(t) - x(t-1) 1368 d_y = y(t) - y(t-1) 1369 1370Accesso dal menù: /Aggiungi/Differenze prime delle variabili selezionate 1371 1372# difftest Tests 1373 1374Argomenti: var1 var2 1375Opzioni: --sign (Test del segno, scelta predefinita) 1376 --rank-sum (Test "rank-sum" di Wilcoxon) 1377 --signed-rank (Test "signed-rank" di Wilcoxon) 1378 --verbose (Mostra informazioni aggiuntive) 1379 --quiet (Non stampa l'output) 1380Esempi: ooballot.inp 1381 1382Esegue un test non parametrico per la differenza tra due popolazioni o 1383gruppi; il tipo di test dipende dall'opzione usata. 1384 1385Con l'opzione --sign, viene eseguito il test del segno, che si basa sul 1386fatto che per due campioni x e y estratti casualmente dalla stessa 1387distribuzione, la probabilità che valga x_i > y_i per ogni osservazione i 1388dovrebbe valere 0.5. La statistica test è w, ossia il numero di 1389osservazioni per cui vale x_i > y_i. Sotto l'ipotesi nulla, questa grandezza 1390si distribuisce come una binomiale con parametri (n, 0.5), dove n è il 1391numero di osservazioni. 1392 1393Con l'opzione --rank-sum, viene eseguito il test "rank-sum" di Wilcoxon. 1394Questo test procede ordinando le osservazioni estratte da entrambi i 1395campioni dalla più piccola alla più grande, e quindi calcolando la somma 1396dei ranghi delle osservazioni da uno dei campioni. I due campioni non devono 1397necessariamente avere la stessa dimensione: se sono diversi, viene usato il 1398campione più piccolo per calcolare la somma dei ranghi. Sotto l'ipotesi 1399nulla che i campioni siano estratti da popolazioni con la stessa mediana, la 1400distribuzione di probabilità della somma dei ranghi può essere calcolata 1401per ogni valore dell'ampiezza dei due campioni, mentre per campioni 1402abbastanza ampi essa approssima la distribuzione normale. 1403 1404Con l'opzione --signed-rank, viene eseguito il test "signed-rank" di 1405Wilcoxon. Questo test è valido per "coppie di campioni", come possono 1406essere ad esempio i valori di una variabile in un gruppo di individui prima 1407e dopo un certo trattamento. Il test procede calcolando le differenze tra le 1408coppie di osservazioni x_i - y_i, ordinando queste differenze per valore 1409assoluto e assegnando ad ogni coppia un valore di rango con segno, in cui il 1410segno rispecchia il segno della differenza. Quindi viene calcolato W_+, la 1411somma di tutti i ranghi con segno positivo. Come avviene per il test 1412rank-sum, questa statistica ha una distribuzione precisa nell'ipotesi nulla 1413che la differenza mediana sia zero, distribuzione che converte alla normale 1414nel caso di campioni abbastanza ampi. 1415 1416Usando l'opzione --verbose con i test di Wilcoxon viene mostrato 1417l'ordinamento delle osservazioni (l'opzione non ha effetto se usata con il 1418test del segno). 1419 1420Se il comando non ha dato errori, sono disponibili gli accessori "$test" e 1421"$pvalue". Per ottenere solo questi valori, si può usare l'opzione --quiet. 1422 1423# discrete Transformations 1424 1425Argomento: lista-variabili 1426Opzione: --reverse (marca le variabili come continue) 1427Esempi: ooballot.inp, oprobit.inp 1428 1429Marca ogni variabile della lista-variabili come discreta. In modalità 1430predefinita, tutte le variabili sono considerate come continue; marcando una 1431variabile come discreta, essa viene trattata in modo speciale nei diagrammi 1432di frequenza, e può esere usata con il comando "dummify". 1433 1434Usando l'opzione --reverse, l'operazione viene invertita, ossia, le 1435variabili nella lista-variabili sono marcate come continue. 1436 1437Accesso dal menù: /Variabile/Modifica attributi 1438 1439# dpanel Estimation 1440 1441Argomento: p ; depvar indepvars [ ; instruments ] 1442Opzioni: --quiet (non mostra il modello stimato) 1443 --vcv (mostra la matrice di covarianza) 1444 --two-step (calcola la stima GMM a due passi) 1445 --system (aggiunge equazioni nei livelli) 1446 --time-dummies (aggiunge variabili dummy temporali) 1447 --dpdstyle (emula il pacchetto DPD per Ox) 1448 --asymptotic (errori standard asintotici non modificati) 1449 --keep-extra (vedi sotto) 1450Esempi: dpanel 2 ; y x1 x2 1451 dpanel 2 ; y x1 x2 --system 1452 dpanel {2 3} ; y x1 x2 ; x1 1453 dpanel 1 ; y x1 x2 ; x1 GMM(x2,2,3) 1454 Vedi anche bbond98.inp 1455 1456Stima modelli dinamici per dati di panel (in altre parole, modelli panel con 1457uno o più ritardi della variabile dipendente) usando il metodo GMM-DIF o 1458quello GMM-SYS. 1459 1460Il paramtro p rappresenta l'ordine autoregressivo della variabile 1461dipendente. Nel caso più semplice si tratta di uno scalare, ma per 1462specificare un insieme di ritardi (non consecutivi) da è possibile indicare 1463una matrice definita in precedenza. 1464 1465La variabile dipendente e i regressori dovrebbero essere indicati in 1466livelli; il comando provvede autonomamente a differenziarli (dato che questo 1467stimatore usa le differenze per eliminare gli effetti individuali). 1468 1469L'ultimo campo (opzionale) nel comando serve a specificare gli strumenti. Se 1470questi ultimi non vengono indicati si assume che le variabili indipendenti 1471siano tutte strettamente esogene. Se si sceglie di specificare alcuni 1472strumenti è opportuno includere nell'elenco anche le variabili indipendenti 1473strettamente esogene. Nel caso di regressori predeterminati è possibile 1474usare la funzione GMM per includere uno specifico intervallo di ritardi 1475seguendo uno schema diagonale a blocchi. Una situazione di questo tipo è 1476stata illustrata in precedenza nel terzo esempio. Il primo argomento di GMM 1477è il nome della variabile in questione, il secondo è il ritardo minimo da 1478usare come strumento e il terzo è il ritardo massimo. La stessa sintassi 1479può essere utilizzata con la funzione GMMlevel per specificare strumenti di 1480tipo GMM per le equazioni nei livelli. 1481 1482Di default vengono riportati (con errori standard robusti) i risultati della 1483stima al primo stadio; la stima al secondo stadio può essere richiesta 1484indicato l'opzione corrispondente. In entrambi i casi vengono forniti i test 1485di autocorrelazione del primo e del secondo ordine, così come il test di 1486sovraidentificazione di Sargan e un test di Wald della significatività 1487congiunta dei regressori. Si noti che in questo modello nelle differenze 1488l'autocorrelazione del primo ordine non impedisce che il modello sia valido; 1489l'autocorrelazione al secondo ordine, tuttavia, viola le ipotesi statistiche 1490che ne sono alla base. 1491 1492Nel caso della stima a due passi, gli errori standard sono per default 1493calcolati usando la correzione per campioni finiti suggerita da Windmeijer 1494(2005). In generale l'inferenza basata sugli errori standard asintotici 1495associati allo stimatore al secondo stadio è considerata inaffidabile, ma 1496se per qualche ragione desiderate conoscere il loro valore potete usare 1497l'opzione --asymptotic per disattivare la correzione di Windmeijer. 1498 1499Se viene indicata l'opzione --time-dummies il comando aggiunge ai regressori 1500specificati un insieme di variabili dummy. Il numero di queste ultime è 1501pari al numero massimo di periodi usati nella stima meno uno, allo scopo di 1502evitare di avere collinearità perfetta con la costante. Le dummy vengono 1503incluse in differenza, a meno che non sia indicata l'opzione --dpdstyle; in 1504questo caso le dummy sono incluse in livello. 1505 1506Come per altri comandi di stima, un bundle di nome "$model" è disponibile 1507se il comando va a buon fine. Nel caso del comando dpanel, l'opzione 1508--keep-extra provoca l'inclusione nel bundle di elementi addizionali, e 1509cioè i pesi GMM e la matrice degli strumenti. 1510 1511Per ulteriori dettagli ed esempi, si veda la guida all'uso di gretl (il 1512capitolo 24). 1513 1514Accesso dal menù: /Model/Panel/Dynamic panel model 1515 1516# dummify Transformations 1517 1518Argomento: lista-variabili 1519Opzioni: --drop-first (omette dalla codifica il valore minimo) 1520 --drop-last (omette dalla codifica il valore massimo) 1521 1522Per ogni variabile rilevante nella lista-variabili, crea un insieme di 1523variabili dummy che codificano i valori distinti di quella variabile. Le 1524variabili rilevanti sono quelle che sono state marcate esplicitamente come 1525discrete, o quelle che assumono un numero limitato di valori che devono 1526essere "abbastanza arrotondati" (multipli di 0.25). 1527 1528Per impostazione predefinita, viene aggiunta una variabile dummy per ognuno 1529dei valori distinti della variabile in questione. Ad esempio, se una 1530variabile discreta x ha 5 valori distinti, verranno create 5 variabili 1531dummy, di nome Dx_1, Dx_2 e così via. La prima variabile dummy avrà valore 15321 per le osservazioni in cui x assume il suo valore minimo, e 0 altrove; la 1533successiva variabile dummy avrà valore 1 dove x assume il secondo tra i 1534suoi valori, e così via. Se viene usata una delle opzioni --drop-first o 1535--drop-last, il più basso o il più alto dei valori della variabile viene 1536omesso dalla codifica (questa funzione può essere utile per evitare la 1537cosiddetta "trappola delle variabili dummy"). 1538 1539Questo comando può anche essere usato nel contesto di una regressione. Ad 1540esempio, la riga seguente specifica un modello in cui y viene regredita 1541sull'insieme di variabili dummy che codificano x (in questo contesto non è 1542possibile passare opzioni al comando "dummify"). 1543 1544 ols y dummify(x) 1545 1546# duration Estimation 1547 1548Argomenti: depvar indepvars [ ; censvar ] 1549Opzioni: --exponential (usa la distribuzione esponenziale) 1550 --loglogistic (usa la distribuzione log-logistica) 1551 --lognormal (usa la distribuzione log-normale) 1552 --medians (i valori previsti sono mediane) 1553 --robust (errori standard robusti (QML)) 1554 --cluster=clustvar (v. "logit" per una spiegazione) 1555 --vcv (mostra la matrice di covarianza) 1556 --verbose (mostra dettagli delle iterazioni) 1557 --quiet (non mostra nulla) 1558Esempi: duration y 0 x1 x2 1559 duration y 0 x1 x2 ; cens 1560 Vedi anche weibull.inp 1561 1562Stima un modello di durata: la variabile dipendente (che deve essere 1563positiva) rappresenta la durata di un certo fenomeno, per esempio la 1564lunghezza di un periodo di disoccupazione per una cross-section di 1565intervistati. Di default viene utilizzata una distribuzione Weibull, ma sono 1566disponibili anche le distribuzioni esponenziale, log-logistica e 1567log-normale. 1568 1569Se alcune delle durate misurate sono censurate a destra (e.g. il periodo di 1570disoccupazione di un individuo non si è concluso all'interno del periodo di 1571osservazione), deve essere specificato l'argomento accessorio censvar che 1572indica una variabile i cui valori positivi segnalano osservazioni censurate 1573a destra. 1574 1575Di default i valori stimati ottenuti mediante l'accessore "$yhat" 1576rappresentano le medie condizionali delle durate; se tuttavia viene indicata 1577l'opzione --medians, "$yhat" fornisce le mediane condizionali. 1578 1579Vedi la guida all'uso di gretl (il capitolo 38) per ulteriori dettagli. 1580 1581Accesso dal menù: /Modello/Variabile dipendente limitata/Dati di durata 1582 1583# elif Programming 1584 1585Si veda "if". 1586 1587# else Programming 1588 1589Si veda "if". Si noti che "else" dev'essere su un linea a sé stante, prima 1590del comando corrispondente. Si può aggiungere un commento, come ad esempio 1591 1592 else # OK, fa' un'altra cosa 1593 1594ma non si può aggiungere un comando, come in 1595 1596 else x = 5 # wrong! 1597 1598# end Programming 1599 1600Termina un blocco di comandi di qualsiasi tipo. Ad esempio, "end system" 1601termina un "system" (sistema di equazioni). 1602 1603# endif Programming 1604 1605Si veda "if". 1606 1607# endloop Programming 1608 1609Indica la fine di un ciclo (loop) di comandi. Si veda "loop". 1610 1611# eqnprint Printing 1612 1613Opzioni: --complete (crea un documento completo) 1614 --output=filename (indirizza l'output ad uno specifico file) 1615 1616Va eseguito dopo la stima di un modello. Stampa il modello stimato sotto 1617forma di equazione LaTeX. Se viene specificato un nome di file usando 1618l'opzione --output, il risultato viene scritto in quel file, altrimenti 1619viene scritto in un file il cui nome ha la forma equation_N.tex, dove N è 1620il numero di modelli stimati finora nella sessione in corso. Si veda anche 1621"tabprint". 1622 1623Il file di output verrà scritto nella directory correntamente impostata 1624"workdir", a meno che la stringa filename contenga il percorso specifico 1625completo. 1626 1627Usando l'opzione --complete, il file LaTeX è un documento completo, pronto 1628per essere processato; altrimenti il file va incluso in un documento. 1629 1630Accesso dal menù: Finestra del modello, /LaTeX 1631 1632# equation Estimation 1633 1634Argomenti: variabile-dipendente variabili-indipendenti 1635Esempio: equation y x1 x2 x3 const 1636 1637Specifica un'equazione all'interno di un sistema di equazioni (si veda 1638"system"). La sintassi per specificare un'equazione in un sistema SUR è la 1639stessa usata ad esempio in "ols". Per un'equazione in un sistema con minimi 1640quadrati a tre stadi, invece è possibile usare una specificazione simile a 1641quella usata per OLS e indicare una lista di strumenti comuni usando 1642l'istruzione "instr" (si veda ancora "system"), oppure si può usare la 1643stessa sintassi di "tsls". 1644 1645# estimate Estimation 1646 1647Argomenti: [ nome-sistema ] [ stimatore ] 1648Opzioni: --iterate (itera fino alla convergenza) 1649 --no-df-corr (nessuna correzione per i gradi di libertà) 1650 --geomean (si veda oltre) 1651 --quiet (non mostra i risultati) 1652 --verbose (mostra i dettagli delle iterazioni) 1653Esempi: estimate "Klein Model 1" method=fiml 1654 estimate Sys1 method=sur 1655 estimate Sys1 method=sur --iterate 1656 1657Esegue la stima di un sistema di equazioni, che deve essere stato definito 1658in precedenza usando il comando "system". Per prima cosa va indicato il nome 1659del sistema, racchiuso tra virgolette se contiene spazi, quindi il tipo di 1660stimatore, preceduto dalla stringa method=. Gli stimatori disponibili sono: 1661"ols", "tsls", "sur", "3sls", "fiml" o "liml". Questi argomento sono 1662opzionali si il sistema in questione è già stato stimato e occupa il posto 1663dell'"ultimo modello"; in tal caso, per default viene usato il metodo di 1664stima precedente. 1665 1666Se al sistema in questione sono stati imposti dei vincoli (si veda il 1667comando "restrict"), la stima sarà soggetta a tali vincoli. 1668 1669Se il metodo di stima è "sur" o "3sls" e viene usata l'opzione --iterate, 1670lo stimatore verrà iterato. Nel caso di SUR, se la procedura converge, i 1671risultati saranno stime di massima verosimiglianza. Invece l'iterazione 1672della procedura dei minimi quadrati a tre stadi non produce in genere 1673risultati di massima verosimiglianza a informazione completa. L'opzione 1674--iterate viene ignorata con gli altri metodi di stima. 1675 1676Se vengono scelti gli stimatori "equazione per equazione" "ols" o "tsls", 1677nel calcolo degli errori standard viene applicata in modo predefinito una 1678correzione per i gradi di libertà, che può essere disabilitata usando 1679l'opzione --no-df-corr. Questa opzione non ha effetti nel caso vengano usati 1680altri stimatori, che non prevedono correzioni per i gradi di libertà. 1681 1682La formula usata in modo predefinito per calcolare gli elementi della 1683matrice di covarianza tra equazioni è 1684 1685 sigma(i,j) = u(i)' * u(j) / T 1686 1687Se viene usata l'opzione --geomean, viene applicata una correzione per i 1688gradi di libertà secondo la formula 1689 1690 sigma(i,j) = u(i)' * u(j) / sqrt((T - ki) * (T - kj)) 1691 1692dove i k indicano il numero di parametri indipendenti in ogni equazione. 1693 1694Se si usa l'opzione --verbose e un metodo iterativo, vengono mostrati i 1695dettagli delle iterazioni. 1696 1697# eval Utilities 1698 1699Argomento: espressione 1700Esempi: eval x 1701 eval inv(X'X) 1702 eval sqrt($pi) 1703 1704Con questo comando, gretl diventa una specie di grande calcolatrice. Il 1705programma valuta l'espressione e stampa il risultato. L'argomento può 1706essere il nome di una variabile, o qualcosa di più complicato. In ogni 1707caso, dev'essere un'espressione ammissibile a destra dell'operatore di 1708assegnamento. 1709 1710Si noti che un comando del tipo 1711 1712 print x^2 1713 1714non funziona in gretl, poiché x^2 non è (né può essere) il nome di una 1715variabile, ma (data una variabile scalare di nome x) 1716 1717 eval x^2 1718 1719funzionerà tranquillamente, e mostrerà il quadrato di x. 1720 1721Vedi anche "printf", per il caso in cui si voglia combinare testo e output 1722numerici. 1723 1724# fcast Prediction 1725 1726Varianti: 1727 1728 fcast [oss-iniziale oss-finale] 1729 [nome-variabile] 1730 1731 fcast [oss-iniziale oss-finale] 1732 1733 passi-avanti 1734 1735 [nome-variabile] --recursive 1736 1737Opzioni: --dynamic (crea previsioni dinamiche) 1738 --static (crea previsioni statiche) 1739 --out-of-sample (genera previsioni fuori dal campione) 1740 --no-stats (non mostra le statistiche di previsione) 1741 --stats-only (stampa solo le statistiche di previsione) 1742 --quiet (non mostra le previsioni) 1743 --recursive (vedi sotto) 1744 --plot=nome di file (vedi sotto) 1745Esempi: fcast 1997:1 2001:4 f1 1746 fcast fit2 1747 fcast 2004:1 2008:3 4 rfcast --recursive 1748 Vedi anche gdp_midas.inp 1749 1750Deve seguire un comando di stima. Calcola previsioni per un certo intervallo 1751delle osservazioni. L'intervallo può essere specificato indicando 1752oss-iniziale e oss-finale, oppure con l'opzione --out-of-sample (in questo 1753caso la previsione sarà per le osservazioni successive a quelle su cui è 1754stato stimato il modello); se non si usa alcuna opzione, l'intervallo sarà 1755quello attualmente impostato. Se si sceglie una previsione fuori dal 1756campione ma non sono disponibili osservazioni, viene segnalato un errore. A 1757seconda del tipo di modello, calcola anche gli errori standard (si veda 1758oltre). L'opzione --recursive produce un comportamento speciale spiegato 1759oltre. 1760 1761Se l'ultimo modello stimato consiste in un'equazione singola, l'argomento 1762opzionale nome-variabile ha l'effetto seguente: i valori della previsione 1763non sono mostrati, ma vengono salvati nel dataset con il nome di variabile 1764indicato. Se l'ultimo modello stimato è un sistema di equazioni, 1765nome-variabile ha un effetto diverso, ossia seleziona una particolare 1766varabile endogena per cui effettuare la previsione (l'impostazione 1767predefinita consiste nel produrre previsioni per tutte le variabili 1768endogene). Nel caso del sistema, o se non viene specificata nome-variabile, 1769i valori della previsione possono essere recuperati usando la variabile 1770accessoria "$fcast", mentre gli errori standard, se disponibili, sono 1771recuperabili con "$fcse". 1772 1773La scelta tra previsione statica e dinamica è rilevante solo nel caso di 1774modelli dinamici, che comprendono un processo di errore autoregressivo, o 1775che comprendono uno o più valori ritardati della variabile dipendente come 1776regressori. Le previsioni statiche sono per il periodo successivo, basate 1777sui valori effettivi nel periodo precedente, mentre quelle dinamiche usano 1778la regola della previsione a catena. Ad esempio, se la previsione per y nel 17792008 richiede come input il valore di y nel 2007, non è possibile calcolare 1780una previsione statica se non si hanno dati per il 2007. È possibile 1781calcolare una previsione dinamica per il 2008 se si dispone di una 1782precedente previsione per y nel 2007. 1783 1784La scelta predefinita consiste nel fornire una previsione statica per ogni 1785porzione dell'intervallo di previsione che fa parte dell'intervallo del 1786campione su cui il modello è stato stimato, e una previsione dinamica (se 1787rilevante) fuori dal campione. L'opzione dynamic richiede di produrre 1788previsioni dinamiche a partire dalla prima data possibile, mentre l'opzione 1789static richiede di produrre previsioni statiche anche fuori dal campione. 1790 1791L'opzione recursive al momento è disponibile solo per i modelli composti da 1792una singola equazione e stimati via OLS. Quando si usa questa opzione, le 1793previsioni calcolate sono ricorsive, ossia: ogni previsione è generata da 1794una stima del modello che usa i dati a partire da un certo punto fisso 1795(ossia l'inizio dell'intervallo del campione usato per la stima originaria) 1796fino alla data di previsione meno k osservazioni, dove k è il numero di 1797passi-avanti specificato come argomento. Le previsioni sono sempre dinamiche 1798quando è possibile. Si noti che l'argomento passi-avanti deve essere 1799utilizzato solo insieme all'opzione recursive. 1800 1801L'opzione --plot (disponibile solo nel caso della stima di un modello 1802uniequazionale) consente di ottenere un file con un grafico delle 1803previsioni. L'estensione dell'argomento filename di questa opzione controlla 1804il formato del grafico: .eps per EPS, .pdf per PDF, .png per PNG, .plt per 1805un file di comandi gnuplot. Il nome di file dummy display può essere usato 1806per mostrare il grafico in una finestra. Per esempio, 1807 1808 fcast --plot=fc.pdf 1809 1810genererà un grafico in formato PDF. Vengono rispettati gli indirizzi di 1811file assoluti; in caso contrario i fail vengono scritti nella directory di 1812lavoro di gretl. 1813 1814La natura degli errori standard della previsione (se disponibili) dipende 1815dalla natura del modello e della previsione. Per i modelli lineari statici, 1816gli errori standard sono calcolati seguendo il metodo descritto in Davidson 1817e MacKinnon (2004); essi incorporano sia l'incertezza dovuta al processo 1818d'errore, sia l'incertezza dei parametri (sintetizzata dalla matrice di 1819covarianza delle stime dei parametri). Per modelli dinamici, gli errori 1820standard della previsione sono calcolati solo nel caso di previsione 1821dinamica, e non incorporano incertezza dei parametri. Per modelli non 1822lineari, al momento non sono disponibili errori standard della previsione. 1823 1824Accesso dal menù: Finestra del modello, /Analisi/Previsioni 1825 1826# flush Programming 1827 1828Questo semplice comando non ha argomenti né opzioni; è pensato per 1829l'esecuzione di script, la cui esecuzione richieda qualche tempo, attraverso 1830l'interfaccia grafica (la versione di gretl da linea di comando lo ignora). 1831L'idea è di fornire all'utente un'indicazione visuale che sta succedendo 1832qualcosa e il programma non si è "piantato". 1833 1834Normalmente, quando uno script viene fatto girare nel client grafico, non 1835viene mostrato alcun output finché l'esecuzione non è completa; se perà 1836si usa flush l'effetto prodotto è il seguente: 1837 1838 Alla prima invocazione, gretl apre una finestra, mostra l'output prodotto 1839 fino a quel momento, e aggiunge il messaggio "elaborazione in corso...". 1840 1841 Ad ogni invocazione successiva, il testo mostrato nella finestra di output 1842 viene aggiornato e un nuovo messaggio "elaborazione in corso..." viene 1843 aggiunto. 1844 1845Tutto il resto dell'output viene automaticamente mostrato al completamenteo 1846dell'esecuzione dello script. 1847 1848Attenzione: non ha senso usare flush in uno script la cui esecuzione 1849richiede pochi secondi. Inoltre, bisognerebbe evitare di usare questo 1850comando in un punto dello script dove non c'è più output da mostrare, 1851perché il messaggio "elaborazione in corso..." risulterebbe fuorviante. 1852 1853L'uso che abbiamo in mente per il comando flush è esemplificato dal 1854seguente frammento: 1855 1856 set echo off 1857 scalar n = 10 1858 loop i=1..n 1859 # qualcosa che richiede del tempo 1860 loop 100 --quiet 1861 a = mnormal(200,200) 1862 b = inv(a) 1863 endloop 1864 # stampa qualcosa in output 1865 printf "Iterazione %2d fatta\n", i 1866 if i < n 1867 flush 1868 endif 1869 endloop 1870 1871# foreign Programming 1872 1873Sintassi: foreign language=lang 1874Opzioni: --send-data (pre-carica il dataset attuale) 1875 --quiet (sopprime l'output dal programma esterno) 1876 1877Questo comando apre una modalità speciale, in cui vengono accettati comandi 1878che verranno eseguiti da un programma esterno. Con il comando end foreign si 1879esce da questa modalità e i comandi verranno eseguiti. 1880 1881Al momento, i programmi esterni compatibili con questa modalità sono GNU R 1882(language=R), Ox di Jurgen Doornik Ox (language=Ox), GNU Octave 1883(language=Octave), Python, Julia e Stata. I nomi dei programmi esterni sono 1884case-insensitive. 1885 1886Con R, Octave e Stata l'opzione --send-data ha l'effetto di rendere 1887disponibile all'interno del programma di destinazione l'intero dataset 1888corrente. È possibile limitare l'invio dell'intero dataset al programma di 1889destinazione attraverso la creazione preventiva di una lista di variabili, a 1890cui va assegnato un nome che dovrà essere dato in specifica al comando. Di 1891seguito un esempio: 1892 1893 list Rlist = x1 x2 x3 1894 foreign language=R --send-data=Rlist 1895 1896Si veda la guida all'uso di gretl (il capitolo 44) per dettagli ed esempi. 1897 1898# fractint Statistics 1899 1900Argomenti: series [ order ] 1901Opzioni: --gph (calcola il test di Geweke e Porter-Hudak) 1902 --all (calcola entrambi i test) 1903 --quiet (non mostra i risultati) 1904 1905Verifica la presenza di integrazione frazionale ("long memory") per la 1906variabile specificata. L'ipotesi nulla è che l'ordine di integrazione della 1907variabile sia zero. Di default viene utilizzato lo stimatore locale di 1908Whittle (Robinson, 1995), ma se si indica l'opzione --gph il comando usa il 1909test GPH (Geweke e Porter-Hudak, 1983). L'opzione --all permette di ottenere 1910i risultati di entrambi i test. 1911 1912Per maggiori dettagli su questo tipo di test, v. Phillips e Shimotsu (2004). 1913 1914Se non si specifica l'argomento opzionale order, l'ordine del test (o dei 1915test) è automaticamente fissato al più piccolo fra T/2 e T^0.6. 1916 1917Gli ordini di integrazione stimati e i loro errori standard sono disponibili 1918con l'accessore "$result". Con l'opzione --all, lo stimatore Local Whittle 1919è nella prima riga e il GPH nella seconda. 1920 1921I risultati possono essere recuperati usando gli accessori "$test" e 1922"$pvalue". Questi valori sono basati sullo stimatore locale di Whittle a 1923meno che non sia stata indicata l'opzione --gph. 1924 1925Accesso dal menù: /Variabile/Test per radici unitarie/Integrazione frazionale 1926 1927# freq Statistics 1928 1929Argomento: variabile 1930Opzioni: --nbins=n (specifica il numero di intervalli) 1931 --min=minval (specifica il valore minimo, v. oltre) 1932 --binwidth=width (specifica l'ampiezza degli intervalli, v. oltre) 1933 --normal (test per la distribuzione normale) 1934 --gamma (test per la distribuzione gamma) 1935 --silent (non mostra nulla) 1936 --matrix=nome (usa una colonna di una matrice indicata per nome) 1937 --show-plot (v. oltre) 1938 --quiet (non mostra il grafico) 1939Esempi: freq x 1940 freq x --normal 1941 freq x --nbins=5 1942 freq x --min=0 --binwidth=0.10 1943 1944Se non vengono indicate opzioni, mostra la distribuzione di frequenza per la 1945variabile (indicata con il nome o il numero). 1946 1947Se viene indicata l'opzione --matrix, var (che deve essere un intero) viene 1948invece interpretato come un indice di base 1 che individua una colonna in 1949una matrice indicata per nome. Nel caso in cui la matrice in questione sia 1950un vettore colonna allora l'argomento var può essere omesso. 1951 1952Per controllare la presentazione della distribuzione è possibile 1953specificare o il numero di intervalli o il valore minimo più l'ampiezza 1954degli intervalli, come illustrato negli ultimi due esempi precedenti. 1955L'opzione --min fissa il limite inferiore dell'intervallo più a sinistra. 1956 1957Usando l'opzione --normal, vengono mostrati i risultati del test chi-quadro 1958di Doornik-Hansen per la normalità. Usando l'opzione --gamma, al posto del 1959test di normalità viene eseguito il test non parametrico di Locke per 1960l'ipotesi nulla che la variabile segua la distribuzione gamma; si veda Locke 1961(1976), Shapiro e Chen (2001). Si noti che la parametrizzazione della 1962distribuzione gamma in gretl è (forma, scala). 1963 1964Di default, viene mostrato un grafico della distribuzione se il programma 1965non è in batch mode ma in modalità interattiva. Questo comportamento può 1966essere modulato con l'opzione --plot. I parametri accettabili per questa 1967opzione sono none, per sopprimere il grafico, display, per mostrare il 1968grafico a video anche in batch mode, o un nome di file. L'effetto del 1969fornire un nome di file è lo stesso di quello descritto dall'opzione 1970--output del comando "gnuplot". 1971 1972In modalità interattiva viene mostrato anche un grafico della 1973distribuzione, a meno che non si usi l'opzione --quiet. Per converso, il 1974grafico non viene mostrato quando il comando è invocato da script, a meno 1975che non venga usata l'opzione --show-plot. (Questo non si applica alla 1976versione di gretl a linea di comando, gretlcli.) 1977 1978L'opzione --silent sopprime interamente l'output mostrato di solito. Ha 1979senso usarla insieme a una delle opzioni riguardanti la distribuzione: in 1980questo modo la statistica test e il suo p-value verranno salvati, e potranno 1981essere recuperati attraverso l'utilizzo degli accessori "$test" e "$pvalue". 1982Può anche essere utilizzato assieme all'opzione --plot se si è solamente 1983interessati alla visione dei relativi istogrammi e non si è interessati al 1984resto del testo. 1985 1986Si noti che in gretl non è disponibile una funzione che è parallela a 1987questo comando, ma è possibile utilizzare una funzione parallela che 1988permette di raggiungere lo stesso scopo, che è "aggregate". Inoltre la 1989distribuzione di frequenza costruita con il comando freq può essere 1990ottenuta in forma matriciale attraverso l'utilizzo dell'accessore "$result". 1991 1992Accesso dal menù: /Variabile/Distribuzione di frequenza 1993 1994# funcerr Programming 1995 1996Argomento: [ messaggio ] 1997 1998Questo comando è utilizzabile soltanto nel contesto di funzioni definite 1999dall'utente (vedi "function"); esso provoca un'interruzione della funzione 2000con errore. 2001 2002Il parametro opzionale messaggio dev'essere una stringa (anche sotto forma 2003di variabile); se presente, viene stampato assieme al messaggio di errore 2004inviato alla funzione chiamante. 2005 2006# function Programming 2007 2008Argomento: nome_funzione 2009 2010Apre un blocco di istruzioni che definiscono una funzione. Il blocco va 2011chiuso con end function. (Eccezione: per cancellare dalla memoria una 2012funzione definita dall'utente, si usa il comando function pippo delete, dove 2013"pippo" è la funzione da cancellare.) Per maggiori dettagli, si veda la 2014guida all'uso di gretl (il capitolo 14). 2015 2016# garch Estimation 2017 2018Argomenti: p q ; variabile-dipendente [ variabili-indipendenti ] 2019Opzioni: --robust (errori standard robusti) 2020 --verbose (mostra i dettagli delle iterazioni) 2021 --quiet (non stampa nulla) 2022 --vcv (mostra la matrice di covarianza) 2023 --nc (non include una costante) 2024 --stdresid (standardizza i residui) 2025 --fcp (usa l'algoritmo di Fiorentini, Calzolari e Panattoni) 2026 --arma-init (parametri di varianza iniziale da ARMA) 2027Esempi: garch 1 1 ; y 2028 garch 1 1 ; y 0 x1 x2 --robust 2029 Vedi anche garch.inp, sw_ch14.inp 2030 2031Stima un modello GARCH (Generalized Autoregressive Conditional 2032Heteroskedasticity) univariato, o, se sono specificate delle 2033variabili-indipendenti, includendo delle variabili esogene. I valori interi 2034p e q (che possono essere indicati in forma numerica o col nome di variabili 2035scalari preesistenti) rappresentano gli ordini di ritardo nell'equazione 2036della varianza condizionale. 2037 2038 h(t) = a(0) + somma(per i da 1 a q) a(i)*u(t-i)^2 + somma( per j da 1 a p) b(j)*h(t-j) 2039 2040Il parametro p rappresenta quindi l'ordine generalizzato (o "AR"), mentre q 2041rappresenta il consueto ordine ARCH (o "MA"). Se p è diverso da zero, anche 2042q deve essere diverso da zero, altrimenti il modello non è identificato. 2043Comunque, è possibile stimare un semplice modello ARCH impostando q a un 2044valore positivo e p a zero. La somma di p e q non deve superare 5. Si noti 2045che nell'equazione della media viene automaticamente inclusa una costante, a 2046meno che non si usi l'opzione --nc. 2047 2048Per impostazione predefinita, i modelli GARCH vengono stimati usando il 2049codice nativo gretl, ma è anche possibile usare l'algoritmo di Fiorentini, 2050Calzolari e Panattoni (1996). Il primo usa il massimizzatore BFGS, mentre il 2051secondo usa un algoritmo di tipo Newton-Raphson con la matrice di 2052informazione e un successivo raffinamento usando l'Hessiana. 2053 2054Sono disponibili varie stime della matrice di covarianza dei coefficienti. 2055Il metodo predefinito è quello dell'Hessiana, a meno che non si usi 2056l'opzione --robust, nel qual caso viene usata la matrice di covarianza QML 2057(White). Altre possibilità (ad es. la matrice di informazione, o lo 2058stimatore di Bollerslev-Wooldridge) possono essere specificate con il 2059comando "set". 2060 2061In modalità predefinita, le stime dei parametri di varianza sono 2062inizializzate usando la varianza dell'errore non condizionale, ottenuta 2063dalla stima OLS iniziale, per la costante, e piccoli valori positivi per i 2064coefficienti dei valori passati dell'errore al quadrato e per la varianza 2065dell'errore. L'opzione --arma-init fa in modo che i valori iniziali per 2066questi parametri siano ricavati da un modello ARMA iniziale, sfruttando la 2067relazione tra GARCH e ARMA mostrata nel capitolo 21 di Time Series Analysis 2068di Hamilton. In alcuni casi, questo metodo può aumentare le probabilità di 2069convergenza. 2070 2071I residui GARCH e la varianza condizionale stimata sono memorizzate 2072rispettivamente nelle variabili "$uhat" e "$h". Ad esempio, per ottenere la 2073varianza condizionale è possibile scrivere: 2074 2075 genr ht = $h 2076 2077Con l'opzione --stdresid, i valori di "$uhat" vengono divisi per la radice 2078di h_t. 2079 2080Accesso dal menù: /Modello/Serie storiche/GARCH 2081 2082# genr Dataset 2083 2084Argomenti: nuova-variabile = formula 2085 2086NOTA: questo comando ha subito molti cambiamenti e migliorie da quando 2087l'help seguente è stato scritto, per cui per informazioni complete e 2088aggiornate consigliamo di far riferimento alla guida all'uso di gretl (il 2089capitolo 10). D'altro canto, il testo che segue non contiene informazioni 2090erronee, per cui può essere interpretato come "questo ed altro". 2091 2092In contesti appropriati, series, scalar, matrix, string e bundle sono 2093sinonimi per questo comando. 2094 2095Crea nuove variabili, di solito per mezzo di trasformazioni di variabili 2096esistenti. Si veda anche "diff", "logs", "lags", "ldiff", "sdiff" e "square" 2097per alcune scorciatoie. Nel contesto di una formula genr, le variabili 2098esistenti devono essere referenziate per nome, non per numero 2099identificativo. La formula dev'essere una combinazione ben definita di nomi 2100di variabile, costanti, operatori e funzioni (descritte oltre). Ulteriori 2101dettagli su alcuni aspetti di questo comando si possono trovare nella guida 2102all'uso di gretl (il capitolo 10). 2103 2104Il comando genr può produrre come risultato una serie o uno scalare. Ad 2105esempio, la formula x2 = x * 2 produce una serie se la variabile x è una 2106serie e uno scalare se x è uno scalare. Le formule x = 0 e mx = mean(x) 2107producono degli scalari. In alcune circostanze, può essere utile che un 2108risultato scalare sia espanso in una serie o in un vettore: è possibile 2109ottenere questo risultato usando series come "alias" per il comando genr. Ad 2110esempio, series x = 0 produce una serie con tutti i valori pari a 0. Allo 2111stesso modo, è possibile usare scalar come alias per genr, ma non è 2112possibile forzare un risultato vettoriale in uno scalare: con questa parola 2113chiave si indica che il risultato dovrebbe essere uno scalare; se non lo è, 2114viene emesso un messaggio di errore. 2115 2116Quando una formula produce come risultato una serie, l'intervallo su cui 2117essi sono definiti dipende dall'impostazione attuale del campione. È quindi 2118possibile definire una serie a pezzi, alternando l'uso dei comandi smpl e 2119genr. 2120 2121Gli operatori aritmetici supportati sono, in ordine di precedenza: ^ 2122(esponenziale); *, / e % (modulo o resto); + e -. 2123 2124Gli operatori Booleani disponibili sono (ancora in ordine di precedenza): ! 2125(negazione), && (AND logico), || (OR logico), >, <, =, >= (maggiore o 2126uguale), <= (minore o uguale) e != (disuguale). Gli operatori Booleani 2127possono essere usati per costuire variabili dummy: ad esempio (x > 10) 2128produce 1 se x > 10, 0 altrimenti. 2129 2130Le costanti predefinite sono pi e NA. L'ultima rappresenta il codice per i 2131valori mancanti: è possibile inizializzare una variabile con valori 2132mancanti usando scalar x = NA. 2133 2134Il comando genr supporta un'ampia gamma di funzioni matematiche e 2135statistiche, da quelle più comuni a quelle di uso specifico in econometria. 2136Inoltre offre l'accesso a numerose variabili interne che vengono definite 2137nel corso della stima di regressioni, dell'esecuzione di test, e così via. 2138Per un elenco delle funzioni e degli accessori, eseguire: "help functions". 2139 2140Oltre agli operatori e alle funzioni mostrati, ci sono alcuni usi speciali 2141del comando "genr": 2142 2143 "genr time" crea una variabile trend temporale (1,2,3,...) chiamata 2144 "time". "genr index" fa la stessa cosa, ma chiamando la variabile index. 2145 2146 "genr dummy" crea una serie di variabili dummy a seconda della 2147 periodicità dei dati. Ad esempio, nel caso di dati trimestrali 2148 (periodicità 4) il programma crea dq1, che vale 1 nel primo trimestre e 0 2149 altrove, dq2 che vale 1 nel secondo trimestre e 0 altrove, e così via. 2150 Nel caso di dati mensili, le dummy si chiamano dm1, dm2 e così via. Con 2151 altre frequenze dei dati, i nomi delle dummy sono dummy_1, dummy2, ecc. 2152 2153 "genr unitdum" e "genr timedum" creano insiemi di variabili dummy speciali 2154 da usare in un dataset di tipo panel. Il primo comando crea dummy che 2155 rappresentano le unità cross section, il secondo i periodi di 2156 osservazione. 2157 2158Nota: nella versione a riga di comando del programma, i comandi "genr" che 2159estraggono dati relativi al modello si riferiscono sempre al modello stimato 2160per ultimo. Questo vale anche per la versione grafica del programma se si 2161usa "genr" nel "terminale di gretl" o si immette una formula usando 2162l'opzione "Definisci nuova variabile" nel menù Variabile della finestra 2163principale. Usando la versione grafica, però, è possibile anche estrarre i 2164dati da qualunque modello mostrato in una finestra (anche se non è il 2165modello più recente) usando il menù "Analisi" nella finestra del modello. 2166 2167La variabile speciale obs serve da indice per le osservazioni. Ad esempio, 2168genr dum = (obs==15) crea una variabile dummy che vale 1 per l'osservazione 216915 e 0 altrove. È anche possibile usare questa variabile per selezionare 2170alcune osservazioni particolari secondo la data o il nome. Ad esempio genr d 2171= (obs>1986:4), genr d = (obs>"2008/04/01"), oppure genr d = (obs=="CA"). 2172Quando si usano in questo contesto date giornaliere o etichette per le 2173osservazioni, bisogna racchiuderle fra virgolette. Questo non è necessario 2174per date trimestrali o annuali. Si noti che, per serie storiche annuali, 2175l'anno non è sintatticmante distiguibile da un semplice intero; per cui, 2176per confrontare un'osservazione con obs per anno, bisogna usare la funzione 2177obsnum per convertire l'anno in un numero progressivo, come ad esempio in in 2178genr d = (obs>obsnum(1986)). 2179 2180È possibile estrarre dei valori scalari da una serie usando una formula 2181genr con la sintassi nome-variabile[osservazione]. Il valore di osservazione 2182può essere specificato con un numero o una data. Esempi: x[5], 2183CPI[1996:01]. Per i dati giornalieri occorre usare la forma AAAA/MM/GG, ad 2184esempio ibm[1970/01/23]. 2185 2186È possibile modificare una singola osservazione in una serie usando genr. 2187Per farlo, occorre aggiungere un numero di osservazione o una data valida 2188tra parentesi quadre al nome della variabile nel lato sinistro della 2189formula. Ad esempio: genr x[3] = 30 o genr x[1950:04] = 303.7. 2190 2191 Formula Commento 2192 ------- ------- 2193 y = x1^3 x1 al cubo 2194 y = ln((x1+x2)/x3) 2195 z = x>y z(t) = 1 se x(t) > y(t), 0 altrove 2196 y = x(-2) x ritardata di 2 periodi 2197 y = x(+2) x anticipata di 2 periodi 2198 y = diff(x) y(t) = x(t) - x(t-1) 2199 y = ldiff(x) y(t) = log x(t) - log x(t-1), il tasso di crescita 2200 istantaneo di x 2201 y = sort(x) ordina x in senso crescente e la salva in y 2202 y = dsort(x) ordina x in senso decrescente 2203 y = int(x) tronca x e salva il valore intero in y 2204 y = abs(x) salva il valore assoluto di x 2205 y = sum(x) somma i valori di x escludendo i valori mancanti NA 2206 y = cum(x) cumulativa: y(t) = somma di x(s) per s da 1 a t 2207 aa = $ess imposta aa uguale alla somma dei quadrati degli 2208 errori dell'ultima regressione 2209 x = $coeff(sqft) estrae il coefficiente stimato per la variabile sqft 2210 nell'ultima regressione 2211 rho4 = $rho(4) estrae il coefficiente di autoregressione del quarto 2212 ordine dall'ultimo modello (presume un modello ar 2213 model) 2214 cvx1x2 = $vcv(x1, x2) estrae il coefficiente di covarianza stimato tra le 2215 variabili x1 e x2 dall'ultimo modello 2216 foo = uniform() variabile pseudo-casuale uniforme nell'intervallo 0-1 2217 bar = 3 * normal() variabile pseudo-casuale normale con mu = 0, sigma = 2218 3 2219 samp = ok(x) vale 1 per le osservazioni dove il valore di x non è 2220 mancante. 2221 2222Accesso dal menù: /Variabile/Definisci nuova variabile 2223Accesso alternativo: Menù pop-up nella finestra principale 2224 2225# gmm Estimation 2226 2227Opzioni: --two-step (Stima a due passi) 2228 --iterate (GMM iterato) 2229 --vcv (Mostra la matrice di covarianza) 2230 --verbose (Mostra i dettagli delle iterazioni) 2231 --quiet (non stampa nulla) 2232 --lbfgs (usa il massimizzatore L-BFGS-B anziché il BFGS standard) 2233Esempi: hall_cbapm.inp 2234 2235Esegue la stima col metodo dei momenti generalizzato (Generalized Method of 2236Moments, GMM) usando l'algoritmo BFGS (Broyden, Fletcher, Goldfarb, Shanno). 2237Occorre specificare uno o più comandi per aggiornare le quantità rilevanti 2238(tipicamente i residui GMM), una o più condizioni di ortogonalità, una 2239matrice iniziale dei pesi e un elenco dei parametri da stimare, il tutto 2240racchiuso tra le parole chiave gmm e end gmm. Ogni opzione aggiuntiva va 2241messa nella riga del comando end gmm. 2242 2243Si veda la guida all'uso di gretl (il capitolo 27) per i dettagli. Quello 2244che segue è un semplice esempio illustrativo. 2245 2246 gmm e = y - X*b 2247 orthog e ; W 2248 weights V 2249 params b 2250 end gmm 2251 2252Nell'esempio si assume che y e X siano matrici di dati, b sia un vettore con 2253i valori dei parametri, W sia una matrice di strumenti, e V un'appropriata 2254matrice dei pesi. La dichiarazione 2255 2256 orthog e ; W 2257 2258indica che il vettore dei residui e è in linea di principio ortogonale ad 2259ognuno degli strumenti che compongono le colonne di W. 2260 2261Nome dei parametri 2262 2263Nella stima di un modello non lineare spesso risulta conveniente rinominare 2264i parametri in maniera concisa. Durante la stampa dei risultati, comunque, 2265risulta desiderabile l'utilizzo di etichette il più informative possibile. 2266Questo può essere fatto attraverso l'aggiunta della parola chiave 2267param_names dentro il blocco di comando. Per un modello con k parametri 2268l'argomento che segue questa parola chiave dovrebbe essere o una stringa 2269letterale contenente tutti i k nomi separati da spazi e racchiusi dentro le 2270doppie virgolette, oppure il nome di nome di una variabile stringa 2271contenente tutti k nomi dell'elenco. 2272 2273Accesso dal menù: /Modello/GMM 2274 2275# gnuplot Graphs 2276 2277Argomenti: variabili-y variabile-x [ variabile-dummy ] 2278Opzioni: --with-lines[=varspec] (usa linee invece che punti) 2279 --with-lp[=varspec] (usa linee e punti) 2280 --with-impulses[=varspec] (usa linee verticali) 2281 --with-steps[=varspec] (usa segmenti orizzontali e verticali) 2282 --time-series (mostra rispetto al tempo) 2283 --single-yaxis (forza l'uso di un solo asse delle ordinate) 2284 --ylogscale[=base] (ordinate in scala logaritmica) 2285 --dummy (si veda sotto) 2286 --fit=fitspec (si veda sotto) 2287 --font=fontspec (si veda sotto) 2288 --band=bandspec (si veda sotto) 2289 --band-style=style (si veda sotto) 2290 --matrix=name (mostra le colonne di una data matrice) 2291 --output=filename (ridirige l'output su file) 2292 --input=filename (prende l'input da file) 2293Esempi: gnuplot y1 y2 x 2294 gnuplot x --time-series --with-lines 2295 gnuplot wages educ gender --dummy 2296 gnuplot y x --fit=quadratic 2297 gnuplot y1 y2 x --with-lines=y2 2298 2299Le variabili nella lista variabili-y vengono mostrate rispetto alla 2300variabile variabile-x. Per avere un grafico storico è possibile usare time 2301come variabile-x, oppure usare l'opzione --time-series. Vedi anche i comandi 2302"plot" e "panplot". 2303 2304Per default, i dati sono mostrati come punti; ma questa scelta può essere 2305modificata usando una delle opzioni --with-lines, --with-lp o 2306--with-impulses. Se il grafico contiene più di una serie, l'effetto di 2307queste opzioni può essere limitato ad un sottoinsieme delle variabili 2308usando il parametro varspec. Esso deve essere dato sotto forma di una lista 2309separata da virgole dei nomi (o dei numeri) delle variabili da tracciare con 2310linee e/o con impulsi. L'ultimo tra gli esempi di cui sopra mostra come 2311tracciare y1 e y2 contro x, in modo tale che y2 sia rappresentata da una 2312linea ma y1 da punti. 2313 2314Usando l'opzione --dummy, occorre fornire esattamente tre variabili: una 2315variabile y, una variabile x, e una variabile dummy dumvar. L'effetto è 2316quello di mostrare y rispetto a x colorando in modo diverso i vari punti, a 2317seconda che dumvar valga 1 o 0. 2318 2319Usando l'opzione --ylogscale si punò far sì che l'asse delle ordinate sia 2320logaritmico anziché lineare. L'opzione accetta un parametro come base. Ad 2321esempio, 2322 2323 gnuplot y x --ylogscale=2 2324 2325produce un grafico in cui l'asse delle ordinate è espresso in termini di 2326potenze di 2. Se la base è omessa, si userà il valore 10. 2327 2328Creare un grafico da dati in una matrice 2329 2330In generale è necessario specificare sia l'argomento yvars che quello xvar; 2331entrambi devono indicare variabili nel dataset corrente (per nome o numero 2332identificativo). Se tuttavia viene specificata con l'opzione --matrix una 2333matrice definita in precedenza questi argomenti diventano opzionali: se la 2334matrice specificata ha k colonne, di default le prime k - 1 sono considerate 2335come yvars, e l'ultima come xvar. Se viene indicata l'opzione --time-series, 2336tuttavia, il comando fornisce il grafico di tutte le k variabili rispetto al 2337tempo. Se si desidera il grafico solo di alcune colonne della matrice è 2338necessario identificare yvars e xvar fornendo l'indice delle colonne 2339corrispondenti, dove la prima colonna ha indice 1. Per esempio, se si 2340desidera un grafico a dispersione della colonna 2 della matrice M rispetto 2341alla colonna 1, il comando da digitare è: 2342 2343 gnuplot 2 1 --matrix=M 2344 2345Mostrare una linea interpolante 2346 2347L'opzione "fit" si applica solo al caso di un diagramma a dispersione 2348bivariato, o quando il grafico contiene un'unica serie storica. Il 2349comportamento predefinito consiste nel mostrare la linea con le stime OLS, 2350se il coefficiente di pendenza è significativo almeno al 10 per cento. 2351Azioni diverse possono essere effettuate usando questa opzione con una delle 2352seguenti specificazioni fitspec. Se il grafico contiene un'unica serie 2353storica, x è implicitamente dato dal tempo. 2354 2355 linear: la linea OLS viene mostrata a prescindere dalla sua 2356 significatività. 2357 2358 none: non mostrare alcuna interpolazione. 2359 2360 inverse, quadratic, cubic, semilog o linlog: mostrano una linea 2361 interpolante basata su una regressione del tipo corrispondente. Per 2362 semilog, si intende una regressione del logaritmo y on x; la linea 2363 interpolante mostra la media condizionale di y, ottenuta per 2364 esponenziazione. Per linlog, si intende una regressione di y sul logaritmo 2365 di x. 2366 2367 loess: usa una regressione robusta ponderata localmente (anche nota come 2368 "lowess"). 2369 2370Bande 2371 2372L'opzione --band si usa per mostrare zero o più serie assieme ad una 2373"banda" (spesso, ma non sempre, associata ad un intervallo di confidenza). 2374Questa opzione richede due parametri, separati da una virgola: il nome (o 2375numero ID) di una serie con il centro della banda e il nome(o numero ID) di 2376una con la sua ampiezza: l'effetto ottenuto è una banda con coordinate in 2377ordinata date dal centro, più o meno l'ampiezza. Si può usare un terzo 2378parametro opzionale (anch'esso separato da virgola), dato da uno scalare, 2379per specificare un moltiplicatore per l'ampiezza. Ad esempio, il codice che 2380segue disegna y assieme ad una banda di 1.96 volte se_y: 2381 2382 gnuplot y --time-series --band=y,se_y,1.96 --with-lines 2383 2384Assieme all'opzione --band, esiste l'opzione --band-style per controllare 2385l'aspetto della banda. Di default, i limiti alto e basso vengono mostrati 2386con linee continue, ma i parametri fill, dash, bars o step alterano questa 2387scelta, usando rispettivamente un'area, linee tratteggiate, barre verticali 2388o scalini. In più, si può aggiungere una specificazione di colore (dopo 2389una virgola). Ad esempio: 2390 2391 gnuplot ... --band-style=fill 2392 gnuplot ... --band-style=dash,0xbbddff 2393 gnuplot ... --band-style=,black 2394 gnuplot ... --band-style=bars,blue 2395 2396Il primo esempio produce un'area col colore di default; il secondo passa a 2397linee tratteggiate in un azzurro grigiastro; il terzo, linee continue nere, 2398e l'ultimo barre blu. Si noti che i colori possono essere dati con specifica 2399esadecimale o nomi (in inglese); la lista dei colori ammessi da gnuplotpuò 2400essere viaulizzata dando il comando "show colornames" in gnuplot, o 2401eseguendo nella console di gretl il comando 2402 2403 eval readfile("@gretldir/data/gnuplot/gpcolors.txt") 2404 2405Barre di recessione 2406 2407L'opzione "band" descritta sopra può inoltre essere utilizzata per 2408aggiungere di barre di recessione al grafico. Con ciò si intendono delle 2409barre verticali che occuperanno l'intera dimensione y del grafico ed 2410indicando la presenza (con barra) o l'assenza (senza barra) di alcune 2411caratteristiche qualitative in grafico di serie storiche. Queste barre sono 2412comunemente utilizzate per indicare periodi di recessione/periodi di 2413guerra/qualasiasi cosa possa essere codificata da una variabile dummy 0/1. 2414 2415In questo contesto l'opzione --band richiede un solo paramentro: 2416l'identificatore di serie con valori 0 e 1, dove 1 indica "on" e 0 indica 2417"off". L'opzione --band-style può essere utilizzata per specificare il 2418colore delle barre, dando o l'idendificatore esadecimale del colore o il 2419nome riconosciuto da gnuplot (vedi la sezione precedente). Un esempio che 2420mostra l'utilizzo del comandso su una singola barra è il seguente: 2421 2422 open AWM17 --quiet 2423 series dum = obs >= 1990:1 && obs <= 1994:2 2424 gnuplot YER URX --with-lines --time-series \ 2425 --band=dum --band-style=0xcccccc --output=display \ 2426 {set key top left;} 2427 2428Controllo dell'output 2429 2430In modalità interattiva il risultato è mostrato immediatamente. In 2431modalità "batch", viene scritto un file di comandi gnuplot, chiamato 2432gpttmpN.plt, a partire da N = 01; il grafico vero e proprio può essere 2433generato usando il programma gnuplot (su MS Windows: wgnuplot). Questo 2434comportamento può essere modificato usando l'opzione --output=filename, che 2435controlla il nome del file utilizzato e contemporaneamente permette di 2436specificare un particolare formato di output usando l'estensione del nome 2437del file (le tre lettere che seguono il .): .eps produce un file 2438Encapsulated PostScript (EPS); .pdf produce un file PDF; .png produce un 2439formato PNG, .emf un formato EMF (Enhanced MetaFile), .fig un file Xfig, e 2440.svg uno SVG (Scalable Vector Graphics). Se come nome del file si indica 2441"display", il grafico è inviato allo schermo come nella modalità 2442interattiva. Se si indica un nome del file con un'estensione diversa da 2443quelle appena citate viene prodotto un file di comandi gnuplot. 2444 2445Specificare un font 2446 2447L'opzione --font può essere utilizzata per specificare un particolare tipo 2448di font per il grafico. Il parametro fontspec dovrebbe assumere la forma del 2449nome di un carattere, ed opzionalmente dovrebbe essere seguito da la 2450grandezza dei punti (separati dal nome da una virgola od uno spazione, il 2451tutto messo dentro le doppie virgolette ""). Di seguito un esempio: 2452 2453 --font="serif,12" 2454 2455Nota: i font disponibili per gnuplot variano da piattaforma a piattaforma, 2456quindi se si intende scrivere un comando di plot portabile allora è 2457consigliabile optare per font generici come sans oppure serif. 2458 2459Aggiungere comandi gnuplot 2460 2461È disponibile un'ulteriore opzione per questo comando: dopo la 2462specificazione delle variabili e le eventuali opzioni, è possibile 2463aggiungere direttamente dei comandi gnuplot per modificare l'aspetto visivo 2464del grafico (ad esempio, impostando il titolo e o gli intervalli degli 2465assi). Questi comandi aggiuntivi vanno inclusi tra parentesi graffe e ogni 2466comando va separato con un punto e virgola; è possibile usare una barra 2467rovesciata (\) per continuare un gruppo di comandi gnuplot sulla riga 2468successiva. Ecco un esempio della sintassi: 2469 2470 { set title 'Il mio titolo'; set yrange [0:1000]; } 2471 2472Accesso dal menù: /Visualizza/Grafico 2473Accesso alternativo: Menù pop-up nella finestra principale, pulsante grafico sulla barra degli strumenti 2474 2475# graphpg Graphs 2476 2477Varianti: graphpg add 2478 graphpg fontscale value 2479 graphpg show 2480 graphpg free 2481 graphpg --output=filename 2482 2483La "pagina dei grafici" funzionerà solo se si è installato il sistema di 2484composizione LaTeX e si è in grado di generare e visualizzare file in 2485formato postscript. 2486 2487Nella finestra della sessione, è possibile trascinare fino a otto grafici 2488sull'icona della pagina dei grafici. Facendo doppio clic sull'icona della 2489pagina dei grafici (o facendo clic col tasto destro e selezionando 2490"Mostra"), la pagina contenente i grafici selezionati verrà composta e 2491aperta con il proprio visualizzatore di file postscript, da cui sarà 2492possibile stamparla. 2493 2494Per pulire la pagina dei grafici, fare clic col tasto destro sull'icona e 2495selezionare "Pulisci". 2496 2497Su sistemi diversi da MS Windows, può essere necessario modificare 2498l'impostazione del programma per visualizzare il postscript, che si trova 2499nella sezione "Programmi" della finestra di dialogo delle Preferenze di 2500gretl (nel menù Strumenti della finestra principale). 2501 2502È anche possibile operare sulla pagina del grafico via script, oppure 2503usando la console (nel programma GUI). Sono disponibili i comandi seguenti: 2504 2505Per aggiungere un grafico alla pagina dei grafici, digitate il comando 2506graphpg add dopo aver salvato un grafico con un nome, come in 2507 2508 grf1 <- gnuplot Y X 2509 graphpg add 2510 2511Per aprire la pagina dei grafici: graphpg show. 2512 2513Per svuotare la pagina dei grafici: graphpg free. 2514 2515Per modificare la dimensione del font usato nella pagina dei grafici usate 2516graphpg fontscale scale, dove scale è un moltiplicatore (con un valore di 2517default pari a 1.0). Per rendere il fonto più grande del 50 per cento, 2518dunque, è possibile scrivere 2519 2520 graphpg fontscale 1.5 2521 2522Per stampare su un file la pagina dei grafici usate l'opzione --output= 2523seguita dal nome di un file; questo nome deve avere il suffisso ".pdf", 2524".ps" o ".eps". Per esempio: 2525 2526 graphpg --output="myfile.pdf" 2527 2528Il file di output verrà scritto nella directory corrispondente al valore 2529corrente di "workdir", a meno che il nome di file contenga un percorso 2530completo. 2531 2532In questo contesto l'output usa linee colorate di default; per usare linee 2533punteggiate o tratteggiate al posto dei colori è possibile aggiungere 2534l'opzione --monochrome. 2535 2536# heckit Estimation 2537 2538Argomenti: variabile-dipendente variabili-indipendenti ; equazione di selezione 2539Opzioni: --quiet (non mostra i risultati) 2540 --two-step (esegue la stima in due passi) 2541 --vcv (mostra la matrice di covarianza) 2542 --opg (errori standard OPG) 2543 --robust (errori standard QML) 2544 --cluster=clustvar (vedi "logit" per una spiegazione) 2545 --verbose (mostra risultati aggiuntivi) 2546Esempi: heckit y 0 x1 x2 ; ys 0 x3 x4 2547 Vedi anche heckit.inp 2548 2549Modello di selezione di tipo Heckman. Nella specificazione, la lista che 2550precede il punto e virgola rappresenta l'equazione principale, mentre la 2551seconda lista rappresenta l'equazione di selezione. La variabile dipendente 2552nell'equazione di selezione (ys nell'esempio visto sopra) deve essere una 2553variabile binaria. 2554 2555Per impostazione predefinita, i parametri sono stimati per massima 2556verosimiglianza. La matrice di covarianza dei parametri è calcolata usando 2557l'inversa negativa dell'Hessiana. Se si vuole usare la procedura di stima in 2558due passi, basta usare l'opzione --two-step. In questo caso, la matrice di 2559covarianza dei parametri dell'equazione principale è corretta nel modo 2560descritto da Heckman (1979). 2561 2562Accesso dal menù: /Modello/Variabile dipendente limitata/Heckit 2563 2564# help Utilities 2565 2566Varianti: help 2567 help functions 2568 help comando 2569 help funzione 2570Opzione: --func (sceglie l'aiuto sulle funzioni) 2571 2572Se non vengono indicati argomenti, mostra un elenco dei comandi disponibili. 2573Indicando l'argomento "functions", mostra un elenco delle funzioni 2574disponibili (si veda "genr"). 2575 2576"help" comando descrive il comando (ad es. "help smpl"). help funzione 2577descrive la funzione (e.g. help ldet). Alcune funzioni hanno lo stesso nome 2578dei comandi relativi (e.g. diff): in questo caso verrà mostrato l'aiuto 2579relativo al comando, a meno che non si usi l'opzione --func. 2580 2581Accesso dal menù: /Aiuto 2582 2583# hfplot Graphs 2584 2585Argomenti: hflist [ ; lflist ] 2586Opzioni: --with-lines (crea grafico lineare) 2587 --time-series (tempo in ascissa) 2588 --output=filename (manda l'output al file specificato) 2589 2590Consente di creare un grafico di una serie ad alta frequenza, anche assieme 2591ad una o più serie osservate alla frequenza base del dataset. Il primo 2592argomento dev'essere una "MIDAS list"; gli argomenti aggiuntivi opzionali 2593lflist, separati da un punto e virgola, devono essere normali serie a bassa 2594frequenza. 2595 2596Per ulteriori dettagli sull'effetto dell'opzione --output, consultare lo 2597help per il comando "gnuplot". 2598 2599# hsk Estimation 2600 2601Argomenti: variabile-dipendente variabili-indipendenti 2602Opzioni: --no-squares (si veda sotto) 2603 --vcv (mostra la matrice di covarianza) 2604 --quiet (non stampa nulla) 2605 2606Questo comando è utile in presenza di eteroschedasticità sotto forma di 2607una funzione incognita dei regressori, che può essere approssimata da una 2608relazione quadratica. In questo contesto, offre la possibilità di avere 2609errori standard consistenti e stime dei parametri più efficienti, rispetto 2610alla stima OLS. 2611 2612La procedura richiede: (a) la stima OLS del modello, (b) una regressione 2613ausiliaria per generare la stima della varianza dell'errore e (c) la stima 2614con minimi quadrati ponderati, usando come peso il reciproco della varianza 2615stimata. 2616 2617Nella regressione ausiliaria (b) il logaritmo dei quadrati dei residui dalla 2618prima regressione OLS viene regredito sui regressori originali e sui loro 2619quadrati (o solamente sui regressori originali se l'opzione --no-squares è 2620data). La trasformazione logaritmica viene effettuata per assicurarsi che le 2621varianze stimate siano non negative. Indicando con u^* i valori stimati da 2622questa regressione, la serie dei pesi per la regressione con minimi quadrati 2623ponderati è data da 1/exp(u^*). 2624 2625Accesso dal menù: /Modello/Altri modelli lineari/HSK - WLS corretti per eteroschedasticità 2626 2627# hurst Statistics 2628 2629Argomento: nome-variabile 2630Opzione: --plot=tipologia o nome del file (si veda sotto) 2631 2632Calcola l'esponente di Hurst (una misura di persistenza, o di memoria lunga) 2633per una serie storica con almeno 128 osservazioni. 2634 2635L'esponente di Hurst è discusso da Mandelbrot (1983). In termini teorici è 2636l'esponente H nella relazione 2637 2638 RS(x) = an^H 2639 2640dove RS è l'"intervallo riscalato" della variabile x in un campione 2641dell'ampiezza n, mentre a è una costante. L'intervallo riscalato è 2642l'intervallo (valore massimo meno valore minimo) del valore cumulato, o 2643somma parziale, di x sul periodo del campione (dopo aver sottratto la media 2644campionaria), diviso per lo scarto quadratico medio campionario. 2645 2646Come punto di riferimento, se x è un rumore bianco (media zero, persistenza 2647zero) l'intervallo dei suoi valori cumulati (che forma una passeggiata 2648casuale), scalato per lo scarto quadratico medio, cresce come la radice 2649quadrata dell'ampiezza campionaria, ossia ha un esponente di Hurst atteso 2650pari a 0.5. Valori dell'esponente sensibilmente maggiori di 0.5 indicano 2651persistenza della serie, mentre valori minori di 0.5 indicano 2652anti-persistenza (autocorrelazione negativa). In teoria l'esponente deve 2653essere compreso tra 0 e 1, ma in campioni finiti è possibile ottenere delle 2654stime per l'esponente maggiori di 1. 2655 2656In gretl, l'esponente è stimato usando il sotto-campionamento binario: si 2657inizia dall'intero intervallo dei dati, quindi si usano le due metà 2658dell'intervallo, poi i quattro quarti, e così via. Per ampiezze campionarie 2659minori dell'intervallo dei dati complessivo il valore RS è la media presa 2660sui vari campioni. L'esponente è quindi stimato come il coefficiente di 2661pendenza della regressione del logaritmo di RS sul logaritmo dell'ampiezza 2662del campione. 2663 2664Di default, viene mostrato un grafico dell'intervallo riscalato se il 2665programma è in modalità interattiva. Questo comportamento può essere 2666calibrato attraverso l'opzione --plot. I parametri accettabili dall'opzione 2667sono none, per non mostrare il grafico, display, per mostrare il grafico 2668anche in batch mode, o un nome di file. L'effetto di fornire un nome di file 2669è reperibile alla descrizione del comando "gnuplot", sotto l'opzione 2670--output. 2671 2672Accesso dal menù: /Variabile/Esponente di Hurst 2673 2674# if Programming 2675 2676Struttura di controllo per l'esecuzione dei comandi. Sono supportate le tre 2677forme seguenti: 2678 2679 # forma semplice 2680 if condition 2681 commands 2682 endif 2683 2684 # a due rami 2685 if condition 2686 commands1 2687 else 2688 commands2 2689 endif 2690 2691 # a tre o più rami 2692 if condition1 2693 commands1 2694 elif condition2 2695 commands2 2696 else 2697 commands3 2698 endif 2699 2700La "condizione" deve essere un'espressione Booleana, per la cui sintassi si 2701veda "genr". Può essere incluso più di un blocco "elif". Inoltre, i 2702blocchi if ... endif possono essere nidificati. 2703 2704# include Programming 2705 2706Argomento: filename 2707Opzione: --force (forza una rilettura dal file) 2708Esempi: include myfile.inp 2709 include sols.gfn 2710 2711Da usare in uno script di comandi, principalmente per includere definizioni 2712di funzioni. Il comando filename dovrebbe includere l'estensione inp (un 2713script di testo semplice) oppure l'estensione gfn (una pacchetto di funzioni 2714gretl). I comandi del filename vengono eseguiti e il controllo viene 2715restituito allo script principale. 2716 2717L'opzione --force è specifica dei file di tipo gfn: quest'ultima ha come 2718effetto quello di forzare gretl a rileggere il pacchetto di funzioni anche 2719se quest'ultimo è già stato caricato in memoria. (In risposta a questo 2720comando, gli script di testo semplici inp sono sempre ricaricati.) 2721 2722Si veda anche il comando "run". 2723 2724# info Dataset 2725 2726Mostra le informazioni aggiuntive contenute nel file di dati attuale. 2727 2728Accesso dal menù: /Dati/Visualizza descrizione 2729Accesso alternativo: Finestre di esplorazione dei dati 2730 2731# intreg Estimation 2732 2733Argomenti: var-min var-max var-indip 2734Opzioni: --quiet (non mostra i risultati) 2735 --verbose (mostra i dettagli delle iterazioni) 2736 --robust (errori standard robusti) 2737 --opg (vedi sotto) 2738 --cluster=clustvar (vedi "logit" per la spiegazione) 2739Esempi: intreg lo hi const x1 x2 2740 Vedi anche wtp.inp 2741 2742Stima un modello di regressione per intervallo. Questo modello è adatto al 2743caso in cui la variabile dipendente è osservata in modo imperfetto per 2744alcune osservazioni (o anche tutte). In altre parole, si ipotizza che il 2745processo generatore dei dati sia 2746 2747 y* = x b + u 2748 2749ma che solo m <= y* <= M sia osservato (l'intervallo può essere limitato a 2750destra o a sinistra). Si noti che per alcune osservazioni m può essere 2751uguale a M. Le variabili var-min e var-max devono contenere valori NA nel 2752caso di osservazioni non limitate a sinistra o a destra. 2753 2754Il modello è stimato per massima verosimiglianza, ipotizzando la normalità 2755del termine di disturbo. 2756 2757Per impostazione predefinita, gli errori standard sono calcolati usando 2758l'inversa dell'Hessiana. Se si usa l'opzione --robust, vengono calcolati 2759invece gli errori standard QML o Huber-White. In questo caso la matrice di 2760covarianza stimata è un "sandwich" dell'inversa dell'Hessiana stimata e del 2761prodotto esterno del gradiente. In alternativa, l'opzione --opg produce una 2762matrice varianze-covarianze basata sul prodotto esterno dei gradienti. 2763 2764Accesso dal menù: /Modello/Modelli non lineari/Regressione per intervalli 2765 2766# johansen Tests 2767 2768Argomenti: ordine lista-y [ ; lista-x ] [ ; lista-rx ] 2769Opzioni: --nc (senza costante) 2770 --rc (costante vincolata) 2771 --uc (costante non vincolata) 2772 --crt (costante e trend vincolato) 2773 --ct (costante e trend non vincolato) 2774 --seasonals (include dummy stagionali centrate) 2775 --asy (registra i p-value asintotici) 2776 --silent (non mostra nulla) 2777 --quiet (mostra solo i test) 2778 --verbose (mostra i dettagli delle regressioni ausiliarie) 2779Esempi: johansen 2 y x 2780 johansen 4 y x1 x2 --verbose 2781 johansen 3 y x1 x2 --rc 2782 Vedi anche hamilton.inp, denmark.inp 2783 2784Esegue il test di Johansen per la cointegrazione tra le variabili della 2785lista-y per l'ordine specificato di ritardi. Per dettagli, si veda la guida 2786all'uso di gretl (il capitolo 33) oppure Hamilton (1994), capitolo 20. I 2787valori critici sono calcolati con l'approssimazione gamma di J. Doornik 2788(Doornik, 1998). Per il test traccia, vengono formiti due set di valori 2789critici: asintotici e aggiustati per l'ampiezza campionaria. Di default, 2790l'accessore "$pvalue" riporta la variante aggiustata, ma i valori asintotici 2791possono essere ottenuti usando l'opzione --asy. 2792 2793L'inclusione di trend deterministici nel modello è controllata dalle 2794opzioni del comando. Se non si indica alcuna opzione, viene inclusa una 2795"costante non vincolata", che permette la presenza di un'intercetta diversa 2796da zero nelle relazioni di cointegrazione e di un trend nei livelli delle 2797variabili endogene. Nella letteratura originata dal lavoro di Johansen (si 2798veda ad esempio il suo libro del 1995), si fa riferimento a questo come al 2799"caso 3". Le prime quattro opzioni mostrate sopra, che sono mutualmente 2800esclusive, producono rispettivamente i casi 1, 2, 4 e 5. Il significato di 2801questi casi e i criteri per scegliere tra di essi sono spiegati nella guida 2802all'uso di gretl (il capitolo 33). 2803 2804Le liste opzionali lista-x e lista-rx permettono di controllare per 2805specifiche variabili esogene che entrano nel sistema in modo non vincolato 2806(lista-x) o vincolate allo spazio di cointegrazione (lista-rx). Queste liste 2807vanno separate tra di loro e dalla lista-y usando il carattere punto e 2808virgola. 2809 2810L'opzione --seasonals, che può accompagnare una qualsiasi delle altre 2811opzioni, specifica l'inclusione di un gruppo di variabili dummy stagionali 2812centrate. Questa opzione è disponibile solo per dati trimestrali o mensili. 2813 2814La tabella seguente fornisce un esempio di interpretazione dei risultati del 2815test nel caso di 3 variabili. H0 denota l'ipotesi nulla, H1 l'ipotesi 2816alternativa e c il numero delle relazioni di cointegrazione. 2817 2818 Rango Test traccia Test Lmax 2819 H0 H1 H0 H1 2820 --------------------------------------- 2821 0 c = 0 c = 3 c = 0 c = 1 2822 1 c = 1 c = 3 c = 1 c = 2 2823 2 c = 2 c = 3 c = 2 c = 3 2824 --------------------------------------- 2825 2826Si veda anche il comando "vecm". 2827 2828Accesso dal menù: /Modello/Serie storiche/Test di cointegrazione/Johansen 2829 2830# join Dataset 2831 2832Argomenti: filename varname 2833Opzioni: --data=column-name (v. oltre) 2834 --filter=expression (v. oltre) 2835 --ikey=inner-key (v. oltre) 2836 --okey=outer-key (v. oltre) 2837 --aggr=method (v. oltre) 2838 --tkey=nome-colonna,stringa-formato (v. oltre) 2839 --verbose (visualizza dettagli sul comando) 2840 2841Questo comando importa una o più serie dal file di origine filename (che 2842deve essere un file di dati testuale delimitato o un file di dati nativo di 2843gretl) assegnandoli alla variabile varname. Per maggiori dettagli, si veda 2844la guida all'uso di gretl (il capitolo 7); in questa sede ci limitiamo a 2845ricordare brevemente le opzioni disponibili. Vedi anche "append" per alcune 2846semplici operazioni di unione di dataset. 2847 2848L'opzione --data può essere usata per specificare l'intestazione della 2849colonna nel file di origine se quest'ultima è diversa dal nome con il quale 2850dovrebbero essere chiamati i dati in gretl. 2851 2852L'opzione --filter può essere usata per specificare un criterio da seguire 2853per filtrare i dati di origine (in altre parole, per selezionare un 2854sottoinsieme di osservazioni). 2855 2856Le opzioni --ikey e --okey possono essere utilizzate per specificare una 2857relazione fra le osservazioni nel dataset corrente e quelle nel file di 2858origine (per esempio, gli individui possono essere assegnati alla famiglia 2859di appartenenza). 2860 2861L'opzione --aggr viene usata quando la relazione fra osservazioni nel 2862dataset corrente e nel file di origine non è biunivoca. 2863 2864L'opzione --tkey è applicabile solo quando il dataset corrente ha una 2865struttura di serie storiche. Viene usato per specificare il nome di una 2866colonna contenente le date da accoppiare al dataset e/o il formato in cui le 2867date sono rappresentate in quella colonna. 2868 2869Come importare più di una serie alla volta 2870 2871Il comando "join" può essere usato per importare più di una serie alla 2872volta. Questo si ha quando (a) l'argomento varname è una lista di nomi 2873separati da spazi, anziché una stringa semplice, oppure (b) quando è il 2874nome di un array di stringhe, gli elementi del quale saranno i nomi delle 2875serie da importare. 2876 2877Va detto che questo metodo ha alcune limitazioni: l'opzione --data non è 2878disponibile, e bisogna accettare i nomi delle variabili così come sono nel 2879dataset filename. Le altre opzioni verranno applicate uniformemente a tutte 2880le serie così importate. 2881 2882# kpss Tests 2883 2884Argomenti: ordine lista-variabili 2885Opzioni: --trend (include un trend) 2886 --seasonals (include dummy stagionali) 2887 --verbose (mostra i risultati della regressione) 2888 --quiet (non mostra i risultati) 2889 --difference (usa la differenza prima della variabile) 2890Esempi: kpss 8 y 2891 kpss 4 x1 --trend 2892 2893Si veda il paragrafo in fondo per l'uso di questo test su dati panel. 2894 2895Calcola il test KPSS (Kwiatkowski et al, Journal of Econometrics, 1992) per 2896la stazionarietà di ognuna delle variabili specificate (o della loro 2897differenza prima, se si usa l'opzione --difference. L'ipotesi nulla è che 2898la variabile in questione sia stazionaria, attorno a un valore fisso o, se 2899è stata usata l'opzione --trend, attorno a un trend deterministico lineare. 2900 2901> L'argomento order determina l'ampiezza della finestra usata per il 2902livellamento di Bartlett. Se viene dato un valore negativo questo è 2903considerato come un segnale per l'utilizzo in automatico di una finestra di 2904riferimento di ampiezza 4(T/100)^0.25, dove T è l'ampiezza del campione. 2905 2906Se si sceglie l'opzione --verbose il risultato della regressione ausiliaria 2907verrà stampato insieme alla varianza stimata della componente di random 2908walk della variabile 2909 2910Il valori critici riportati per questa statistica test sono basati sulle 2911superfici di risposta stimate secondo il metodo descritto da Sephton 2912(Economics Letters, 1995), che per piccoli campioni sono più accurate di 2913quelle fornite nell'articolo originale di KPSS. Quando la statistica test si 2914trova fra i valori critici al 10 e all'1 per cento viene mostrato un p-value 2915ottenuto per interpolazione lineare, che non dovrebbe essere accettato in 2916maniera acritica. Vedi anche la funzione "kpsscrit" per ottenere questi 2917valori critici come codice. 2918 2919Dati panel 2920 2921Quando il comando kpss viene usato con dati panel per calcolare un test 2922panel di radice unitaria, le opzioni applicabili e i risultati mostrati sono 2923leggermente diversi. Mentre nel caso di serie storiche regolari potete 2924fornire una lista di variabili da testare, con dati panel il comando può 2925testare solo una variabile alla volta. L'opzione --verbose, inoltre, ha un 2926significato diverso: produce un breve resoconto del test per ciascuna 2927singola serie storica (di default viene mostrato solo il risultato 2928complessivo). 2929 2930Se possibile, viene calcolato il test complessivo (ipotesi nulla: la 2931variabile in questione è stazionaria per tutte le unità panel) usando il 2932metodo di Choi (Journal of International Money and Finance, 2001). Questo 2933calcolo non è sempre immediato perchè, mentre il test di Choi è basato 2934sui p-value dei test sulle singole serie, attualmente non esiste un modo per 2935calcolare i p-value della statistica test KPSS; dobbiamo perciò basarci su 2936qualche valore critico. 2937 2938Se per una data variabile la statistica test cade fra i valori critici al 10 2939e all'1 per cento siamo in grado di interpolare un p-value. Ma se il test 2940cade a sinistra del valore critico al 10 per cento, o supera quello all'1 2941per cento, non riusciamo a compiere l'interpolazione e tutto ciò che 2942possiamo al limite fare è apporre un limite al test globale di Choi. Se le 2943singole statistiche test si trovano a sinistra del valore critico al 10 per 2944cento per alcune unità, ma superano quello all'1 per cento per altre, non 2945è possibile neppure il calcolo del limite superiore del test globale. 2946 2947Accesso dal menù: /Variabile/Test di radice unitaria/Test KPSS 2948 2949# labels Dataset 2950 2951Varianti: labels [ varlist ] 2952 labels --to-file=filename 2953 labels --from-file=filename 2954 labels --delete 2955Esempi: oprobit.inp 2956 2957Nella sua prima forma mostra le etichette informative (se presenti) per le 2958variabili in varlist, oppure per tutte le variabili nel dataset se varlist 2959non è specificata. 2960 2961Con l'opzione --to-file, scrive nel file indicato le etichette di tutte le 2962variabili nel dataset, una per linea. Se non sono presenti etichette viene 2963emesso un messaggio d'errore; se alcune variabili hanno etichette e altre 2964no, per le seconde viene mostrata una linea vuota. Il file di output verrà 2965scritto nella directory corrispondente al valore corrente di "workdir", a 2966meno che il nome di file contenga un percorso completo. 2967 2968Con l'opzione --from-file, legge il file specificato (che deve essere di 2969testo) e assegna le etichette alle variabili nel dataset, leggendo 2970un'etichetta per linea e interpretando linee vuote come etichette vuote. 2971 2972L'opzione --delete da quello che vi attendete: rimuove dal dataset tutte le 2973etichette di variabili. 2974 2975Accesso dal menù: /Dati/Etichette delle variabili 2976 2977# lad Estimation 2978 2979Argomenti: variabile-dipendente variabili-indipendenti 2980Opzioni: --vcv (mostra la matrice di covarianza) 2981 --no-vcv (non calcolare la matrice di covarianza) 2982 --quiet (non stampa nulla) 2983 2984Calcola una regressione che minimizza la somma delle deviazioni assolute dei 2985valori stimati dai valori effettivi della variabile dipendente. Le stime dei 2986coefficienti sono derivate usando l'algoritmo del simplesso di 2987Barrodale-Roberts; viene mostrato un messaggio di avvertimento se la 2988soluzione non è unica. 2989 2990Gli errori standard sono derivati usando la procedura bootstrap con 500 2991estrazioni. La matrice di covarianza per le stime dei parametri, mostrata se 2992si usa l'opzione --vcv, si basa sulla stessa procedura. Questa è 2993un'operazione computazionalmente piuttosto onerosa, per cui se sono 2994richieste le sole stime puntuali, essa può essere omessa attraverso 2995l'opzione --no-vcv; in questo caso, gli errori standard non saranno 2996disponibili. 2997 2998Si noti che questo stimatore può richiedere molto tempo di calcolo per 2999campioni grandi o modelli con molte variabili esplicative; in questi casi, 3000consigliamo di usare il comando "quantreg". I due comandi sono di fatto 3001equivalenti, a parte il fatto che quantreg usa l'algoritmo di Frisch-Newton 3002(più efficiente) e fornisce errori standard analitici anziché via 3003bootstrap. 3004 3005 lad y const X 3006 quantreg 0.5 y const X 3007 3008Accesso dal menù: /Modello/Stima robusta/LAD - Minime deviazioni assolute 3009 3010# lags Transformations 3011 3012Argomenti: [ ordine ; ] lista-variabili 3013Opzione: --bylag (ordina i termini per ritardo) 3014Esempi: lags x y 3015 lags 12 ; x y 3016 lags 4 ; x1 x2 x3 --bylag 3017 Vedi anche sw_ch12.inp, sw_ch14.inp 3018 3019Crea delle nuove variabili le quali sono i valori ritardati di ognuna delle 3020variabili nella lista-variabili. Il numero dei ritardi può essere indicato 3021dal primo parametro opzionale, altrimenti sarà pari alla periodicità del 3022dataset. Ad esempio, se la periodicità è 4 (trimestrale), il comando "lags 3023x y" crea 3024 3025 x_1 = x(t-1) 3026 x_2 = x(t-2) 3027 x_3 = x(t-3) 3028 x_4 = x(t-4) 3029 3030Il numero dei ritardi creati può essere indicato come primo parametro 3031opzionale (se presente, deve essere seguito da un punto e virgola). 3032 3033L'opzione --bylag ha senso solo se la lista-variabili contiene più di una 3034serie di variabili con ordine massimo di ritardo maggiore di 1. Da 3035impostazione predefinita, i termini ritardati vengono aggiunti al dataset 3036come variabili: si inizia con tutti i ritardi della prima serie, poi si 3037passa quelli della seconda, poi della terza e così via. Tuttavia, se 3038l'opzione --bylag è data il riordino viene fatto per ritardi: si inizia con 3039il primo ritardo di tutte le variabili, poi si passa al secondo e così via. 3040 3041Accesso dal menù: /Aggiungi/Ritardi delle variabili selezionate 3042 3043# ldiff Transformations 3044 3045Argomento: lista-variabili 3046 3047Calcola la differenza prima del logaritmo naturale di ogni variabile della 3048lista-variabili e la salva in una nuova variabile con il prefisso ld_. 3049Così, "ldiff x y" crea le nuove variabili 3050 3051 ld_x = log(x) - log(x(-1)) 3052 ld_y = log(y) - log(y(-1)) 3053 3054Accesso dal menù: /Aggiungi/Differenze logaritmiche 3055 3056# leverage Tests 3057 3058Opzioni: --save (salva le variabili risultato) 3059 --quiet (non mostra i risultati) 3060 --plot=mode-or-filename (si veda oltre) 3061Esempi: leverage.inp 3062 3063Deve seguire immediatamente un comando "ols". Calcola il "leverage" (h, 3064compreso tra 0 e 1) di ogni osservazione nel campione su cui è stato 3065stimato il precedente modello. Mostra il residuo (u) per ogni osservazione 3066assieme al leverage corrispondente e a una misura della sua influenza sulla 3067stima: u*h/(1-h). I "punti di leverage" per cui il valore di h supera 2k/n 3068(dove k è il numero dei parametri stimati e n è l'ampiezza del campione) 3069sono indicati con un asterisco. Per i dettagli sui concetti di leverage e 3070influenza, si veda Davidson e MacKinnon (1993), capitolo 2. 3071 3072Vengono mostrati anche i valori DFFITS: questi sono "residui studentizzati" 3073(ossia i residui previsti, divisi per i propri errori standard) moltiplicati 3074per sqrt[h/(1 - h)]. Per una discussione dei residui studentizzati e dei 3075valori DFFITS si veda Maddala,Introduction to Econometrics, cap. 12, oppure 3076Belsley, Kuh e Welsch (1980). 3077 3078In breve, i "residui previsti" sono la differenza tra il valore osservato e 3079il valore stimato della variabile dipendente all'osservazione t, ottenuti da 3080una regressione in cui quell'osservazione è stata omessa (oppure in cui è 3081stata aggiunta una variabile dummy che vale 1 solo per l'osservazione t); il 3082residuo studentizzato si ottiene dividendo il residuo previsto per il 3083proprio errore standard. 3084 3085Se si usa l'opzione --save, il leverage, il valore di influenza e il valore 3086DFFITS vengono aggiunti al dataset in uso. In questo contesto, l'opzione 3087--quiet evita che i risultati vengano stampati. I nomi di default delle 3088serie prodotte sono rispettivamente lever, influ e dffits. Se però serie 3089con questo nome già esistono, i nomi delle serie prodotte sarano ritoccati 3090per assicurarne l'unicità; se così avvenisse, occuperanno i tre numeri di 3091serie più alti nel dataset. 3092 3093Dopo l'esecuzione, l'accessore "$test" restituisce il criterio di 3094validazione incrociata, definito come la somma dei quadrati degli scarti fra 3095la variabile dipendente e il suo valore previsto, calcolato a partire da un 3096campione dal quale quell'osservazione è stata esclusa. (Questo stimatore è 3097chiamato leave-one-out). Per una discussione più approfondita del criterio 3098di validazione incrociata, v. Davidson e MacKinnon's Econometric Theory and 3099Methods, pag. 685-686, e i riferimenti bibliografici ivi citati. 3100 3101Per impostazione predefinita, se questo comando viene invocato verrà 3102mostrata una versione interattiva del grafico del leverage e dei valori 3103d'influenza. Questo può essere aggiustato tramite l'opzione --plot. I 3104parametri accettabili per quest'opzione sono none per sopprimere il grafico, 3105display per mostrare il grafico anche in modalità script, oppure il nome 3106del file. L'effetto di dare un nome di file al comando è descritto 3107all'interno dell'opzione --output del comando "gnuplot". 3108 3109Accesso dal menù: Finestra del modello, /Test/LEVERAGE - Osservazioni influenti 3110 3111# levinlin Tests 3112 3113Argomenti: order series 3114Opzioni: --nc (test senza costante) 3115 --ct (con costante e trend) 3116 --quiet (non mostra i risultati) 3117 --verbose (stampa i risultati per unità) 3118Esempi: levinlin 0 y 3119 levinlin 2 y --ct 3120 levinlin {2,2,3,3,4,4} y 3121 3122Calcola il test di radice unitaria per dati panel di Levin, Lin e Chu 3123(2002). L'ipotesi nulla che tutte le singole serie storiche contengano una 3124radica unitaria, mentre l'alternativa è che nessuna delle serie storiche ne 3125contenga una. (In altre parole, si assume un coefficiente AR(1) comune a 3126tutte le serie, anche se altre proprietà statistiche delle serie possono 3127variare da un'unità di osservazione all'altra.) 3128 3129Di default le regressioni dei test ADF contengono una costante; per 3130eliminarla usate l'opzione --nc; per aggiungere un trend lineare usate 3131l'opzione --ct. (Vedi il comando "adf" per una spiegazione delle regressioni 3132ADF.) 3133 3134Il valore (non negativo) order del numero di ritardi della variabile 3135dipendente da usare nel test può essere indicato in due modi diversi. Se si 3136fornisce uno scalare, questo viene applicato a tutte le serie nel panel. In 3137alternativa è possibile fornire una matrice che contiene un particolare 3138ordine di ritardo per ogni serie. La matrice deve essere un vettore con 3139numero di elementi pari a quello delle unità di osservazione nel 3140sottoinsieme corrente del campione, e può essere indicata per nome o 3141costruita usando parentesi graffe come illustrato nell'ultimo degli esempi 3142precedenti. 3143 3144Con l'opzione --verbose, vengono stampate per ogni unità nel panel le 3145seguenti statistiche: delta, il coefficiente sul livello ritardato in ognuna 3146delle regressioni ADF; s2e, la varianza stimata delle innovazioni; e s2y, la 3147varianza di lungo periodo stimata per la serie in differenze. 3148 3149Si noti che test di radice unitaria in panel pèossono anche essere 3150condiotti mediante i comandi "adf" e "kpss". 3151 3152Accesso dal menù: /Variable/Unit root tests/Levin-Lin-Chu test 3153 3154# logistic Estimation 3155 3156Argomenti: variabile-dipendente variabili-indipendenti 3157Opzioni: --ymax=value (specifica il massimo della variabile dipendente) 3158 --robust (utilizza errori standard robusti) 3159 --cluster=clustvar (si veda "logit" per una ulteriore spiegazione) 3160 --vcv (mostra la matrice di varianza-covarianza) 3161 --fixed-effects (si veda oltre) 3162 --quiet (non mostra nulla) 3163Esempi: logistic y const x 3164 logistic y const x --ymax=50 3165 3166Regressione logistica: esegue una regressione OLS usando la trasformazione 3167logistica sulla variabile dipendente: 3168 3169 log(y/(y* - y)) 3170 3171La variabile dipendente dev'essere strettamente positiva. Se è una frazione 3172decimale, compresa tra 0 e 1, il valore predefinito per y^* (il massimo 3173asintotico della variabile dipendente) è 1. Se la variabile dipendente è 3174una percentuale, compresa tra 0 e 100, il valore predefinito di y^* è 100. 3175 3176È possibile indicare un valore diverso per il massimo, usando l'opzione 3177--ymax. Il valore fornito deve essere maggiore di tutti i valori osservati 3178della variabile dipendente. 3179 3180I valori stimati e i residui della regressione sono trasformati 3181automaticamente usando l'inversa della trasformazione logistica: 3182 3183 y = y* / (1 + exp(-x)) 3184 3185dove x rappresenta un valore stimato oppure un residuo della regressione 3186OLS, usando la variabile dipendente trasformata. I valori riportati sono 3187dunque confrontabili con la variabile dipendente originale. Il bisogno 3188dell'approssimazione sorge dal fatto che la trasformazione inversa è una di 3189natura non-lineare e quindi quest'ultima non conserva un valore atteso. 3190 3191L'opzione --fixed-effects è utilizzabile solo se il dataset assume una 3192forma panel. In questo caso si sottrae la media del gruppo dalla 3193trasformazione logistica della variabile dipendente e si procede alla 3194classica stima ad effetti fissi. 3195 3196Si noti che se la variabile dipendente è binaria, occorre usare il comando 3197"logit" invece di questo comando. 3198 3199Accesso dal menù: /Modello/Modelli non lineari/Logistico 3200 3201# logit Estimation 3202 3203Argomenti: variabile-dipendente variabili-indipendenti 3204Opzioni: --robust (errori standard robusti) 3205 --cluster=clustvar (errori standard clusterizzati) 3206 --multinomial (stima un logit multinomiale) 3207 --vcv (mostra la matrice di covarianza) 3208 --verbose (mostra i dettagli delle iterazioni) 3209 --quiet (non mostra i risultati) 3210 --p-values (mostra i p-value invece delle pendenze) 3211Esempi: keane.inp, oprobit.inp 3212 3213Se la variabile dipendente è binaria (i suoi valori sono 0 o 1), esegue una 3214stima di massima verosimiglianza dei coefficienti per le 3215variabili-indipendenti con il metodo di Newton-Raphson. Visto che il modello 3216è nonlineare, le pendenze dipendono dai valori delle variabili 3217indipendenti: per impostazione predefinita, al posto dei p-value vengono 3218mostrate le pendenze rispetto ad ognuna delle variabili indipendenti, 3219calcolate in corrispondenza della media della variabile. Questo 3220comportamento può essere soppresso usando l'opzione --p-values. La 3221statistica chi-quadro testa l'ipotesi nulla che tutti i coefficienti tranne 3222la costante siano pari a zero. 3223 3224In modalità predefinita, gli errori standard sono calcolati con l'inversa 3225negativa dell'Hessiana. Se si usa l'opzione --robust, verranno calcolati gli 3226errori standard QML o quelli di Huber-White. In questo caso, la matrice di 3227covarianza stimata è un "sandwich" dell'inversa dell'Hessiana stimata e del 3228prodotto esterno del gradiente. Per i dettagli, si veda il cap. 10 di 3229Davidson e MacKinnon (2004). Ma se viene usata l'opzione --cluster, verranno 3230prodotti errori standard "cluster-robusti"; vedi la guida all'uso di gretl 3231(il capitolo 22) per maggiori dettagli. 3232 3233Se la variabile dipendente non è binaria, ma è discreta, si ottengono 3234stime Logit ordinate. Tuttavia, se viene fornita l'opzione --multinomial, la 3235variabile dipendente è interpretata come non ordinale, e vengono prodotte 3236stime Logit Multinomiali. (In ambo i casi, verrà dato un errore se la 3237dipendente non è discreta.) Nel caso multinomiale, l'accessore "$mnlprobs" 3238sarà disponibile dopo la stima; esso conterrà una matrice con le 3239probabilità stimate dei possibili valori della dipendente per ogni 3240osservazione (osservazioni per riga, valori per colonna). 3241 3242Per condurre un'analisi delle proporzioni (dove la variabile dipendente è 3243la proporzione dei casi che hanno una certa caratteristica in ogni 3244osservazione, invece che una variabile binaria che indica se la 3245caratteristica è presente o no), non bisogna usare il comando "logit", ma 3246occorre costruire la variabile logit come 3247 3248 genr lgt_p = log(p/(1 - p)) 3249 3250e usare questa come variabile dipendente in una regressione OLS. Si veda 3251Ramanathan (2002), capitolo 12. 3252 3253Accesso dal menù: /Modello/Modelli non lineari/Logit 3254 3255# logs Transformations 3256 3257Argomento: lista-variabili 3258 3259Calcola il logaritmo naturale di ognuna delle variabili della 3260lista-variabili e lo salva in una nuova variabile col prefisso l_, ossia una 3261"elle" seguita da un trattino basso. Ad esempio "logs x y" crea le nuove 3262variabili l_x = ln(x) e l_y = ln(y). 3263 3264Accesso dal menù: /Aggiungi/Logaritmi delle variabili selezionate 3265 3266# loop Programming 3267 3268Argomento: controllo 3269Opzioni: --progressive (abilita modalità speciali di alcuni comandi) 3270 --verbose (mostra i dettagli dei comandi genr) 3271Esempi: loop 1000 3272 loop 1000 --progressive 3273 loop while essdiff > .00001 3274 loop i=1991..2000 --verbose 3275 loop for (r=-.99; r<=.99; r+=.01) 3276 loop foreach i xlist 3277 Vedi anche armaloop.inp, keane.inp 3278 3279Questo comando apre una modalità speciale, in cui il programma accetta 3280comandi da eseguire più volte. Si esce dalla modalità loop con 3281l'istruzione "endloop": solo a questo punto i comandi indicati vengono 3282eseguiti. 3283 3284Il parametro "controllo" deve assumere uno dei cinque valori mostrati negli 3285esempi: un numero di volte per cui ripetere i comandi all'interno del loop; 3286"while" seguito da una condizione booleana; un intervallo di valori interi 3287per una variabile indice; "for" seguito da tre espressioni tra parentesi, 3288separate da punti e virgola (in modo simile all'istruzione for nel 3289linguaggio di programmazione C); infine, "foreach" seguito da una variabile 3290indice e una lista. 3291 3292Si veda la guida all'uso di gretl (il capitolo 13) per altri dettagli ed 3293esempi, oltre che per la spiegazione dell'opzione --progressive (che è 3294destinata ad essere usata nelle simulazioni Monte Carlo) e per l'elenco dei 3295comandi di gretl che possono essere usati all'interno di un loop. 3296 3297Per impostazione predefinita, l'esecuzione dei comandi procede con un output 3298ridotto rispetto dentro un loop, rispetto ad altri contesti. Per avere più 3299informazioni su quel che succede dentro il loop, si può usare l'opzione 3300--verbose. 3301 3302# mahal Statistics 3303 3304Argomento: lista-variabili 3305Opzioni: --quiet (non mostra nulla) 3306 --save (salva le distanze nel dataset) 3307 --vcv (mostra la matrice di covarianza) 3308 3309La distanza di Mahalanobis è la distanza tra due punti in uno spazio 3310k-dimensionale, scalata rispetto alla variazione statistica in ogni 3311dimensione dello spazio. Ad esempio, se p e q sono due osservazioni su un 3312insieme di k variabili con matrice di covarianza C, la distanza di 3313Mahalanobis tra le due osservazioni è data da 3314 3315 sqrt((p - q)' * C-inversa * (p - q)) 3316 3317dove (p - q) è un vettore a k dimensioni. Se la matrice di covarianza è la 3318matrice identità, la distanza di Mahalanobis corrisponde alla distanza 3319Euclidea. 3320 3321Lo spazio in cui vengono calcolate le distanze è definito dalle variabili 3322selezionate; per ogni osservazione nell'intervallo attuale viene calcolata 3323la distanza tra l'osservazione e il centroide delle variabili selezionate. 3324La distanza è la controparte multidimensionale di uno z-score standard e 3325può essere usata per giudicare se una certa osservazione "appartiene" a un 3326gruppo di altre osservazioni. 3327 3328Se si usa l'opzione --vcv, vengono mostrate la matrice di covarianza e la 3329sua inversa. Se si usa l'opzione --save, le distanze vengono salvate nel 3330dataset con il nome mdist (o mdist1, mdist2 e così via, se esiste già una 3331variabile con quel nome). 3332 3333Accesso dal menù: /Visualizza/Distanze di Mahalanobis 3334 3335# makepkg Programming 3336 3337Argomento: filename 3338Opzioni: --index (crea un file ausiliario di indicizzazione) 3339 --translations (crea un file ausiliario di stringhe) 3340 --quiet (lavora silenziosamente) 3341 3342Permette la creazione di un "function package" da linea di comando. Il nome 3343di file indica il nome del pacchetto da creare e deve avere estensione .gfn. 3344Si veda la guida all'uso di gretl (il capitolo 14) per dettagli. 3345 3346Modalità gfn 3347 3348Crea un file gfn. Si assume che sia accessibile un file di specificazione 3349del pacchetto, con lo stesso nome di filename ma con estensione .spec; 3350devono anche esistere tutti gli eventuali file ausiliatri in esso 3351menzionati. Infine, si assume che tutte le funzioni da inserire nel 3352pacchetto siano presenti in memoria. 3353 3354Modalità zip 3355 3356Scrive un pacchetto di tipo zip (gfn più materiale extra). Se viene trovato 3357un file gfn con lo stesso nome di filename, gretl cercherà due file 3358corrispondenti con estensione inp e spec: se vengono trovati entrambi e 3359almeno uno di essi è più recente del file gfn, allora quest'ultimo viene 3360ricreato, altrimenti viene usato quello esistente. Se il file non esiste, 3361gretl creerà il file gfn come prima cosa. 3362 3363Opzioni gfn 3364 3365Le opzioni consentono la scrittura di file ausiliari per l'uso con gli 3366"addon" di gretl. Il file indice è un breve documento XML contenente alcune 3367informazioni base sul pacchetto; ha lo stesso nome del pacchetto stesso ed 3368estensione .xml. Il file di traduzione contiene le stringhe da tradurre del 3369pacchetto, in formato C; per il pacchetto pippo questo file in questione 3370dovrà chiamarsi pippo-i18n.c. Questi file non vengono prodotti se si opera 3371tramite la modalità zip con l'utilizzo di un file gfn pre-esistente. 3372 3373Per maggiori dettagli, consultare Guida ai pacchetti. 3374 3375Accesso dal menù: /Strumenti/Pacchetti di funzioni/Nuovo pacchetto 3376 3377# markers Dataset 3378 3379Varianti: markers --to-file=nomefile 3380 markers --from-file=nomefile 3381 markers --delete 3382 3383Con l'opzione --to-file, scrive nel file indicato le stringhe marcatrici 3384delle osservazioni presenti nel dataset corrente, una per ogni linea. Se il 3385dataset non contiene stringhe viene emesso un messaggio d'errore. Il file di 3386output verrà scritto nella directory corrispondente al valore corrente di 3387"workdir", a meno che il nome di file contenga un percorso completo. 3388 3389Con l'opzione --from-file, legge dal file specificato (che deve essere in 3390formato testo) e assegna alle righe del dataset i marcatori di osservazione, 3391leggendone uno per riga. In generale il file dovrebbe contenere tanti 3392marcatori quante sono le osservazioni nel dataset, ma se quest'ultimo è un 3393panel il numero di marcatori nel file potrebbe anche essere pari al numero 3394di unità in cross-section (nel qual caso i marcatori sono ripetuti a ogni 3395data). 3396 3397L'opzione --delete fa quello che vi aspettate: cancella le stringhe 3398marcatrici delle osservazioni dal dataset. 3399 3400# meantest Tests 3401 3402Argomenti: var1 var2 3403Opzione: --unequal-vars (assume varianze diverse) 3404 3405Calcola la statistica t per l'ipotesi nulla che le medie della popolazione 3406siano uguali per le variabili var1 e var2, mostrando il suo p-value. 3407 3408L'impostazione predefinita prevede di assumere che le varianze delle due 3409variabili siano uguali, mentre usando l'opzione --unequal-vars, si assume 3410che esse siano diverse; in questo caso i gradi di libertà per la statistica 3411test saranno approssimati per Satterthwaite (1946). 3412 3413Accesso dal menù: /Modello/Modelli bivariati/Differenza delle medie 3414 3415# midasreg Estimation 3416 3417Argomenti: depvar indepvars ; MIDAS-terms 3418Opzioni: --vcv (stampa la matrice di covarianze) 3419 --robust (errori standard robusti) 3420 --quiet (non stampa i risultati) 3421 --levenberg (vedi sotto) 3422Esempi: midasreg y 0 y(-1) ; mds(X, 1, 9, 1, theta) 3423 midasreg y 0 y(-1) ; mds(X, 1, 9, 0) 3424 midasreg y 0 y(-1) ; mdsl(XL, 2, theta) 3425 Vedi anche gdp_midas.inp 3426 3427Stima coi minimi quadrati (lineari o meno, a seconda della specificazione) 3428un modello MIDAS (Mixed Data Sampling), ossia un modello in cui una o più 3429delle variabili esplicative sono osservate a frequenza più alta della 3430dipendente; per una buona introduzione all'argomento si veda Armesto, 3431Engemann e Owyang (2010). 3432 3433Le variabili in indepvars devono essere alla stessa frequenza della 3434dipendente. Questa lista normalmente contiene anche const o 0 (intercetta) 3435e, di solito, uno o più ritardi della variabile dipendente. I termini ad 3436alta frequenza vengono forniti dopo un punto e virgola; ognuno di essi sotto 3437forma di numeri separati da virgole fra parentesi, col prefisso mds oppure 3438mdsl. 3439 3440mds: questa variante richiede 5 argomenti, come segue: il nome di una "MIDAS 3441list", due interi col minimo e massimo ritardo ad alta frequenza, un intero 3442fra 0 e 4, che specifica il tipo di parametrizzazione da usare, e il nome di 3443un vettore contenente i valori iniziali dei parametri. L'esempio qui sotto 3444usa i ritardi da 3 a 11 della serie ad alta frequenza contenuta nella lista 3445X, usando la parametrizzazione di tipo 1 (Almon esponenziale, vedi sotto) 3446con inizializzazione theta. 3447 3448 mds(X, 3, 11, 1, theta) 3449 3450mdsl: in gnere richiede 3 argomenti: il nome di una lista di ritardi MIDAS, 3451un intero per il tipo di parametrizzazione e il nome di un vettore di valori 3452iniziali. In questo caso i ritardi minimo e massimo sono impliciti 3453nell'argomento lista iniziale. Nell'esempio seguente Xlags deve essere una 3454lista che contiene già i ritardi necessari; essa può essere costruita 3455tramite la funzione "hflags" function. 3456 3457 mdsl(XLags, 1, theta) 3458 3459I tipi di parametrizzazione sono disponibili come segue; nel contesto mds e 3460mdsl le specificazioni in questione dovrebbero essere date in forma di 3461codice numerio o di stringhe virgolettate esposte dopo i numeri. 3462 34630 o "umidas": "MIDAS non vincolato" o U-MIDAS (un coefficiente per ritardo) 3464 34651 o "nealmon": Almon esponenziale normalizzato; necessita di almeno un 3466parametro, di solito due 3467 34682 o "beta0": beta normalizzato con zero finale; richiede due parametri 3469 34703 o "betan": beta normalizzato senza zero finale; richiede tre parametri 3471 34724 o "almonp": polinomio di Almon non normalizzato; richiede almeno un 3473parametro 3474 3475Quando la parametrizzazione è U-MIDAS, l'argomento di inzializzazione non 3476è necessario con mds or mdsl. In altri casi, si può richiedere 3477un'inizializzazione automatica sostituendo una di queste due forme col nome 3478di un vettore di parametri iniziali: 3479 3480 La parola chiave null: accettabile solo se la parameterizzazione scelta ha 3481 un numero fisso di termini (i casi beta, 2 o 3). È accettata anche nel 3482 caso di Almon esponenziale, implicando come valori predifiniti 2 3483 parametri. 3484 3485 Un intero col numero di parametri richiesto. 3486 3487Il metodo di stima usato da questo comando dipende dalla specificazione dei 3488termini ad alta frequenza. Nel caso U-MIDAS il metodo è l'OLS; in tutti gli 3489altri casi si usano i minimi quadrati non lineari (NLS). Quando si 3490specificano le parametrizzazioni Almon esponenziale normalizzata oppure beta 3491normalizzata, il metodo NLS di default è una combinazione di BFGS vincolato 3492e OLS, ma per forzare l'uso dell'algoritmo di Levenberg-Marquardt si può 3493usare l'opzione --levenberg. 3494 3495Accesso dal menù: /Model/Time series/MIDAS 3496 3497# mle Estimation 3498 3499Argomenti: funzione di log-verosimiglianza [ derivate ] 3500Opzioni: --quiet (non stampa il modello stimato) 3501 --vcv (mostra la matrice di covarianza) 3502 --hessian (calcola la matrice di covarianza a partire dall'Hessiana) 3503 --robust (matrice di covarianza QML) 3504 --cluster=clustvar (errori standard clusterizzati) 3505 --verbose (stampa i dettagli delle iterazioni) 3506 --no-gradient-check (vedi sotto) 3507 --auxiliary (vedi sotto) 3508 --lbfgs (usa L-BFGS-B anziché il BFGS standard) 3509Esempi: weibull.inp, biprobit_via_ghk.inp, frontier.inp, keane.inp 3510 3511Esegue la stima di massima verosimiglianza (ML, Maximum Likelihood) usando a 3512scelta o l'algoritmo BFGS (Broyden, Fletcher, Goldfarb, Shanno) o quello di 3513Newton. Occorre specificare la funzione di log-verosimiglianza e dichiarare 3514i valori iniziali per i parametri della funzione Se possibile è 3515consigliabile indicare anche le espressioni per le derivate di questa 3516funzione, rispetto ad ognuno dei parametri; se non si indicano le derivate 3517analitiche, verrà calcolata un'approssimazione numerica. 3518 3519Questo messaggio di aiuto presuppone l'utilizzo dell'algoritmo di 3520massimizzazione BFGS, per maggiori informazioni circa l'uso dell'algoritmo 3521di Newton si consulti la guida all'uso di gretl (il capitolo 26). 3522 3523Esempio: si supponga di avere una serie X con valori 0 o 1 e di voler 3524ottenere la stima di massima verosimiglianza della probabilità p che X 3525valga 1 (è semplice intuire che la stima ML di p corrisponderà alla 3526proporzione dei valori 1 nel campione). 3527 3528Occorre per prima cosa aggiungere p al dataset e assegnargli un valore 3529iniziale; ad esempio, 3530 3531 scalar p = 0.5 3532 3533Quindi costruiamo il blocco di comandi per la stima di massima 3534verosimiglianza: 3535 3536 mle loglik = X*log(p) + (1-X)*log(1-p) 3537 deriv p = X/p - (1-X)/(1-p) 3538 end mle 3539 3540La prima riga specifica la funzione di log-verosimiglianza: inizia con la 3541parola chiave mle, quindi contiene la variabile dipendente e una 3542specificazione per la log-verosimiglianza usando la stessa sintassi del 3543comando "genr". La riga seguente (che è opzionale), inizia con la parola 3544chiave deriv e fornisce la derivata della funzione di log-verosimiglianza 3545rispetto al parametro p. Se non vengono indicate derivate, occorre includere 3546una dichiarazione che identifica i parametri liberi (separati da spazi) 3547utilizzando la parola chiave params; questi parametri liberi possono essere 3548sia scalari, che vettori, che una qualsiasi combinazione dei due. Ad esempio 3549si sarebbe potuto scrivere: 3550 3551 mle loglik = X*log(p) + (1-X)*log(1-p) 3552 params p 3553 end mle 3554 3555e in questo caso la derivata verrebbe calcolata numericamente. 3556 3557Si noti che eventuali opzioni vanno indicate nella riga finale del blocco 3558MLE. Ad esempio: 3559 3560 mle loglik = X*log(p) + (1-X)*log(1-p) 3561 params p 3562 end mle --quiet 3563 3564Matrice di covarianza ed errori standard 3565 3566Se la funzione di log-verosimiglianza restituisce una variabile o un vettore 3567per ogni valore delle osservazioni allora gli errori standard sono, per 3568impostazione predefinita, basati sul prodotto esterno del gradiente (OPG), 3569mentre se l'opzione --hessian è fornita allora quest'ultimi saranno 3570ottenuti sulla base dell'inversa negativa della matrice hessiana, la quale 3571verrà approssimata numericamente. Se l'opzione --robust è data allora 3572verrà utilizzato uno stimatore di quasi-massima verosimiglianza (QML), 3573ossia uno stimatore ottenuto dal sandwich dell'inversa negativa della 3574matrice hessiana e del prodotto esterno del gradiente (OPG). In ogni caso, 3575se la funzione di log-verosimiglianza restituisce semplicemente un valore 3576scalare il metodo OPG non risulta disponibile (come anche lo stimatore QML), 3577e gli errori standard sono necessariamente calcolati usando l'hessiana 3578numerica. 3579 3580Nel caso in cui si volesse solo il parametro primario delle stime è 3581possibile dare l'opzione --auxiliary, la quale sopprime il calcolo della 3582matrice di covarianza e degli errori standard; questo permetterà di 3583risparmiare alcuni cicli della CPU, salvando anche un po' di memoria. 3584 3585Controllo delle derivate analitiche 3586 3587Se si forniscono le derivate analitiche della funzione di 3588log-verosimiglianza, di default gretl esegue un controllo numerico circa la 3589loro attendibilità. Occasionalmente, questo controllo potrebbe produrre dei 3590falsi positivi, ovvero casi in cui derivate calcolate correttamente vengono 3591segnalate come errate e di cui la stima viene quindi negata. Per impedire 3592che ciò accada, o per aggiungere un poco di velocità in più al processo, 3593è possibile dare l'opzione --no-gradient-check. Ovviamente questo andrebbe 3594fatto solo nel caso in cui si è assolutamente sicuri che il gradiente dato 3595in specifica è corretto. 3596 3597Nomi dei parametri 3598 3599Quando si stima un modello non lineare spesso risulta conveniente nominare i 3600parametri in maniera concisa. Nella stampa dei risultati, comunque, risulta 3601desiderabile che le etichette data siano le più informative e sintetiche 3602possibili. Questo risultato pyò venire ottenuto aggiungendo la parola 3603chiave param_names all'interno del blocco di comando. Per un modello con k 3604parametri l'argomento successivo a questa parola chiave può essere sia una 3605stringa di testo, messa tra virgolette, contenente k nomi separati da uno 3606spazio, sia il nome di una stringa di variabili avente al suo interno tutti 3607i k nomi. 3608 3609Per maggiori informazioni circa la massima verosimiglianza ("mle") 3610raccomandiamo di consultare la guida all'uso di gretl (il capitolo 26). 3611 3612Accesso dal menù: /Modello/Massima verosimiglianza 3613 3614# modeltab Utilities 3615 3616Varianti: modeltab add 3617 modeltab show 3618 modeltab free 3619 modeltab --output=nomefile 3620 3621Manipola la "tabella modelli" di gretl. Si veda la guida all'uso di gretl 3622(il capitolo 3) per i dettagli. Le opzioni hanno i seguenti effetti: "add" 3623aggiunge l'ultimo modello stimato alla tabella modelli, se possibile; "show" 3624mostra la tabella modelli in una finestra; "free" pulisce la tabella. 3625 3626Per stampare la tabella del modello, si usi l'opzione --output= seguita dal 3627nome di un file. Se quest'ultimo ha il suffisso ".tex", l'output sarà in 3628formato TeX; se il suffisso è ".rtf" l'output sarà RTF; in caso contrario 3629sarà in formato di testo. Nel caso di output in formato TeX per default 3630verrà prodotto un "frammento" pronto per essere inserito in un documento; 3631se invece si preferisce ottenere un documento completo, usate l'opzione 3632--complete; per esempio, 3633 3634 modeltab --output="myfile.tex" --complete 3635 3636Accesso dal menù: Finestra delle icone, Icona Tabella Modelli 3637 3638# modprint Printing 3639 3640Argomenti: matcoeff nomi [ stat ] 3641Opzione: --output=filename (invia l'output al file specificato) 3642 3643Stampa la tabella dei coefficienti e le statistiche aggiuntive opzionali per 3644un modello stimato "a mano". Utile principalmente per le funzioni definite 3645dall'utente. 3646 3647L'argomento matcoeff deve essere una matrice k per 2 che contiene i k 3648coefficienti stimati nella prima colonna ed i k relativi errori standard 3649associati nella seconda. L'argomento nomi deve fornire almeno k etichette 3650per i coefficienti. Può avere la forma di una stringa fissa (fra virgolette 3651doppie) o di una variabile di tipo stringa, nel qual caso le etichette vanno 3652separate con spazi oppure virgole. Alternativamente, si può usare allo 3653scopo un array di stringhe. 3654 3655L'argomento opzionale stat è un vettore che contiene p statistiche 3656aggiuntive da stampare sotto la tabella dei coefficienti. Se si usa questo 3657argomento, nomi deve contenere k + p stringhe di cui le ultime p sono 3658relative alle statistiche aggiuntive. 3659 3660Per inviare l'output ad un file, usate l'opzione --output= seguita dal nome 3661di un file. Se quest'ultimo ha il suffisso ".tex", l'output sarà in formato 3662TeX; se il suffisso è ".rtf" l'output sarà RTF; in caso contrario sarà in 3663formato di testo. Nel caso di output in formato TeX per default verrà 3664prodotto un "frammento" pronto per essere inserito in un documento; se 3665invece si preferisce ottenere un documento completo, usate l'opzione 3666--complete. 3667 3668Il file di output verrà scritto nella directory corrispondente al valore 3669corrente di "workdir", a meno che il nome di file contenga un percorso 3670completo. 3671 3672# modtest Tests 3673 3674Argomento: [ ordine ] 3675Opzioni: --normality (normalità dei residui) 3676 --logs (non linearità, logaritmi) 3677 --squares (non linearità, quadrati) 3678 --autocorr (autocorrelazione) 3679 --arch (ARCH) 3680 --white (test di White per l'eteroschedasticità) 3681 --white-nocross (test di White per l'eteroschedasticità cono solo i quadrati) 3682 --breusch-pagan (test per l'eteroschedasticità di Breusch-Pagan) 3683 --robust (stima robusta della varianza per Breusch-Pagan) 3684 --panel (eteroschedasticità, a gruppi) 3685 --comfac (restrizione a fattor comune, solo per modelli AR1) 3686 --xdepend (dipendenza cross-section, solo per dati panel) 3687 --quiet (non mostra i dettagli) 3688 --silent (non mostra i risultati) 3689Esempi: credscore.inp 3690 3691Deve seguire immediatamente un comando di stima. La discussione che segue è 3692relativa all'esecuzione del comando dopo la stima di un modello ad equazione 3693singola; si veda la guida all'uso di gretl (il capitolo 32) per una 3694descrizione di come funziona "modtest" dopo la stima di un VAR 3695 3696A seconda dell'opzione usata, il comando esegue uno dei test seguenti: test 3697di Doornik-Hansen per la normalità del termine di errore; test dei 3698moltiplicatori di Lagrange per la non-linearità (logaritmi o quadrati); 3699test di White (con o senza i prodotti incrociati) o test di Breusch-Pagan 3700per l'eteroschedasticità (Breusch e Pagan, 1979), test LMF per la 3701correlazione seriale (si veda (Kiviet, 1986)); test per il modello ARCH 3702(Autoregressive Conditional Heteroskedasticity, si veda anche il comando 3703"arch"); o restrizione a fattore comune, (solo modelli AR1); o un test per 3704la dipendenza tra unità cross-sectio in caso di modelli con dati panel. Ad 3705eccezione dei test sulla normalità, a fattor comune e sulla dipendenza 3706cross-section, la maggior parte dei test risultano disponibili solo in caso 3707di stima OLS; per ulteriori dettagli circa lo stimatore TSLS (two-stage 3708least squares) si veda oltre. 3709 3710L'argomento opzionale ordine è rilevante solo nel caso si scelga l'opzione 3711--autocorr o l'opzione --arch. Per impostazione predefinita, questi test 3712sono eseguiti usando un ordine di ritardo pari alla periodicità dei dati, 3713ma è possibile anche impostare un ordine di ritardo specifico. 3714 3715L'opzione --robust ha effetto solo se viene scelto il test di Breusch-Pagan; 3716l'effetto è quello di usare lo stimatore robusto per la varianza proposto 3717da Koenker (1981), rendendo il test meno sensibile all'ipotesi di 3718normalità. 3719 3720L'opzione --panel è disponibile solo se il modello viene stimato su dati 3721panel: in questo caso viene eseguito un test per eteroschedasticità a 3722gruppi (ossia per una varianza dell'errore diversa fra le unità cross 3723section). 3724 3725L'opzione --comfac è disponibile solo quando il modello è stimato usando 3726un metodo AR(1), come quello di Hildreth-Lu. La regressione ausiliaria ha la 3727struttura di un modello dinamico relativamente poco vincolato ed è usata 3728per verificare il vincolo di fattori comuni implicito nella specificazione 3729AR(1). 3730 3731L'opzione --xdepend è disponibile solo se il modello viene stimato su dati 3732panel. La statistica test è sviluppata secondo il metodo di Pesaran (2004). 3733L'ipotesi nulla riguarda il termine di errore assunto come indipendentemente 3734distribuito per tutte le osservazioni cross-section o gli individui. 3735 3736Per impostazione predefinita il programma mostra la regressione ausiliaria 3737sulla quale la statistica test è basata, laddove possibile. Questa funzione 3738può venir soppressa utilizzando o l'opzione --quiet (che mostra le 3739informazioni strettamente necessarie) oppure con l'opzione --silent (che non 3740mostra alcuna informazione). La statistica test ed il relativo p-value 3741possono essere richiamati utilizzando gli accessori "$test" e "$pvalue". 3742 3743Nel caso di modelli stimati col metodo dei minimi quadrati a due stadi (si 3744veda "tsls"), non è possibile usare il test LM, quindi gretl offre alcuni 3745test equivalenti; in questo caso, l'opzione --autocorr calcola il test di 3746Godfrey per l'autocorrelazione (si veda Godfrey, 1994), mentre l'opzione 3747--white produce il test HET1 per l'eteroschedasticità (si veda Pesaran e 3748Taylor, 1999. 3749 3750Per ulteriori test diagnostici sui modelli si vedano anche le voci "chow", 3751"cusum", "reset" e "qlrtest". 3752 3753Accesso dal menù: Finestra del modello, /Test 3754 3755# mpols Estimation 3756 3757Argomenti: variabile-dipendente variabili-indipendenti 3758Opzioni: --vcv (mostra la matrice di covarianza) 3759 --simple-print (non mostra le statistiche ausiliarie) 3760 --quiet (non mostra i risultati) 3761 3762Calcola le stime OLS per il modello indicato usando aritmetica in virgola 3763mobile a precisione multipla. Questo comando è disponibile solo se gretl è 3764compilato con il supporto per la libreria Gnu Multiple Precision (GMP). Per 3765impostazione predefinita, vengono usati 256 bit di precisione nei calcoli, 3766ma è possibile aumentare questo valore usando la variabile d'ambiente 3767GRETL_MP_BITS. Ad esempio, usando l'interprete dei comandi bash, è 3768possibile aumentare la precisione a 1024 bit eseguendo il comando seguente 3769prima di avviare gretl 3770 3771 export GRETL_MP_BITS=1024 3772 3773Per questo comando è disponibile un'opzione abbastanza speciale (utile 3774soprattutto a scopo di test): se la lista variabili-indipendenti è seguita 3775da un punto e virgola, e da un'ulteriore lista di numeri, questi numeri 3776vengono interpretati come potenze di x da aggiungere alla regressione, dove 3777x è l'ultima variabile della lista variabili-indipendeti. Questi termini 3778addizionali vengono calcolati e memorizzati in precisione multipla. 3779Nell'esempio seguente, y è regredita su x e sulla seconda, terza e quarta 3780potenza di x: 3781 3782 mpols y 0 x ; 2 3 4 3783 3784Accesso dal menù: /Modello/Altri modelli lineari/MPOLS - Minimi quadrati in alta precisione 3785 3786# negbin Estimation 3787 3788Argomenti: depvar indepvars [ ; offset ] 3789Opzioni: --model1 (usa il modello NegBin 1) 3790 --robust (matrice di covarianza QML) 3791 --cluster=clustvar (vedi "logit" per una spegazione) 3792 --opg (vedi sotto) 3793 --vcv (stampa la matrice di covarianze) 3794 --verbose (mostra i dettagli delle iterazioni) 3795 --quiet (non mostra i risultati) 3796Esempi: camtriv.inp 3797 3798Stima un modello Binomiale Negativo. Il comando assume che la variabile 3799dipendente rappresenti un conteggio del numero di volte in cui si è 3800verificato un certo evento e deve assumere solo valori interi non negativi. 3801Di default, viene usata la distribuzione NegBin 2, in cui la varianza 3802condizionale è data da mu(1 + αmu), dove mu denota la media condizionale. 3803Tuttavia, se vien data l'opzione --model1 allora la varianza condizionale 3804sarà data da mu(1 + α). 3805 3806L'argomento opzionale offset funziona come per il comando "poisson". In 3807effetti, il modello di Poisson è un caso particolare del binomiale negativo 3808con α = 0. 3809 3810Di default, gli errori standard vengono calcolati unsando un'approssimazione 3811numerica dell'Hessiana sul punto di massimo. Con l'opzione --opg la matrice 3812di covarianze verrà invece calcolata tramite il prodotto esterno dei 3813gradienti (OPG), o via QML con l'opzione --robust usando un "sandwich" 3814dell'hessiana inversa e dell'OPG. 3815 3816Accesso dal menù: /Modelli/Modelli non lineari/Dati di conto 3817 3818# nls Estimation 3819 3820Argomenti: funzione [ derivate ] 3821Opzioni: --quiet (non stampa il modello stimato) 3822 --robust (errori standard robusti) 3823 --vcv (mostra la matrice di covarianza) 3824 --verbose (mostra i dettagli delle iterazioni) 3825 --no-gradient-check (si veda oltre) 3826Esempi: wg_nls.inp, ects_nls.inp 3827 3828Esegue una stima con minimi quadrati non-lineari (NLS: Nonlinear Least 3829Squares) usando una versione modificata dell'algoritmo di 3830Levenberg-Marquardt. Occorre fornire una specificazione di funzione e 3831dichiarare i parametri di interesse della funzione ed i relativi valori 3832iniziali prima che la stima venga eseguita. Opzionalmente, è anche 3833possibile specificare le espressioni per le derivate della funzione rispetto 3834a ognuno dei parametri. Se non si indicano le derivate, occorre fornire una 3835lista dei parametri da stimare (separati da spazi o virgole), preceduta 3836dalla parola chiave params. In quest'ultimo caso, viene calcolata 3837un'approssimazione numerica del Jacobiano. 3838 3839È più semplice mostrare il funzionamento con un esempio. Quello che segue 3840è uno script completo per stimare la funzione di consumo non-lineare 3841presentata in Econometric Analysis di William Greene (capitolo 11 della 3842quarta edizione, o capitolo 9 della quinta). I numeri alla sinistra delle 3843righe sono dei punti di riferimento e non fanno parte dei comandi. Si noti 3844che le opzioni, come ad esempio --vcv per mostrare la matrice di covarianza 3845delle stime dei parametri, vanno aggiunte al comando finale end nls. 3846 3847 1 open greene11_3.gdt 3848 2 ols C 0 Y 3849 3 genr a = $coeff(0) 3850 4 genr b = $coeff(Y) 3851 5 genr g = 1.0 3852 6 nls C = a + b * Y^g 3853 7 deriv a = 1 3854 8 deriv b = Y^g 3855 9 deriv g = b * Y^g * log(Y) 3856 10 end nls --vcv 3857 3858Spesso è comodo inizializzare i parametri con riferimento a un modello 3859lineare collegato, come è mostrato nelle righe da 2 a 5. I parametri alfa, 3860beta e gamma possono essere impostati a qualunque valore iniziale (non 3861necessariamente sulla base di un modello stimato con OLS), ma la convergenza 3862della procedura NLS non è garantita per qualunque punto di partenza. 3863 3864I veri comandi NLS occupano le righe da 6 a 10. Sulla riga 6 viene dato il 3865comando "nls": viene specificata una variabile dipendente, seguita dal segno 3866uguale, seguito da una specificazione di funzione. La sintassi per 3867l'espressione a destra è la stessa usata per il comando "genr". Le tre 3868righe successive specificano le derivate della funzione di regressione 3869rispetto a ognuno dei parametri. Ogni riga inizia con il comando "deriv", 3870che indica il nome di un parametro, il segno di uguale e un'espressione che 3871indica come calcolare la derivata (anche qui la sintassi è la stessa di 3872"genr"). In alternativa, invece di fornire le derivate, è possibile 3873sostituire le righe dalla 7 alla 9 con la seguente: 3874 3875 params a b g 3876 3877La riga 10, "end nls", completa il comando ed esegue la stima. 3878 3879Se si forniscono le derivate in forma analitica, di default gretl 3880effettuerà una verifica numerica sulla correttezza dell'espressione data. 3881Occasionalmente, questa procedura potrebbe produrre "falsi positivi", ad 3882esempio indicando come errate delle derivate che invece sono correte, 3883facendo si che la stima di quest'ultime venga negata. Per evitare che ciò 3884accada, e/o per compilare leggermente più velocemente il codice, è 3885possibile utilizzare l'opzione --no-gradient-check. Ovviamente questo 3886andrebbe fatto solo in caso di assoluta certezza circa la correttezza delle 3887derivate analitiche. 3888 3889Nomi dei parametri 3890 3891Quando si stima un modello non lineare spesso risulta conveniente rinominare 3892i parametri in maniera sintetica. Durante la stampa del risultato, comunque, 3893è desiderabile che le etichette date, per quanto sintetiche, risultino le 3894più informative possibili. Questo risultato può essere ottenuto 3895aggiungendo al comando la parola chiave param_names. Per un modello con k 3896parametri l'argomento che segue a questa parola chiave dovrebbe essere o una 3897stringa letterale, posta tra virgolette, contenente k nomi diversi separati 3898da spazi o virgole, oppure il nome di un vettore contente un lista di nomi k 3899di variabile al suo interno. 3900 3901Per ulteriori dettagli sulla stima NLS si veda la guida all'uso di gretl (il 3902capitolo 25). 3903 3904Accesso dal menù: /Modello/Modelli non lineari/NLS - Minimi quadrati non lineari 3905 3906# normtest Tests 3907 3908Argomento: series 3909Opzioni: --dhansen (test di Doornik-Hansen, utilizzato di default) 3910 --swilk (test di Shapiro-Wilk) 3911 --lillie (test di Lilliefors) 3912 --jbera (test di Jarque-Bera) 3913 --all (esegue tutti i test) 3914 --quiet (non mostra i dettagli dei risultati) 3915 3916Conduce un test di normalità per la serie specificata. Il tipo di test 3917eseguito è determinato dalle opzioni del comando (se non ne viene usata 3918alcuna, viene eseguito il test di Doornik-Hansen). Nota: si raccomanda 3919l'utilizzo dei test di Doornik-Hansen e Shapiro-Wilk rispetto agli altri 3920test per via delle loro migliori proprietà in campioni relativamente 3921piccoli. 3922 3923La statistica test e il suo p-value possono essere recuperati usando gli 3924accessori "$test" e "$pvalue". Se si usa l'opzione --all, i risultati 3925richiamati saranno quelli del test di Doornik-Hansen. 3926 3927# nulldata Dataset 3928 3929Argomento: lunghezza_serie 3930Opzione: --preserve (preserva le matrici) 3931Esempio: nulldata 500 3932 3933Crea un dataset "vuoto", che contiene solo una costante e una variabile 3934indice, con periodicità 1 e il numero indicato di osservazioni. Ad esempio, 3935è possibile creare un dataset a scopo di simulazione usando alcuni comandi 3936come "uniform()" e "normal()") i quali genereranno serie di dati ex nihilo 3937che dovranno poi venir riempiti con dati. Questo comando può risultare 3938particolarmente comodo se utilizzato assieme a "loop". Si veda anche 3939l'opzione "seed" del comando "set". 3940 3941Per impostazione predefinita, questo comando cancella tutti i dati presenti 3942nell'ambiente di lavoro di gretl. Usando l'opzione --preserve, verranno 3943mantenute tutte le matrici attualmente definite. 3944 3945Accesso dal menù: /File/Nuovo dataset 3946 3947# ols Estimation 3948 3949Argomenti: variabile-dipendente variabili-indipendenti 3950Opzioni: --vcv (mostra la matrice di covarianza) 3951 --robust (errori standard robusti) 3952 --cluster=clustvar (errori standard clusterizzati) 3953 --jackknife (vedi sotto) 3954 --simple-print (non mostra le statistiche ausiliarie) 3955 --quiet (non mostra i risultati) 3956 --anova (stampa una tabella ANOVA) 3957 --no-df-corr (sopprime la correzione per i gradi di libertà) 3958 --print-final (si veda sotto) 3959Esempi: ols 1 0 2 4 6 7 3960 ols y 0 x1 x2 x3 --vcv 3961 ols y 0 x1 x2 x3 --quiet 3962 3963Calcola le stime minimi quadrati ordinari (OLS: Ordinary Least Squares) 3964usando la variabile-dipendente e la lista di variabili-indipendenti, che 3965possono essere specificate per nome o numero. Il termine costante può 3966essere indicato usando il numero 0. 3967 3968Oltre alle stime dei coefficienti e agli errori standard, il programma 3969mostra i p-value per le statistiche t (a due code) e F. Un p-value inferiore 3970a 0.01 indica significatività al livello dell'1 per cento ed è denotato 3971con ***. ** indica invece la significatività tra l'1 e il 5 per cento, 3972mentre * indica un livello di significatività tra il 5 e il 10 per cento. 3973Vengono mostrate anche le statistiche di selezione del modello (il criterio 3974di informazione di Akaike, AIC, e il criterio di informazione bayesiana di 3975Schwarz, BIC). La formula usata per AIC è descritta in Akaike (1974), ossia 3976meno due volte la log-verosimiglianza massimizzata più il doppio del numero 3977di parametri stimati. 3978 3979Usando l'opzione --no-df-corr la correzione per i gradi di libertà non 3980viene applicata nel calcolo della varianza stimata dell'errore (e quindi 3981anche dell'errore standard delle stime dei parametri). 3982 3983L'opzione --print-final è utilizzabile solo nel contesto di un "loop". 3984L'effetto è quello di eseguire la regressione in modo silenzioso per tutte 3985le iterazioni del loop tranne l'ultima. Si veda la guida all'uso di gretl 3986(il capitolo 13) per i dettagli. 3987 3988Varie variabili interne possono essere recuperate per futuri scopi di stima. 3989Ad esempio: 3990 3991 series uh = $uhat 3992 3993dove così facendo si salvano i residui stimati dal modello sotto il nome 3994uh. Per ulteriori riferimenti si guardi anche alla sezione "accessori" di 3995gretl function. 3996 3997La formula utilizzata nella versione --HC per generare errori standard 3998robusti con l'opzione --robust può essere calibrata attraverso il comando 3999"set". L'opzione --jackknife ha l'effetto di selezionare la versione 3a 4000della matrice HC. L'opzione --cluster annulla la procedura di selezione 4001della versione della matrice HC in quanto produce errori standard robusti in 4002seguito all'operazione di raggruppamento delle singole osservazioni di 4003clustvar. Si veda anche la guida all'uso di gretl (il capitolo 22) per 4004maggiori dettagli. 4005 4006Accesso dal menù: /Modello/OLS - Minimi quadrati ordinari 4007Accesso alternativo: Pulsante Beta-hat sulla barra degli strumenti 4008 4009# omit Tests 4010 4011Argomento: lista-variabili 4012Opzioni: --test-only (non rimpiazza il modello corrente) 4013 --chi-square (restituisce un test chi-quadro di Wald) 4014 --quiet (stampa solo i risultati del test) 4015 --silent (non stampa nulla) 4016 --vcv (stampa la matrice di varianze-covarianze del modello 4017 ridotto) 4018 --auto=alpha (eliminazione sequenziale, si veda oltre) 4019 --inst (omette come strumento, solo per TSLS) 4020 --both (omette come regressore e come strumento, solo per TSLS) 4021Esempi: omit 5 7 9 4022 omit seasonals --quiet 4023 omit --auto 4024 omit --auto=0.05 4025 Vedi anche restrict.inp, sw_ch12.inp, sw_ch14.inp 4026 4027Questo comando deve seguire un comando di stima. Nella sua forma principale, 4028questo comando calcola un test di Wald per la significatività congiunta 4029delle variabili presenti nella lista variabili, che deve essere un 4030sottoinsieme delle variabili indipendenti presenti nell'ultimo modello 4031stimato. I risultati possono poi venire richiamati attraverso l'uso degli 4032accessori "$test" e "$pvalue". 4033 4034A meno che non vengano rimossi tutti i regressori, il modello ristretto che 4035viene stimato va a rimpiazzare il modello originale come "modello corrente" 4036con lo scopo, ad esempio, di richiamare i residui come $uhat o di eseguire 4037dei test. Questo comportamento può essere soppresso attraverso l'uso 4038dell'opzione --test-only. 4039 4040Per default, viene usata la forma F del test di Wald; se invece si vuole un 4041test chi-quadro, si usi l'opzione --chi-square. 4042 4043Se il modello ristretto viene sia stimato che stampato l'utilizzo 4044dell'opzione --vcv ha l'effetto di stampare anche la matrice di covarianze, 4045altrimenti se non usata l'opzione viene ignorata. 4046 4047Alternativamente, se l'opzione --auto è abilitata, l'eliminazione 4048sequenziale viene eseguita in questo modo: ad ogni step le variabili con 4049p-value più alto vengono omesse sicchè tutte quelle con p-value maggiore 4050di un certo cutoff vengono eliminate. Il cutoff di default è impostato al 405110 per cento (considerando sia la coda destra che sinistra); esso, tuttavia, 4052può venire modificato utilizzando l'argomento "=" ed un valore compreso tra 40530 e 1 (senza spazio in mezzo), come nel quarto esempio descritto sopra. Se 4054viene data una lista-variabili questo processo sarà limitato alle sole 4055variabili presenti nella lista, altrimenti tutte le variabili saranno 4056coinvolte e considerate come possibili candidate all'omissione. Si noti che 4057le opzioni --auto e --test-only sono incompatibili. 4058 4059Accesso dal menù: Finestra del modello, /Test/OMIT - Ometti variabili 4060 4061# open Dataset 4062 4063Argomento: file-dati 4064Opzioni: --quiet (non stampare la lista di serie) 4065 --preserve (mantieni in memoria le variabili non-serie) 4066 --select=selezione (leggi solo le serie specificate, vedi sotto) 4067 --frompkg=pkgname (vedi sotto) 4068 --all-cols (vedi sotto) 4069 --www (usa un database sul server di gretl) 4070 Si veda oltre per le opzioni specifiche per i fogli elettronici 4071Esempi: open data4-1 4072 open voter.dta 4073 open fedbog --www 4074 4075Apre un file di dati o un database (vedi la guida all'uso di gretl (il 4076capitolo 4) per una spiegazione sulla differenza fra le due possibilità). 4077L'effetto del comando è abbastanza diverso nei due casi: quando si apre un 4078file di dati, il suo contenuto viene letto in memoria, sostituendo i dati 4079eventualmente già presenti. Per aggiungere dati al dataset aperto, vedi 4080"append" o, per maggiore flessibilità, "join". Se invece viene aperto un 4081database, nessun dato viene letto immediatamente. Il comando si limita a 4082impostare la fonte per i susseguenti comandi "data", usati per effettuare 4083l'importazione vera e propria. Si veda "Apertura di un database" più sotto. 4084 4085Se non si specifica un percorso completo, il programma cercherà 4086automaticamente il file in alcuni percorsi predefiniti, a partire dal valore 4087attuale di "workdir". Se non si specifica un'estensione per il file, come 4088nel primo degli esempi, gretl assume che si tratti di un file di dati 4089standard, con estensione .gdt. A seconda del nome del file e di alcune sue 4090caratteristiche, gretl cerca di indovinare il formato dei dati (standard, 4091testo semplice, CSV, MS Excel, Stata, SPSS, ecc.). 4092 4093Usando l'opzione --frompkg, gretl cercherà il file di dati specificato 4094nella sottodirectory associata al pacchetto pkgname. 4095 4096Se l'argomento nome-file è un URI che inizia con http:// o https://, allora 4097gretl cercherà di scaricare il file dalla rete prima di aprirlo. 4098 4099Come impostazione predefinita, l'apertura di un nuovo file di dati annulla 4100la sessione corrente, il che implica la perdita di tutte le variabili di 4101tipo matrice, scalare e stringa. Se si vuole preservare tali variabili (con 4102l'eccezione delle serie, che sono necessariamente eliminate), va usata 4103l'opzione --preserve. 4104 4105Fogli elettronici 4106 4107Quando si apre un file di un foglio elettronico (Gnumeric, Open Document o 4108XLS), è possibile fornire fino a tre parametri aggiuntivi, oltre al nome 4109del file. Per prima cosa, è possibile selezionare un particolare foglio di 4110lavoro all'interno del file, indicando il suo numero con la sintassi 4111--sheet=2, oppure indicando il suo nome tra virgolette doppie, usando la 4112sintassi --sheet="MacroData". L'impostazione predefinita consiste nel 4113leggere il primo foglio di lavoro del file. È anche possibile specificare 4114la riga/colonna da cui iniziare a leggere, usando la sintassi 4115 4116 --coloffset=3 --rowoffset=2 4117 4118che indica a gretl di ignorare le prime 3 colonne e le prime 2 righe. 4119L'impostazione predefinita consiste nel leggere tutte le celle del foglio, a 4120partire dalla prima in alto a sinistra. 4121 4122File di testo con delimitatori 4123 4124Con file di testo, gretl in genere si aspetta di trovare le colonne di dati 4125separate da un qualche carattere standard; in genere, la virgola, il tab, lo 4126spazio o il punto e virgola (copyright Totò e Peppino). Come impostazione 4127base, gretl cerca di trovare nella prima colonna etichette identificative o 4128date, se l'intestazione è vuota o contiene qualcosa che verosimilmente va 4129interpretato in tal modo, come "year", "date" o "obs". Questa euristica 4130sulla prima colonna può essere disattivata attraverso l'opzione --all-cols 4131option. 4132 4133File di testo in formato fisso 4134 4135Tuttavia, c'è anche modo di leggere dati in "formato fisso", dove non ci 4136sono delimitatori ma esiste una specifica del formato; ad esempio, "la 4137variabile k occupa 8 caratteri a partire dal 24esimo". Per leggere file 4138siffatti, va aggiunta la stringa --fixed-cols=colspec, dove colspec si 4139compone di interi separati da virgole. Essi vengono interpretati a coppie, 4140in cui il primo elemento denota la colonna di partenza, misurata in byte 4141dall'inizio della riga (dove 1 indica il primo byte); il secondo elemento 4142indica quanti byte vanno letti per quel dato campo. Facciamo un esempio: il 4143comando 4144 4145 open fixed.txt --fixed-cols=1,6,20,3 4146 4147farà sì che vengano letti 6 byte a partire dalla colonna 1 per la prima 4148variabile; per la seconda, 3 byte a partire dalla colonna 20. Linee vuote, o 4149che iniziano con #, vengono ignorate; per tutte le altre si applica la 4150regola del formato, e se viene trovato qualcosa non interpretabile come 4151numero, viene segnalato un errore. Se i dati sono letti senza problemi, le 4152variabili avranno per nome v1, v2, ecc. Sta all'utente dare alle variabili 4153nomi e descrizioni informative tramite i comandi "rename" e/o "setinfo". 4154 4155Di default, quando si importa un file contenente delle stringhe di valori 4156una casella di testo si aprirà mostrando i contenuti del file 4157string_table.txt, il quale contiene una legenda sull'associazione fra le 4158stringhe ed i valori numerici corrispondenti. Per far sì che ciò non 4159accada, si usi l'opzione --quiet. 4160 4161Apertura di una selezione 4162 4163In generale, l'uso di open con un file di dati (al contrario di ciò che 4164accade con un database) implica la lettura di tutte le serie che esso 4165contiene. Tuttavia, per dati in formato gretl nativo (gdt e gdtb) è 4166possibile indicare un sottinsieme delle serie da leggere. L'opzione da usare 4167a questo scopo è --select, che richiede un argomento. Quest'ultimo può 4168prendere tre forme: il nome di una serie singola, una lista di nomi, 4169comppresa fra virgolette doppie e separati da spazi, o un array di stringhe 4170preesistente. Ad esempio: 4171 4172 # serie singola 4173 open somefile.gdt --select=x1 4174 # più serie 4175 open somefile.gdt --select="x1 x5 x27" 4176 # metodo alternativo 4177 strings Sel = defarray("x1", "x5", "x27") 4178 open somefile.gdt --select=Sel 4179 4180Apertura di un database 4181 4182Come si diceva sopra, questo comando può essere usato anche per aprire un 4183database (gretl, RATS 4.0 o PcGive) per la lettura. In questo caso, 4184dev'essere seguito dal comando "data" per estrarre una particolare serie dal 4185database. 4186 4187Sono ammessi anche altri casi: in primo luogo, se si usa l'opzione www, il 4188programma cercherà di accedere al database specificato sul server di gretl 4189-- ad esempio il database "Federal Reserve interest rates" nel terzo degli 4190esempi visti sopra. Un altra possibilità è quella di usare il comando 4191nella forma "open dbnomics", che userà DB.NOMICS come fonte dei dati; su 4192questo argomento, vedi dbnomics per gretl. Infine, se viene date l'opzione 4193--odbc gretl prenderà i dati da un database ODBC. Per spiegazioni 4194dettagliate, si veda la guida all'uso di gretl (il capitolo 42). 4195 4196Accesso dal menù: /File/Apri dati 4197Accesso alternativo: Trascinare un file di dati in gretl (MS Windows o Gnome) 4198 4199# orthdev Transformations 4200 4201Argomento: lista-variabili 4202 4203Utilizzabile solo con dati panel. Per ognuna delle variabili nella 4204lista-variabili viene generata una serie di deviazioni ortogonali in avanti, 4205salvata col nome della variabile prefissata da o_. Quindi, "orthdev x y" 4206crea le nuove variabili o_x e o_y. 4207 4208I valori sono salvati con un periodo di ritardo rispetto alla loro 4209collocazione temporale (ossia, o_x all'osservazione t contiene la deviazione 4210che, in senso stretto, corrisponde al periodo t - 1). Questo comportamento 4211è coerente con quello delle differenze prime: viene persa la prima 4212osservazione di ogni serie, non l'ultima. 4213 4214# outfile Printing 4215 4216Varianti: outfile nomefile 4217 outfile --buffer=varstr 4218 outfile --tempfile=varstr 4219Opzioni: --append (aggiunge al file) 4220 --quiet (vedi sotto) 4221 --buffer (vedi sotto) 4222 --tempfile (vedi sotto) 4223Esempi: outfile regress.txt 4224 end outfile 4225 4226Il comando outfile inizia un blocco in cui tutto l'output stampato viene 4227deviato a un file o a un buffer (o, volendo, semplicemnte buttato via). Tale 4228blocco è chiuso dal comando "end outfile", dopodiché l'output viene 4229mandato di nuovo allo stream predefinito. 4230 4231Reindirizzamento a un file 4232 4233La prima variante manda l'output a un file il cui nome è dato come 4234argomento nomefile. Di default, viene creato un file nuovo (sovrascrivendo 4235il file dello stesso nome, se esiste). L'output verrà scritto nella 4236corrente "workdir", a meno che il nomefile non contenga un percorso 4237completo. Se invece di sovrascrivere si vuole aggiungere in coda, va usata 4238l'opzione --append. 4239 4240Tre varianti speciali del comando sono disponibili. Se si utilizza la parola 4241chiave null al posto del vero nome del file l'effetto prodotto sarà quello 4242di sopprimere tutti gli output fino alla istruzione successiva. Se una delle 4243due parole chiave, tra stdout o stderr, è data al posto dello standard nome 4244di file l'effetto che si produrrà sarà quello di reindirizzare l'output 4245sull'output standard o sullo standard errors. 4246 4247Quello che segue è un semplice esempio, in cui l'ouput di una regressione 4248viene scritto su un file. 4249 4250 open data4-10 4251 outfile regress.txt 4252 ols ENROLL 0 CATHOL INCOME COLLEGE 4253 end outfile 4254 4255Reindirizzamento a un buffer 4256 4257L'opzione --buffer serve a mandare l'ouput a una variabile stringa. Il 4258parametro per questa opzione dev'essere il nome di una variabile stringa 4259preesistente, il cuni contenuto sarà sovrascritto. Quello che segue è lo 4260stesso esempio fatto appena sopra, a parte che l'output va ad una stringa. 4261In questo caso stampando model_out si vedrà l'output reindirizzato. 4262 4263 open data4-10 4264 string model_out = "" 4265 outfile --buffer=model_out 4266 ols ENROLL 0 CATHOL INCOME COLLEGE 4267 end outfile 4268 print model_out 4269 4270Reindirizzamento a un file temporaneo 4271 4272L'opzione --tempfile serve a mandare l'output a un file temporaneo, con un 4273nome costruito automaticamente per assicurarne l'unicità, nella directory 4274"di servizio". Così come nel caso del buffer, il parametro dell'opzione 4275dev'essere il nome di una variabile stringa, che viene riempita col nome del 4276file temporaneo. Nota bene: i file scritti sulla directory di servizio 4277vengono cancellati quando si esce dal programma: non usate questa forma se 4278volete che il file sia conservato. 4279 4280Ripetiamo l'esempio fatto sopra, con un paio di linee in più per illustrare 4281il punto che varstr dice dove l'output è andato, e volendo lo si può 4282leggere usando la funzione "readfile". 4283 4284 open data4-10 4285 string mytemp 4286 outfile --tempfile=mytemp 4287 ols ENROLL 0 CATHOL INCOME COLLEGE 4288 end outfile 4289 printf "Output went to %s\n", mytemp 4290 printf "The output was:\n%s\n", readfile(mytemp) 4291 4292L'opzione quiet 4293 4294L'effetto dell'opzione --quiet è quello di disattivare la stampa dei 4295comandi e dei messaggi ausiliari nel frattempo che l'output viene 4296reindirizzato. È l'equivalente di fare: 4297 4298 set echo off 4299 set messages off 4300 4301se non per il fatto che al termine della ridirezione i valori originali di 4302echo e messages vengono ripristinati. Quest'opzione è disponibile in tutti 4303i casi. 4304 4305Livelli di ridirezione 4306 4307In un dato punto del codice, ci può essere solo un file aperto con questa 4308tecnica; quindi, le chiamate a questo comando non possono essere annidate. 4309Ciononostante, questo comando è consentito nelle funzioni scritte 4310dall'utente (purché il file di output venga chiuso nella stessa funzione), 4311cosicché l'output può essere ridiretto temporaneamente e poi riassegnato 4312al file di output originale. Ad esempio, il codice 4313 4314 function void f (string s) 4315 outfile inner.txt 4316 print s 4317 end outfile 4318 end function 4319 4320 outfile outer.txt --quiet 4321 print "Fuori" 4322 f("Dentro") 4323 print "Ancora fuori" 4324 end outfile 4325 4326produrrà un file di nome "outer.txt" contenente le due linee 4327 4328 Fuori 4329 Ancora fuori 4330 4331e un file di nome "inner.txt" contenente la linea 4332 4333 Dentro 4334 4335# panel Estimation 4336 4337Argomenti: variabile dipendente variabili indipendenti 4338Opzioni: --vcv (mostra la matrice di covarianza) 4339 --fixed-effects (stima con effetti di gruppo fissi) 4340 --random-effects (effetti casuali o modello GLS) 4341 --nerlove (usa la transformazione di Nerlove) 4342 --pooled (stima un modello OLS pooled) 4343 --between (stima il modello tra i gruppi) 4344 --robust (errori standard robusti, si veda oltre) 4345 --time-dummies (include variabili dummy temporali) 4346 --unit-weights (minimi quadrati ponderati) 4347 --iterate (stima iterativa) 4348 --matrix-diff (esegue un test di Hausman con differenza fra 4349 matrici) 4350 --unbalanced=metodo (solamente per random effects, si veda oltre) 4351 --quiet (mostra meno risultati) 4352 --verbose (mostra più risultati) 4353Esempi: penngrow.inp 4354 4355Stima un modello panel, per impostazione predefinita usando lo stimatore a 4356effetti fissi; la stima è implementata sottraendo le medie di gruppo o 4357delle unità dai dati originali. 4358 4359Se l'opzione --random-effects è data allora verrano eseguite le stime del 4360modello ad effetti random, utilizzando di default il metodo descritto da 4361Swamy e Arora (1972). In questo caso solamente l'opzione --matrix-diff 4362consente l'utilizzo forzato del metodo della differenza fra matrici 4363(anziché il metodo della regressione), in modo tale da consentire 4364l'utilizzo del test di Hausman per la consistenza dei stimatori ad effetti 4365random. Altra specifica allo stimatore ad effetti random è data 4366dall'utilizzo del comando --nerlove, il quale utilizza il metodo di Nerlove 4367(1971) invece del metodo di Swamy e Arora. 4368 4369In alternativa, con l'opzione --unit-weights, il modello viene stimato con i 4370minimi quadrati ponderati, con i pesi costruiti a partire dalla varianza 4371residua per le rispettive unità cross section nel campione. Solo in questo 4372caso, è possibile usare l'opzione --iterate per produrre stime iterative: 4373nel caso di convergenza, le stime sono di massima verosimiglianza. 4374 4375Come ulteriore alternativa, se si usa l'opzione --between, viene stimato il 4376modello tra i gruppi, ossia una regressione OLS usando le medie dei gruppi. 4377 4378Il metodo predefinito per calcolare errori standard robusti in modelli con 4379dati panel è descritto dallo stimatore HAC di Arellano, ma può essere 4380utilizzato anche lo stimatore di Beck-Katz per "panel standard errors 4381corretti" attraverso il comando set pcse on. Quando è specificata l'opzione 4382--robust il test F viene eseguito sullo stimatore ad effetti fissi 4383utilizzando il metodo robusto di Welch (1951). 4384 4385L'opzione --unbalanced è disponibile solo per modelli random effects: può 4386essere utilizzato per scegliere un metodo ANOVA da usare con panel non 4387bilanciati. Per default, gretl utilizza il metodo di Swamy-Arora come per i 4388panel bilanciati, eccezion fatta per l'utilizzo di una media armonica delle 4389singole lunghezze temporali al posto di una T comune. Con quest'opzione è 4390possibile specificare sia bc, per usare il metodo di Baltagi e Chang (1994), 4391o stata, per emulare l'opzione sa per il comando xtreg in Stata. 4392 4393Per maggiori dettagli sulla stima panel, si veda la guida all'uso di gretl 4394(il capitolo 23). 4395 4396Accesso dal menù: /Modello/Panel 4397 4398# panplot Graphs 4399 4400Argomento: variabile 4401Opzioni: --means (medie per gruppo attraverso il tempo) 4402 --overlay (unità mescolate, N <= 130) 4403 --sequence (unità in sequenza, N <= 130) 4404 --grid (unità su griglia, N <= 16) 4405 --stack (unità sovrapposte verticalmente, N <= 6) 4406 --boxplots (boxplot per unità, in sequenza, N <= 150) 4407 --boxplot (boxplot per tutte le unità) 4408 --output=nomefile (ridireziona l'output) 4409Esempi: panplot x --overlay 4410 panplot x --means --output=display 4411 4412Comando grafico specifico per dati panel: la serie variabile viene graficata 4413a seconda delle opzioni specificate. 4414 4415A parte le opzioni --means e --boxplot quel che viene graficato è la 4416variazione della serie sia sotto il profilo longitudinale che quello 4417temporale. Questo tipo di grafici è limitato dal numero di unità nel 4418dataset in uso. Ad esempio, l'opzione --overlay, che mostra una serie 4419storica per ciascuna unità, è disponibile soltanto se il numero di unità 4420N è minore o uguale a 130. (In caso contrario, il grafico diventa troppo 4421denso per essere informativo.) Se un dataset è troppo grande da permettere 4422l'applicazione del comando, va selezionato preventivamente un sottocampione 4423di unità, come ad esempio 4424 4425 smpl 1 100 --unit 4426 panplot x --overlay 4427 smpl full 4428 4429L'opzione --output=filename è usata per controllare forma e destinazione 4430dell'output; per dettagli, vedi il comando "gnuplot". 4431 4432Accesso alternativo: Main window pop-up menu (single selection) 4433 4434# panspec Tests 4435 4436Opzioni: --nerlove (usa il metodo di Nervole per effetti casuali) 4437 --matrix_diff (usa il metodo di differenze tra matrici per il test di Hausman) 4438 4439Questo test è disponibile solo dopo aver stimato un modello OLS su dati 4440panel (si veda anche "setobs"). Testa il semplice modello "pooled" (con 4441tutte le osservazioni mescolate indistintamente) contro le principali 4442alternative: il modello a effetti fissi e quello a effetti casuali. 4443 4444Il modello a effetti fissi permette all'intercetta della regressione di 4445variare per ogni unità cross section. Viene eseguito un test F per 4446l'ipotesi nulla che le intercette non differiscano tra loro. Il modello a 4447effetti casuali scompone la varianza dei residui in due parti: una specifica 4448alle unità cross section e una specifica all'osservazione particolare (la 4449stima può essere eseguita solo se il numero delle unità cross section nel 4450dataset è maggiore del numero dei parametri da stimare). La statistica LM 4451di Breusch-Pagan testa l'ipotesi nulla che il modello pooled OLS sia 4452adeguato contro l'alternativo modello a effetti casuali. 4453 4454Può accadere che il modello pooled OLS sia rifiutato nei confronti di 4455entrambe le alternative, a effetti fissi o casuali. A patto che gli errori 4456specifici di unità o di gruppo siano non correlati con le variabili 4457indipendenti, lo stimatore a effetti casuali è più efficiente dello 4458stimatore a effetti fissi; nel caso contrario lo stimatore a effetti casuali 4459non è consistente e deve essergli preferito lo stimatore a effetti fissi. 4460L'ipotesi nulla per il test di Hausman è che l'errore specifico di gruppo 4461non sia correlato con le variabili indipendenti (e quindi che il modello a 4462effetti casuali sia preferibile). Un basso p-value per questo test 4463suggerisce di rifiutare il modello a effetti casuali in favore del modello a 4464effetti fissi. 4465 4466Le due opzioni per questo comando riguardano il modello ad effetti casuali. 4467Di default viene utilizzato il metodo di Swamy e Arora ed il test di Hausman 4468viene calcolato usando il metodo di regressione. Le opzioni di cui sopra 4469consentono di abilitare, in alternativa, il metodo di Nerlove per effetti 4470casuali e/o l'approccio di differenza tra matrici per il calcolo del test di 4471Hausman. 4472 4473Accesso dal menù: Finestra del modello, /Test/HAUSMAN - Diagnosi panel 4474 4475# pca Statistics 4476 4477Argomento: lista-variabili 4478Opzioni: --covariance (usa la matrice di covarianza) 4479 --save[=n] (salva le componenti principali) 4480 --save-all (salva tutte le componenti) 4481 --quiet (non stampa i risultati) 4482 4483Analisi delle Componenti Principali. A meno che l'opzione --quiet non sia 4484presente, stampa gli autovalori associati alla matrice di correlazione (o 4485matrice di covarianze se è specificata l'opzione --covariance) per le 4486variabili inserite nella lista-variabili, con allegate proporzioni della 4487varianza totale spiegata dalle singole compenenti. Stampa anche i 4488corrispondenti autovettori, o "pesi delle componenti". 4489 4490Se si dà l'opzione --save-all allora tutte le componenti verranno salvate 4491nel dataset come variabili denominate PC1, PC2 e così via. Queste variabili 4492artificiali sono definite come la la combinazione lineare delle X_i 4493standardizzate (dove X_i è l'i-esima variabile della lista-variabili) con i 4494pesi. 4495 4496Se si dà l'opzione --save senza un parametro specificato le componenti con 4497autovalori maggiori della media (il che significa maggiori di 1.0 se 4498l'analisi è basata sulla matrice di correlazione) sono salvati nel dataset 4499come nuove variabili, come descritto sopra. Se invece si dà un valore per 4500n, con quest'opzione allora le n più importanti componenti vengono salvate. 4501 4502Si veda anche la function "princomp". 4503 4504Accesso dal menù: /Visualizza/Componenti principali 4505Accesso alternativo: Pop-up nella finestra principale (selezione multipla) 4506 4507# pergm Statistics 4508 4509Argomenti: nome-variabile [ banda ] 4510Opzioni: --bartlett (usa la finestra di Bartlett) 4511 --log (usa una scala logaritmica) 4512 --radians (mostra la frequenza in radianti) 4513 --degrees (mostra la frequenza in gradi) 4514 --plot=modalità o nome del file (si veda oltre) 4515 4516Calcola e mostra (graficamente se non si è in modalità batch) lo spettro 4517della variabile specificata. Per impostazione predefinita viene mostrato il 4518periodogramma nel campione, mentre usando l'opzione --bartlett, lo spettro 4519viene stimato usando una finestra di Bartlett per i ritardi (si veda ad 4520esempio Econometric Analysis di Greene per una discussione su questo 4521argomento). L'ampiezza predefinita della finestra di Bartlett è pari a due 4522volte la radice quadrata dell'ampiezza campionaria, ma questo valore può 4523essere impostato manualmente usando il parametro banda, fino a un massimo 4524pari a metà dell'ampiezza campionaria. 4525 4526Usando l'opzione --log, lo spettro viene rappresentato su una scala 4527logaritmica. 4528 4529Le due opzioni (mutualmente escludibili) --radians e --degrees condizionano 4530la tipologia dell'asse di frequenza quando il periodogramma viene 4531rappresentato. Da impostazione predefinita, la frequenza è scalata per il 4532numero di osservazioni nel campione; tuttavia, queste opzioni comportano che 4533l'asse di frequenza possa venire ridenominato da 0 a pi radianti o da 0 a 4534180degrees, rispettivamente. 4535 4536Di default, se il programma non è in modalità batch, viene mostrato il 4537periodogramma a video. Questo comportamento è modificabile attraverso 4538l'opzione --plot. I parametri accettabili nel caso sono none (sopprime il 4539grafico); display (per mostrare a video il grafico anche se il programma è 4540in batch mode); oppure un nome di file. L'effetto di dare un nome di file è 4541quello descritto per l'opzione --output del comando "gnuplot". 4542 4543Quando viene mostrato il periodogramma del campione, vengono mostrati anche 4544due test per l'integrazione frazionale ("memoria lunga") della serie, ossia 4545il test di Geweke e Porter-Hudak (GPH), e lo stimatore locale di Whittle. 4546L'ipotesi nulla in entrambi i casi è che l'ordine di integrazione sia zero. 4547Per impostazione predefinita, l'ordine per questi test è il valore minore 4548tra T/2 e T^0.6; anche questo valore può essere modificato con il parametro 4549di banda. 4550 4551Accesso dal menù: /Variabile/Spettro 4552Accesso alternativo: Menù pop-up nella finestra principale (selezione singola) 4553 4554# pkg Utilities 4555 4556Argomenti: azione nomepacchetto 4557Opzioni: --local (installa da file in locale) 4558 --quiet (vedi sotto) 4559 --verbose (vedi sotto) 4560Esempi: pkg install armax 4561 pkg install /path/to/myfile.gfn --local 4562 pkg query ghosts 4563 pkg unload armax 4564 4565Comando per installare, rimuovere dalla memoria e disinstallare pacchetti di 4566funzioni (file gfn o zip). Il parametro azione deve essere uno fra install, 4567query, unload, remove o index. 4568 4569install: Nella sua forma più semplice, senza opzioni e con l'argomento 4570pkgname che corrisponde al nome "semplice" di un pacchetto (come nel primo 4571esempio), il pacchetto stesso verrà scaricato dal server di gretl (a meno 4572che nomepacchetto non cominci con http://) e installato in locale. In questo 4573caso, indicare l'estensione è superfluo. Se viene data l'opzione --local, 4574l'argomento nomepacchetto deve essere il percorso completo di un file di 4575pacchetto sulla macchina locale, completo di estensione (.gfn o .zip). 4576L'azione conseguente al comando è di copiarlo (se gfn), o espanderlo (se 4577zip) nel posto giusto, ossia dove il comando "include" sia in grado poi di 4578trovarlo. 4579 4580query: L'effetto di default effect è di stampare alcune informazioni di 4581base sul pacchetto (autore, versione, ecc.). Selezionando l'opzione --quiet 4582però non viene stampato nulla; le informazioni, invece, vengono salvate in 4583un bundle, accessibile via "$result". 4584 4585unload: l'argomento pkgname deve essere dato in forma semplice, senza 4586percorso o suffisso (come nell'ultimo esempio). L'effetto è scaricare il 4587pacchetto dalla memoria e rimuoverlo, anche dal menu GUI a cui sia 4588eventualmente attaccato. 4589 4590remove: come unload, ma in aggiunta cancella anche dal disco i file di 4591pacchetto. 4592 4593index: è un caso particolare, in cui il nome del pacchetto deve essere 4594sostituito dalla stringa "addons": l'effetto è quello di aggiornare 4595l'indice dei pacchetti standard, anche noti come "addons". Quest'operazione 4596viene svolta in automatico di tanto in tanto, ma in certi casi la si 4597potrebbe voler fare a mano. in tal caso, l'opzione --verbose produce un 4598report di ciò che viene cercato e trovato. Ad esempio: 4599 4600 pkg index addons --verbose 4601 4602Accesso dal menù: /Strumenti/Pacchetti/Sul server 4603 4604# plot Graphs 4605 4606Argomento: data 4607Opzioni: --with-lines[=varspec] (usa linee, non punto) 4608 --with-lp[=varspec] (usa linee e punti) 4609 --with-impulses[=varspec] (usa linee verticali) 4610 --with-steps[=varspec] (usa linee verticali ed orizzontali) 4611 --time-series (mostra il grafico rispetto al tempo) 4612 --single-yaxis (forza all'uso di un solo asse delle ordinate) 4613 --dummy (si veda oltre) 4614 --fit=fitspec (si veda oltre) 4615 --band=bandspec (si veda oltre) 4616 --band-style=stile (si veda oltre) 4617 --output=nomefile (reindirizza l'output ad un file specifico) 4618Esempi: nile.inp 4619 4620Il blocco plot offre un'alternativa al comando "gnuplot", che potrebbe 4621essere più efficace per produrre grafici particolarmente elaborati (con 4622diverse opzioni e/o comandi gnuplot inseriti). Oltre alla spiegazione 4623seguente, si possono trovare altri esempi consultando la guida all'uso di 4624gretl (il capitolo 6). 4625 4626Un blocco plot comincia col comando plot seguito dall'argomento data, che 4627indica i dati da usare: quest'ultimo dev'essere il nome di una lista, una 4628matrice, o una serie singola. Se l'argomento data non viene specificato 4629allora il blocco deve obbligatoriamente contere almeno una funzione 4630analitica da graficare; queste funzioni posso essere scritte tramite righe 4631literal o printf (si veda oltre). 4632 4633Se viene fornita una lista o una matrice, l'ultimo elemento (se lista) o 4634l'ultima colonna (se matrice) è preso come asse delle ascisse e le altre 4635come ordinata, a meno che non venga usata l'opzione --time-series, nel qual 4636caso tutte le variabili vanno in ordinata. 4637 4638L'opzione di fornire il nome di una singola serie è ristretta solo ai dati 4639temporali, nel qual caso si assume che si voglia ricevere un grafico 4640time-series; altrimenti verrà riportato un errore. 4641 4642La linea iniziale può essere dotata del prefisso "nome <-" per salvare il 4643grafico come icona nel programma GUI. Il blocco si chiude con end plot. 4644 4645All'interno del blocco si possono avere zero o più linee di questo tipo, 4646identificate da una delle seguenti parole chiave: 4647 4648 option: specifica una singola opzione. 4649 4650 options: specifica più di una opzione per una singola riga, sono separate 4651 da spazi. 4652 4653 literal: un comando da passare a gnuplot senza modifiche. 4654 4655 printf: una comando printf il cui risultato verrà passato a gnuplot senza 4656 modifiche. 4657 4658Si noti che, quando si specifica un'opzione attraverso i comandi option o 4659options, il solito -- va omesso. Per ulteriori dettagli sugli effetti delle 4660varie opzioni si veda "gnuplot" (ma vedi anche sotto su alcune specificità 4661dell'opzione --band nel contesto plot). 4662 4663L'uso del blocco plot è illustrato al meglio tramite un esempio: 4664 4665 string title = "My title" 4666 string xname = "My x-variable" 4667 plot plotmat 4668 options with-lines fit=none 4669 literal set linetype 3 lc rgb "#0000ff" 4670 literal set nokey 4671 printf "set title \"%s\"", title 4672 printf "set xlabel \"%s\"", xname 4673 end plot --output=display 4674 4675Questo esempio ipotizza che plotmat sia un nome di una matrice avente almeno 46762 colonne (o di una lista avente almeno 2 membri). Si noti che è 4677considerata buona pratica quella di utilizzare l'opzione --output 4678(solamente) nell'ultima linea del blocco. 4679 4680Disegnare una banda usando una matrice 4681 4682Le opzioni --band e --band-style funzionano principalmente come descritto 4683nell'help del comando gnuplot, con le seguenti eccezioni: quando i dati sono 4684passati in forma di matrice, il primo parametro per --band deve essere dato 4685come il nome di una matrice con 2 colonne (contenenti, rispettivamente, il 4686centro e l'ampiezza della banda). Questo parametro prende il posto dei due 4687valori richiesti dalla versione gnuplot di questa opzione (nome della serie 4688o ID numerico o colonne della matrice). Per esempio: 4689 4690 scalar n = 100 4691 matrix x = seq(1,n)' 4692 matrix y = x + filter(mnormal(n,1), 1, {1.8, -0.9}) 4693 matrix B = y ~ muniform(n,1) 4694 plot y 4695 options time-series with-lines 4696 options band=B,10 band-style=fill 4697 end plot --output=display 4698 4699Disegnare senza dati 4700 4701Il seguente esempio mostra un semplice caso di come si specifica un grafico 4702senza l'utilizzo di una sorgente dati. 4703 4704 plot 4705 literal set title 'CRRA utility' 4706 literal set xlabel 'c' 4707 literal set ylabel 'u(c)' 4708 literal set xrange[1:3] 4709 literal set key top left 4710 literal crra(x,s) = (x**(1-s) - 1)/(1-s) 4711 printf "plot crra(x, 0) t 'sigma=0', \\" 4712 printf " log(x) t 'sigma=1', \\" 4713 printf " crra(x,3) t 'sigma=3" 4714 end plot --output=display 4715 4716# poisson Estimation 4717 4718Argomenti: variabile-dipendente variabili-indipendenti [ ; offset ] 4719Opzioni: --robust (errori standard robusti) 4720 --cluster=clustvar (vedi "logit" per una spiegazione) 4721 --vcv (stampa la matrice di covarianze) 4722 --verbose (stampa i dettagli delle iterazioni) 4723 --quiet (non stampa i risultati) 4724Esempi: poisson y 0 x1 x2 4725 poisson y 0 x1 x2 ; S 4726 Vedi anche camtriv.inp 4727 4728Stima una regressione di Poisson, in cui la variabile dipendente rappresenta 4729le occorrenze di un qualche tipo di evento e può assumere solo valori 4730interi non negativi. 4731 4732Se una variabile casuale discreta Y segue la distribuzione di Poisson, 4733 4734 Pr(Y = y) = exp(-v) * v^y / y! 4735 4736per y = 0, 1, 2,.... La media e la varianza della distribuzione sono 4737entrambe uguali a v. Nel modello di regressione di Poisson, il parametro v 4738è rappresentato da una funzione di una o più varabili indipendenti. La 4739versione più comune del modello (e l'unica supportata da gretl) ha 4740 4741 v = exp(b0 + b1*x1 + b2*x2 + ...) 4742 4743ossia il logaritmo di v è una funzione lineare delle variabili 4744indipendenti. 4745 4746Opzionalmente è possibile aggiungere una variabile "offset" alla 4747specificazione, ossia una variabile di scala, il cui logaritmo viene 4748aggiunto alla funzione di regressione lineare (con un coefficiente implicito 4749di 1.0). Ciò ha senso se si ipotizza che il numero di occorrenze 4750dell'evento in questione sia proporzionale a qualche fattore noto, a parità 4751di altre condizioni. Ad esempio, il numero di incidenti stradali può essere 4752ipotizzato proporzionale al volume del traffico, che potrebbe essere 4753specificato come una variabile di "offset" in un modello di Poisson per il 4754tasso di incidenti. La variabile di offset dev'essere strettamente positiva. 4755 4756Da impostazione predefinita gli errori standard sono calcolati usando la 4757matrice Hessiana. Se viene data l'opzione --robust allora gli errori 4758standard vengono calcolati secondo il metodo o di Huber-White o QML. In 4759questo particolare caso la matrice di covarianze stimata è il prodotto del 4760"sandwich" tra l'Hessiana inversa (negativa) ed il prodotto esterno del 4761gradiente. 4762 4763Si veda anche la voce "negbin". 4764 4765Accesso dal menù: /Modello/Modelli non lineari/Poisson 4766 4767# print Printing 4768 4769Varianti: print lista-variabili 4770 print 4771 print nomi-oggetto 4772 print stringa 4773Opzioni: --byobs (per osservazione) 4774 --no-dates (usa i numeri delle osservazioni) 4775 --range=inizio:fine (vedi sotto) 4776 --midas (vedi sotto) 4777 --tree (specifico per bundle; vedi sotto) 4778Esempi: print x1 x2 --byobs 4779 print my_matrix 4780 print "Questa è una stringa" 4781 print my_array --range=3:6 4782 print hflist --midas 4783 4784Si noti che print è un comando relativamente "rozzo" (principalmente 4785rivolto alla stampa di serie); per alternative più avanzate e meno 4786restrittive, si vedano i comandi "printf" e "eval". 4787 4788Nella prima variante mostrata sopra (vedia anche il primo esempio), lista 4789dev'essere una lista di serie (sia come variabile predefinita che come lista 4790di nomi o numeri ID separati da spazi). In tal caso, il comando stampa i 4791valori delle variabili specificate. Per default, la stampa avviene "per 4792variabile", ma con l'opzione --byobs i dati vengono stampati per 4793osservazione. Nel secondo caso, il comportamento predefinito è quello di 4794mostrare la data (per serie storiche) o il marcatore (se esiste) all'inizio 4795di ogni riga. L'opzione --no-dates sopprime la visualizzazione delle date o 4796dei marcatori: viene mostrato solo un semplice numero di osservazione. Si 4797veda l'ultimo paragrafo di questa voce per l'effetto in questo contesto 4798dell'opzione --midas (che si applica solo a liste predefinite). 4799 4800Se al comando non vengono forniti argomenti (la seconda variante mostrata 4801all'inizio), l'azione è simile a quella appena descritta, con tanto di 4802opzioni aggiuntive. La sola differenza è che vengono stampate tutte le 4803serie nel dataset aperto. 4804 4805La terza variante (con l'argomento nomi-oggetto; vedi il secondo esempio) 4806funziona con una lista di nomi (separati da spazi) di variabili diversi da 4807serie: scalari, matrici, stringhe, bundle, array. Di questi oggetti, vengono 4808mostrati i valori. Nel caso dei bundle, gli elementi vengono ordinati per 4809tipo e alfabeticamente. 4810 4811Nella quarta forma (terzo esempio), stringa dev'essere una stringa racchiusa 4812da virgolette doppie (senza che vi sia nient'altro dopo). La stringa viene 4813stampata, seguita da un "a capo". 4814 4815L'opzione --range è usata per controllare la quantità di informazione 4816stampata. I valori (interi) inizio e fine fanno riferimento alle 4817osservazioni per serie e liste, alle rghe per le matrici, agli elementi per 4818gli array, e alle linee di testo per le stringhe. In tutti i casi, il valore 4819minimo per inizio è 1 e il massimo stop è la dimensione "per riga" 4820dell'oggetto in questione. Valori negativi per questi indici sono 4821interpretati come valori a partire dal fondo. Gli indici possono avere la 4822forma di numeri o di variabili scalari predefinite. Se inizio viene omesso, 4823si intende 1 e se viene omesso fine si intende "fino in fondo". Si noti che 4824nel caso di serie e liste, gli indici sono relativi al sottocampione in uso. 4825 4826L'opzione --tree è specifica alla stampa di un bundle: essa fa sì che 4827venga stampato anche il contenuto degli eventuali altri bundle contenuti in 4828quello specificato (anche come array di bundle). Altrimenti, vengono 4829elencati solo gli elementi di livello più alto. 4830 4831L'opzione --midas è specifica alla stampa di una lista di serie; in 4832particolare, è usata per quei dataset che contengono una o più serie ad 4833alta frequenza, ognuna rappresentata da una "MIDAS list". Se viene passata 4834come argomento una lista di questo tipo, verrà stampata (per osservazione) 4835la serie alla sua frequenza "nativa". 4836 4837Accesso dal menù: /Dati/Mostra valori 4838 4839# printf Printing 4840 4841Argomenti: formato , argomenti 4842 4843Stampa valori scalari, serie, matrici o stringhe formattandoli secondo le 4844indicazioni di una stringa di formato (che supporta un piccolo sottoinsieme 4845del comando printf() del linguaggio di programmazione C). I formati numerici 4846riconosciuti sono %e, %E, %f, %g, %G, %d, e %x, con i vari modificatori 4847disponibili in C. Esempi: la stringa di formato %.10g stampa un valore con 484810 cifre significative; %12.6f stampa un valore con 6 cifre decimali e una 4849larghezza di 12 caratteri. Si noti comunque che in gretl il formato %g è 4850una buona scelta di default per tutti i valori numerici; non c'è bisogno di 4851andare troppo sul complicato. Il formato %s è consigliato qualora si lavori 4852con le stringhe. 4853 4854La stringa di formato deve essere racchiusa tra virgolette doppie, i valori 4855da stampare devono seguire la stringa di formato, separati da virgole. I 4856valori possono avere tre forme: a) nomi di variabili; b) espressioni valide 4857per il comando "genr"; c) le funzioni speciali varname() o date(). L'esempio 4858seguente stampa i valori di due variabili e quello di un'espressione 4859calcolata: 4860 4861 ols 1 0 2 3 4862 genr b = $coeff(2) 4863 genr se_b = $stderr(2) 4864 printf "b = %.8g, standard error %.8g, t = %.4f\n", b, se_b, b/se_b 4865 4866Le prossime righe mostrano l'uso delle funzioni varname e date, che mostrano 4867rispettivamente il nome di una variabile dato il suo numero identificativo, 4868e una stringa data, dato un numero di osservazione. 4869 4870 printf "Il nome della variabile %d è %s\n", i, varname(i) 4871 printf "La data dell'osservazione %d è %s\n", j, date(j) 4872 4873Se si usa un argomento matrice insieme a un formato numerico, l'intera 4874matrice verrà stampata usando per ogni elemento il formato numerico 4875indicato. La stessa cosa vale per le serie, tranne per il fatto che 4876l'intervallo di valori stampato è controllato dall'impostazione del 4877campione corrente. 4878 4879La lunghezza massima di una stringa di formato è di 127 caratteri. Vengono 4880riconosciute le sequenze di escape \n (newline), \t (tab), \v (tab 4881verticale) e \\ (barra inversa). Per stampare un segno di percentuale, si 4882usi %%. 4883 4884Come in C, i valori numerici che fanno parte del formato (larghezza e 4885precisione) possono essere dati direttamente come numeri, come in %10.4f, o 4886come variabili. Nell'ultimo caso, si inseriscono asterischi nella stringa di 4887formato e si forniscono nell'ordine gli argomenti corrispondenti. Ad 4888esempio: 4889 4890 scalar larghezza = 12 4891 scalar precisione = 6 4892 printf "x = %*.*f\n", larghezza, precisione, x 4893 4894# probit Estimation 4895 4896Argomenti: variabile-dipendente variabili-indipendenti 4897Opzioni: --robust (errori standard robusti) 4898 --cluster=clustvar (si veda "logit" per una spiegazione) 4899 --vcv (mostra la matrice di covarianza) 4900 --verbose (mostra i dettagli delle iterazioni) 4901 --quiet (non stampa i risultati) 4902 --p-values (mostra i p-value invece degli effetti 4903 marginali) 4904 --random-effects (stima un modello panel a effetti casuali (RE)) 4905 --quadpoints=k (numero di punti di quadratura per la stima RE) 4906Esempi: ooballot.inp, oprobit.inp, reprobit.inp 4907 4908Se la variabile dipendente è binaria (tutti i suoi valori sono 0 o 1), 4909esegue una stima di massima verosimiglianza dei coefficienti delle 4910variabili-indipendenti con il metodo Newton-Raphson. Visto che il modello è 4911nonlineare, gli effetti marginali (pendenze) dipendono dai valori delle 4912variabili indipendenti: per impostazione predefinita, al posto dei p-value 4913vengono mostrate le pendenze rispetto ad ognuna delle variabili 4914indipendenti, calcolate in corrispondenza della media della variabile. 4915Questo comportamento può essere soppresso usando l'opzione --p-values. La 4916statistica chi-quadro testa l'ipotesi nulla che tutti i coefficienti tranne 4917la costante siano pari a zero. 4918 4919In modalità predefinita, gli errori standard sono calcolati tramite 4920l'inversa negativa della matrice Hessiana. Se si usa l'opzione --robust, 4921verranno calcolati gli errori standard con il metodo QML o con quello di 4922Huber-White. In questo caso, la matrice di covarianza stimata è un 4923"sandwich" dell'inversa dell'Hessiana stimata e del prodotto esterno del 4924gradiente. Per i dettagli, si veda Davidson e MacKinnon 2004, cap. 10. 4925 4926Se la variabile dipendente non è binaria ma è discreta allora si 4927otterranno delle stime Ordered Probit. (Se la variabile selezionata come 4928dipendente non è nemmeno discreta allora viene segnalato un errore.) 4929 4930Probit per dati panel 4931 4932Con l'opzione --random-effects, il termine di errore è composto per ipotesi 4933da due componenti gaussiane: una specifica per l'unità cross-sezionale e 4934invariante nel tempo (nota come "effetto individuale") e l'altra specifica 4935per quella particolare osservazione. 4936 4937Il calcolo della log-verosimiglianza per questo modello viene effettuato 4938tramite la quadratura di Gauss-Hermite per approssimare il valore di valori 4939attesi di funzioni di variabili casuali normali. Il numero di punti di 4940quadratura usati si può scegliere tramite l'opzione --quadpoints (il 4941default è 32). Un numero elevato di questi aumenta l'accuratezza dei 4942risultati, ma al costo di tempi di calcolo più lunghi; in questo caso la 4943stima può richiedere molto tempo con dataset grandi. 4944 4945Oltre ai parametri standard (e statistiche associate) relativi alle 4946variabili esplicative, dopo la stima di questo tipo di modello vengono 4947presentati alcuni risultati aggiuntivi: 4948 4949 lnsigma2: la stima ML del logaritmo della varianza dell'effetto 4950 individuale; 4951 4952 sigma_u: la stima dell'errore quadratico medio dell'effetto individuale; 4953 4954 rho: la quota stima dell'effetto individuale sulla varianza totale del 4955 termine di errore composito (anche nota come correlazione intra-classe). 4956 4957Il test LR per l'ipotesi nulla rho=0 consente di stabilire se la 4958specificazione a effetti random è davvero necessaria. Sotto la nulla, una 4959semplice specificazione probit è del tutto adeguata. Se la nulla non viene 4960rigettata allora questo suggerirà che una semplice specificazione pooled 4961per il modello probit risulta più che adeguata. 4962 4963Il probit per l'analisi delle proporzioni non è ancora stato implementato 4964in gretl. 4965 4966Accesso dal menù: /Modello/Modelli non lineari/Probit 4967 4968# pvalue Utilities 4969 4970Argomenti: distribuzione [ parametri ] valore-x 4971Esempi: pvalue z zscore 4972 pvalue t 25 3.0 4973 pvalue X 3 5.6 4974 pvalue F 4 58 fval 4975 pvalue G shape scale x 4976 pvalue B bprob 10 6 4977 pvalue P lambda x 4978 pvalue W shape scale x 4979 Vedi anche mrw.inp, restrict.inp 4980 4981Calcola l'area alla destra del valore-x nella distribuzione indicata (z per 4982la Gaussiana, t per la t di Student, X per la chi-quadro, F per la F, G per 4983la gamma, B per la binomiale, P per la Poisson, exp per l'esponenziale 4984negativa e W per la Weibull). 4985 4986A seconda della distribuzione, occorre fornire le seguenti informazioni, 4987prima del valore-x: per le distribuzioni t e chi-quadro occorre indicare i 4988gradi di libertà; per la F sono richiesti i gradi di libertà al numeratore 4989e al denominatore; per la gamma sono richiesti il parametro di forma e 4990quello di scala; per la binomiale sono richieste la probabilità di 4991"successo" e il numero di prove; per la distribuzione di Poisson va indicato 4992il parametro lambda (che rappresenta sia la media che la varianza); per 4993l'esponenziale, il parametro di scala; per la distribuzione Weibull, i 4994parametri di forma e scala. Come si vede dagli esempi precedenti, gli 4995argomenti numerici possono essere indicati sotto forma di numero o come nomi 4996di variabili. 4997 4998Si noti che talvolta la distribuzione gamma viene caratterizzata dai 4999parametri di media e varianza, invece che da quelli di forma e scala. La 5000media è il prodotto di forma e scala, mentre la varianza è il prodotto tra 5001la forma e il quadrato della scala. Quindi la scala si può ottenere come la 5002varianza divisa per la media, mentre la forma come la media divisa per la 5003scala. 5004 5005Accesso dal menù: /Strumenti/Calcola p-value 5006 5007# qlrtest Tests 5008 5009Opzioni: --limit-to=lista (limita il test a una parte delle variabili esplicative) 5010 --plot=mode-or-filename (si veda sotto) 5011 --quiet (non mostra l'output) 5012 5013Per un modello stimato con OLS su serie storiche, esegue il test del 5014rapporto di verosimiglianza di Quandt (QLR) per un break strutturale in un 5015punto incognito del campione, escludendo il 15% delle osservazioni 5016all'inizio e ella fine del campione. 5017 5018Per ogni possibile punto di rottura compreso nel 70% centrale delle 5019osservazioni, viene eseguito un test di Chow (si veda "chow"); come per il 5020test di Chow vero e proprio, questo è un test di Wald robusto se il modello 5021originale è stato stimato con l'opzione --robust. La statistica del test 5022QLR è il massimo dei valori F di questi test e segue una distribuzione non 5023standard. 5024 5025Il p-value asintotico è ottenuto usando il metodo di Bruce Hansen (1997). 5026 5027Oltre agli accessori standard "$test" e "$pvalue", questo comando genera 5028anche "$qlrbreak", che restituisce l'indice dell'ossservazione alla quale la 5029statistica test è massima. 5030 5031L'opzione --limit-to serve a limitare le interazioni con la dummy di 5032divisione del campione nei test di Chow a un sottoinsieme dei regressori 5033originali. Il parametro dev'essere una lista predefinita che non può 5034contenere la costante; gli elementi della lista devono essere tutti scelti 5035fra i regressori originali. 5036 5037Quando questo comando viene eseguito interattivamente, di default verrà 5038mostrato un grafico delle statistiche del test di Chow. Questo comportamento 5039si può modificare con l'opzione --plot. I parametri consentiti sono none 5040(per fare a meno del grafico); display (per mostrare il grafico anche quando 5041non si è in modo interattivo), oppure un nome di file. Per la descrizione 5042dell'effetto di quest'ultima scelta, si veda l'opzione --output del comando 5043"gnuplot". 5044 5045Accesso dal menù: Finestra del modello, /Test/QLR 5046 5047# qqplot Graphs 5048 5049Varianti: qqplot y 5050 qqplot y x 5051Opzioni: --z-scores (v. oltre) 5052 --raw (v. oltre) 5053 --output=nomefile (manda il grafico ad un file specificato) 5054 5055Con una sola serie come argomento, mostra un grafico della distribuzione 5056empirica della serie stessa (indicata col nome o con il suo numero ID) 5057contro i quantili della normale. La serie deve includere almeno 20 valori 5058validi nel campione selezionato al momento. Per impostazione predefinita, i 5059quantili empirici vengono disegnati contro quelli della normale avente media 5060e varianza uguali a quelli campionari della serie, ma sono disponibili due 5061alternative: con l'opzione --z-scores, i dati vengono standardizzati prima, 5062oppure, con l'opzione --raw, i quantili empirici possono essere disegnati 5063contro quelli della normale standardizzata. 5064 5065Tramite l'opzione --output si invia il grafico al file desiderato; usare 5066"display" per forzare l'output allo schermo, ad esempio nel contesto di un 5067loop. si veda il comando "gnuplot" per maggiori dettagli in merito a 5068quest'opzione. 5069 5070Con due argomenti, y and x, mostra un grafico dei quantili empirici di y 5071contro quelli di x. I dati non vengono standardizzati. 5072 5073Accesso dal menù: /Variabile/Q-Q normale 5074Accesso dal menù: /Visualizza/Grafico/Q-Q 5075 5076# quantreg Estimation 5077 5078Argomenti: tau variabile-dipendente variabili-indipendenti 5079Opzioni: --robust (errori standard robusti) 5080 --intervals[=level] (calcola gli intervalli di confidenza) 5081 --vcv (mostra la matrice di covarianza) 5082 --quiet (sopprime la stampa dei risultati) 5083Esempi: quantreg 0.25 y 0 xlist 5084 quantreg 0.5 y 0 xlist --intervals 5085 quantreg 0.5 y 0 xlist --intervals=.95 5086 quantreg tauvec y 0 xlist --robust 5087 Vedi anche mrw_qr.inp 5088 5089Regressione quantile. Il primo argomento, tau, è il quantile condizionale 5090per cui si desiderano le stime. Può essere un valore numerico o il nome di 5091una variabile scalare predefinita; il valore deve essere compreso 5092nell'intervallo da 0.01 a 0.99 (in alternativa, può essere indicato un 5093vettore di valori, si veda sotto per i dettagli). Gli argomenti dal secondo 5094in poi compongono un elenco di regressori sul modello di quello usato in 5095"ols". 5096 5097Senza l'opzione --intervals, vengono mostrati gli errori standard per le 5098stime quantili; per impostazione predefinita questi sono calcolati con la 5099formula asintotica di Koenker e Bassett (1978), ma se si usa l'opzione 5100--robust, verrà usata la variante robusta per l'eteroschedasticità 5101utilizzando il metodo di Koenker e Zhao (1994). 5102 5103Se si usa l'opzione --intervals, gretl calcolerà gli intervalli di 5104confidenza invece degli errori standard. Questi intervalli sono calcolati 5105col metodo dell'inversione del rango e in generale sono asimmetrici rispetto 5106alle stime puntuali dei parametri. Se non si usa l'opzione "--robust", gli 5107intervalli sono calcolati nell'ipotesi di errori IID (Koenker, 1994), mentre 5108se viene indicata sono calcolati con lo stimatore robusto sviluppato Koenker 5109e Machado (1999). 5110 5111Per impostazione predefinita vengono prodotti intervalli di confidenza al 511290%. È possibile specificare un altro livello di confidenza (sotto forma di 5113frazione decimale), aggiungendolo all'opzione, come in --intervals=0.95. 5114 5115Invece di indicare tau come uno scalare, è possibile usare un vettore, 5116indicando il nome di una matrice predefinita. In questo caso le stime 5117vengono eseguite per tutti i valori di tau, e i risultati mostrano la 5118sequenza delle stime quantili per ognuno dei regressori. 5119 5120Accesso dal menù: /Modello/Stima robusta/Regressione quantile 5121 5122# quit Utilities 5123 5124Esce dalla modalità corrente di gretl. 5125 5126 Quando il comando è in uno script, l'esecuzione dello script viene 5127 interrotta. Se il contesto è gretlcli (il client testuale) in modalità 5128 batch, terminerà gretlcli stesso; altrimenti, il programma tornerà in 5129 modalità interattiva. 5130 5131 Quando il comando viene eseguito nel terminale GUI, il terminale si 5132 chiuderà. 5133 5134 Quando il comando viene eseguito in modo interattivo, il programma esce. 5135 5136Si noti che questo comando non può essere eseguito all'interno di funzioni 5137o di loop. 5138 5139In comando quit non provoca l'uscita dal programma GUI in alcun caso. Per 5140uscire, si può usare la voce Esci del menu File, o Ctrl+Q, o cliccando sul 5141pulsante di chiusura della barra della finestra. 5142 5143# rename Dataset 5144 5145Argomenti: serie nuovo-nome 5146Opzione: --quiet (sopprime la stampa dell'output) 5147 5148Cambia il nome di una serie (identificata da un nome o da un numero 5149identificativo) con un nuovo-nome. Il nuovo nome deve essere di massimo 31 5150caratteri, deve iniziare con una lettera e deve essere composto da una 5151combinazione di sole lettere, cifre e trattini. In aggiunta il nuovo nome 5152non deve essere già ad appartenente a nessun oggetto di nessun tipo del 5153dataset. 5154 5155Accesso dal menù: /Variabile/Modifica attributi 5156Accesso alternativo: Menù pop-up nella finestra principale (selezione 5157 singola) 5158 5159# reset Tests 5160 5161Opzioni: --quiet (non mostra la regressione ausiliaria) 5162 --silent (non mostra nulla) 5163 --squares-only (calcola il test coi soli quadrati) 5164 --cubes-only (calcola il test coi soli cubi) 5165 5166Deve seguire la stima di un modello OLS. Esegue il test RESET di Ramsey per 5167la specificazione del modello (non-linearità) aggiungendo alla regressione 5168i quadrati e/o cubi dei valori stimati, e calcola la statistica F per 5169l'ipotesi nulla sotto la quale i coefficienti beta delle variabili aggiunte 5170siano uguali a zero. 5171 5172Sia i quadrati che i cubi vengono aggiunti al modello in maniera predefinita 5173a meno che non vengano specificate le opzioni --squares-only o --cubes-only. 5174 5175L'opzione --silent può essere usata se si intendono utilizzare solo gli 5176accessori "$test" o "$pvalue" per disporre direttamente dei risultati del 5177test. 5178 5179Accesso dal menù: Finestra del modello, /Test/RESET - Ramsey 5180 5181# restrict Tests 5182 5183Opzioni: --quiet (non stampare le stime vincolate) 5184 --silent (non stampare niente) 5185 --wald (solo per stimatori di sistema - vedi sotto) 5186 --bootstrap (se possibile, effettuare il bootstrap del test) 5187 --full (solo OLS e VECM, vedi sotto) 5188Esempi: hamilton.inp, restrict.inp 5189 5190Impone un insieme di vincoli (solitamente lineari) su (a) l'ultimo modello 5191stimato o (b) su un sistema di equazioni definito in precedenza. In entrambi 5192i casi, l'insieme di vincoli deve essere racchiuso tra i comandi "restrict" 5193e "end restrict". 5194 5195Nel caso di una equazione singola, i vincoli sono applicati implicitamente 5196all'ultimo modello e vengono valutati appena viene terminato il comando 5197"restrict". 5198 5199Nel caso di un sistema (definito attraverso il comando "system"), il comando 5200iniziale "restrict" può essere seguito dal nome di un sistema di equazioni 5201definito in precedenza; altrimenti, le restrizioni si applicheranno 5202all'ultimo modello stimato. I vincoli vengono valutati nella successiva 5203stima del sistema effettuata con il comando "estimate". Tuttavia, se viene 5204usata l'opzione --wald, il vincolo viene testato immediatamente per mezzo di 5205un test chi quadro di Wald usando la matrice di covarianze stimata. Si noti 5206che questa opzione produrrà un errore se il sistema è stato definito, ma 5207non ancora stimato. 5208 5209A seconda del contesto, i vincoli possono essere espressi in diversi modi. 5210Quello più semplice è di esprimere ogni vincolo come equazione, con una 5211combinazione lineare dei parametri a sinistra e uno scalare a destra del 5212segno di uguale (una costante o, volendo, il nome di una variabile scalare). 5213 5214Nel caso della singola equazione, i parametri sono indicati con la sintassi 5215b[i], dove i rappresenta la posizione nella lista dei regressori, a partire 5216da uno, oppure con b[variabile], dove variabile è il nome del regressore in 5217questione. Nel caso di sistemi, i parametri vengono indicati con la sintassi 5218b seguita da due numeri tra parentesi quadre. Il primo numero rappresenta la 5219posizione dell'equazione all'interno del sistema, mentre il secondo indica 5220la posizione nella lista dei regressori. Ad esempio b[2,1] indica il primo 5221parametro della seconda equazione, mentre b[3,2] il secondo parametro della 5222terza equazione. I termini b nell'equazione che rappresenta un vincolo 5223possono essere prefissati da un moltiplicatore numerico, usando il segno * 5224per indicare la moltiplicazione, ad esempio 3.5*b[4]. 5225 5226Ecco un esempio di un insieme di vincoli per un modello stimato in 5227precedenza: 5228 5229 restrict 5230 b[1] = 0 5231 b[2] - b[3] = 0 5232 b[4] + 2*b[5] = 1 5233 end restrict 5234 5235Ed ecco un esempio di un insieme di vincoli da applicare a un sistema (se il 5236nome del sistema non contiene spazi, è possibile tralasciare le 5237virgolette). 5238 5239 restrict "Sistema 1" 5240 b[1,1] = 0 5241 b[1,2] - b[2,2] = 0 5242 b[3,4] + 2*b[3,5] = 1 5243 end restrict 5244 5245Nel caso di una equazione singola le restrizioni sono valutate, per default, 5246tramite un test di Wald, che utilizza la matrice di covarianze del modello 5247in questione. Se il modello originale è stato stimato via OLS allora 5248vengono mostrati i coefficienti vincolati stimati, a meno che non si 5249utilizzi l'opzione --quiet all'inizio del comando restrict. Come alternativa 5250al test di Wald è possibile dare usare l'opzione --bootstrap affinchè 5251venga eseguito un test sulla restrizione attraverso tale metodo; ciò è 5252consentito solamente per modelli stimati attraverso OLS o WLS. 5253 5254Nel caso di un sistema, la statistica test dipende dallo stimatore scelto: 5255un test del rapporto di verosimiglianza nel caso di un sistema stimato con 5256un metodo di massima verosimiglianza, o un test F asintotico negli altri 5257casi. 5258 5259Esistono due alternative alla rappresentazione dei vincoli discussa sopra. 5260Una sfrutta la possibilità di esprimere g restrizioni lineari su un vettore 5261di kparametri, beta, atraverso l'espressione Rbeta - q = 0, dove R è una 5262matrice g x k e q è un vettore a g elementi. Le restrizioni possono essere 5263date usando i nomi di matrici predefinite e conformabili da usare come R e 5264q, come ad esempio in 5265 5266 restrict 5267 R = Rmat 5268 q = qvec 5269 end restrict 5270 5271Se si deve testare un vincolo non lineare (possibilità al momento prevista 5272solo per i modelli ad equazione singola) bisogna dare al vincolo in nome di 5273una funzione, preceduto da "rfunc = ", come ad esempio in 5274 5275 restrict 5276 rfunc = myfunction 5277 end restrict 5278 5279La funzione vincolo deve avere, come unico argomento, una const matrix, che 5280verrà automaticamente riempita col vettore dei parametri. La funzione deve 5281ritornare un vettore zero sotto lipotesi nulla e non-zero altrimenti. La 5282lunghezza del vettore è il numero di vincoli. Questa funzione è usata come 5283"callback" dalla routine interna di calcolo dello jacobiano, che calcola un 5284test di Wald per mezzo del "delta method". 5285 5286Quello che segue è un semplice esempio di funzione atta allo scopo di 5287testare una restrizione non-lineare, cioè che due coppie di parametri 5288stiano nello stesso rapporto fra loro. 5289 5290 function matrix restr (const matrix b) 5291 matrix v = b[1]/b[2] - b[4]/b[5] 5292 return v 5293 end function 5294 5295Se il comando restrict va a buon fine, gli accessori "$test" e "$pvalue" 5296restituiscono la statistica test ed il suo relativo p-value. 5297 5298Quando si testano delle restrizioni su un modello ad equazione singola 5299stimato via OLS, o su una VECM, l'opzione --full può essere usata per 5300impostare le stime vincolate come "ultimo modello" di riferimento, allo 5301scopo di compiere ulteriori test o di utilizzare eventuali accessori del 5302tipo $coeff e vcv. Si noti che alcune considerazioni particolari 5303sopraggiungono nel caso in cui si testino delle restrizioni su modelli VECM. 5304Per maggiori dettagli si consiglia la lettura della guida all'uso di gretl 5305(il capitolo 33). 5306 5307Accesso dal menù: Modello, /Test/Vincoli lineari 5308 5309# rmplot Graphs 5310 5311Argomento: nome-variabile 5312Opzioni: --trim (si veda oltre) 5313 --quiet (non mostra l'output) 5314 --output=nomefile (si veda oltre) 5315 5316Grafici range-mean: questo comando crea un semplice grafico che aiuta a 5317capire se una serie storica y(t) ha varianza costante o no. L'intero 5318campione t=1,...,T viene diviso in piccoli sotto-campioni di dimensione 5319arbitraria k. Il primo sotto-campione è formato da y(1), ... ,y(k), il 5320secondo da y(k+1), ... , y(2k), e così via. Per ogni sotto-campione, 5321vengono calcolati la media e il campo di variazione (range: il valore 5322massimo meno quello minimo) e viene costruito un grafico con le medie 5323sull'asse orizzontale e i campi di variazione su quello verticale, in modo 5324che ogni sotto-campione sia rappresentato da un punto sul piano. Se la 5325varianza della serie è costante, ci si aspetta che il campo di variazione 5326del sotto-campione sia indipendente dalla media del sotto-campione; se i 5327punti si dispongono su una linea crescente, la varianza della serie cresce 5328al crescere della media, viceversa se i punti si dispongono su una linea 5329decrescente. 5330 5331Oltre al grafico, gretl mostra anche le medie e i campi di variazione per 5332ogni sotto-campione, insieme al coefficiente di pendenza della regressione 5333OLS del campo di variazione sulla media e il p-value per l'ipotesi nulla che 5334la pendenza sia zero. Se il coefficiente di pendenza è significativo al 5335livello del 10 per cento, viene mostrata sul grafico la linea stimata della 5336regressione del campo di variazione sulla media. La statistica t per 5337l'ipotesi nulla, e il corrispondente p-value, vengono registrati e possono 5338venire richiamati attraverso gli accessori "$test" e "$pvalue". 5339 5340Se l'opzione --trim è presente il valore minimo ed il valore massimo di 5341ogni sotto-campione vengono scartati prima che la media ed il campo di 5342variazione siano calcolati. Questo rende ancor più marginale la presenza di 5343eventuali outlier che potrebbero distorcere i risultati dell'analisi. 5344 5345Se l'opzione --quiet è data nessun grafico viene mostrato e nessun output 5346viene stampato; solamente la statistica t ed il corrispondente p-value 5347vengono registrati. Altrimenti il formato del grafico può venire 5348controllato attraverso l'opzione --output; quest'ultima funziona esattamente 5349come descritto nel comando "gnuplot". 5350 5351Accesso dal menù: /Variabile/Grafico range-mean 5352 5353# run Programming 5354 5355Argomento: file-input 5356 5357Esegue i comandi nel file-input e restituisce il controllo al prompt 5358interattivo. Questo comando si intende usato con il programma a riga di 5359comando gretlcli, o con il "terminale di gretl" nel programma con 5360interfaccia grafica. 5361 5362Si veda anche "include". 5363 5364Accesso dal menù: Icona Esegui nella finestra comandi 5365 5366# runs Tests 5367 5368Argomento: nome-variabile 5369Opzioni: --difference (usa la differenza prima della variabile) 5370 --equal (i valori positivi e negativi sono equiprobabili) 5371 5372Esegue il test non parametrico "delle successioni" per la casualità della 5373variabile specificata, dove le successioni sono definite come sequenze di 5374valori consecutivi positivi o negativi. Ad esempio, per testare la 5375casualità delle deviazioni dalla mediana per una variabile chiamata x1, con 5376una mediana diversa da zero, eseguire i comandi seguenti: 5377 5378 genr signx1 = x1 - median(x1) 5379 runs signx1 5380 5381Se si usa l'opzione --difference, la variabile viene differenziata prima 5382dell'analisi, quindi le successioni sono interpretabili come sequenze di 5383incrementi o decrementi consecutivi nel valore della variabile. 5384 5385Se si usa l'opzione --equal, l'ipotesi nulla incorpora l'assunzione che i 5386valori positivi e negativi siano equiprobabili, altrimenti la statistica 5387test è invariante rispetto all'"equilibrio" del processo che genera la 5388sequenza, focalizzandosi solo sull'indipendenza. 5389 5390Accesso dal menù: /Strumenti/Test non parametrici 5391 5392# scatters Graphs 5393 5394Argomenti: variabile-y ; lista-variabili-x o lista-variabili-y ; variabile-x 5395Opzioni: --with-lines (crea grafici lineari) 5396 --matrix=nome (mostra le colonne della matrice) 5397 --output=noemfile (manda l'output al file specificato) 5398Esempi: scatters 1 ; 2 3 4 5 5399 scatters 1 2 3 4 5 6 ; 7 5400 scatters y1 y2 y3 ; x --with-lines 5401 5402Produce grafici della variabile-y rispetto ad ognuna delle variabili nella 5403lista-variabili-x, oppure di tutte le variabili nella lista-variabili-y 5404rispetto alla variabile-x. Il primo esempio visto sopra assegna la variabile 54051 all'asse y e produce quattro grafici, il primo con la variabile 2 5406sull'asse x, il secondo con la variabile 3 sull'asse x, e così via. Il 5407secondo esempio rappresenta ognuna delle variabili da 1 a 6 rispetto alla 5408variabile 7 sull'asse x. Questi gruppi di grafici sono utili nell'analisi 5409esplorativa dei dati. È possibile creare fino a sei grafici alla volta, 5410eventuali variabili in sovrappiù saranno ignorate. 5411 5412Per impostazione predefinita vengono prodotti dei classici grafici a 5413dispersione, ma se si usa l'opzione --with-lines vengono mostrate anche le 5414linee di collegamento tra i punti del grafico. 5415 5416Per una spiegazione dell'opzione --output, si veda il comando "gnuplot" 5417command. 5418 5419Se la fonte dei dati è una matrice, le liste x e y devono contenere in 5420numeri di colonna; se non vengono dati, tuttle le colonne sono graficate 5421rispetto al tempo o ad una variabile indice. 5422 5423Se il dataset è temporale, la seconda sotto-lista può essere omessa, nel 5424qual caso si intende che le serie saranno graficate rispetto al tempo in 5425sotto-grafici separati. 5426 5427Accesso dal menù: /Visualizza/Grafici multipli 5428 5429# sdiff Transformations 5430 5431Argomento: lista-variabili 5432 5433Calcola la differenza stagionale di ogni variabile della lista-variabili e 5434salva il risultato in una nuova variabile con il prefisso sd_. Il comando è 5435disponibile solo per serie storiche stagionali. 5436 5437Accesso dal menù: /Aggiungi/Differenze stagionali 5438 5439# set Programming 5440 5441Varianti: set variabile valore 5442 set --to-file=filename 5443 set --from-file=filename 5444 set stopwatch 5445 set 5446Esempi: set svd on 5447 set csv_delim tab 5448 set horizon 10 5449 set --to-file=mysettings.inp 5450 5451L'uso più comune di questo comando è quello mostrato nella prima variante 5452qui sopra, dove viene fissato il valore di un certo parametro. Più avanti, 5453questo aspetto sarà analizzato in dettaglio. Gli altri usi sono: con 5454--from-file per leggere un file di script contenente certe impostazioni e 5455applicarle alla sessione corrente; con --stopwatch, per azzerare il 5456"cronometro" della CPU di gretl (si veda lo help per l'accessore 5457"$stopwatch"). Se il comando "set" è usato senza parametri, vengono 5458mostrate le impostazioni attuali per tutti i parametri rilevanti. 5459 5460Il valore impostato rimane in vigore per la durata della sessione di gretl, 5461a meno di non essere modificato da un ulteriore esecuzione del comando 5462"set". I parametri che possono essere impostati in questo modo sono elencati 5463di seguito. Si noti che le impostazioni di hac_lag, hc_version e hac_kernel 5464sono usate quando viene data l'opzione --robust a un comando di stima. 5465 5466Le impostazioni disponibili sono raggruppate in categorie: interazione col 5467programma, metodi numerici, generazione di numeri casuali, stima robusta, 5468filtri, stima di modelli per serie storiche e interazione con R. 5469 5470Interazione con il programma 5471 5472Queste impostazioni servono per controllare vari aspetti del modo in cui 5473gretl interagisce con l'utente. 5474 5475 workdir: path. Stabilisce la directory di default per la lettura/scrittura 5476 dei file, ogni qual volta non si specifichino percorsi completi. 5477 5478 use_cwd: on oppure off (il default). Regola l'inizializzazione automatica 5479 di workdir: se on, essa viene ereditata dalla shell, altrimenti viene 5480 fissata al valore che aveva nella sessione gretl precedente. 5481 5482 echo: off o on (valore predefinito). Sopprime o ripristina l'indicazione 5483 dei comandi eseguiti nell'output dei risultati. 5484 5485 messages: off o on (valore predefinito). Sopprime o ripristina 5486 l'indicazione dei messaggi informativi associati a vari comandi, ad 5487 esempio quando viene generata una nuova variabile o viene modificato 5488 l'intervallo del campione. 5489 5490 verbose: off oppure on (valore predefinito). Funziona come "interruttore 5491 doppio" per echo e messages (vedi sopra), ponendoli ambedue accesi o 5492 spenti. 5493 5494 warnings: off oppure on (valore predefinito). Sopprime o ripristina i 5495 messaggi cautelativi, emessi quando certe operazioni aritmetiche producono 5496 valori non finiti. 5497 5498 csv_delim: comma (virgola, valore predefinito), space (spazio), o tab. 5499 Imposta il delimitatore di colonna usato nel salvataggio di dati su file 5500 in formato CSV. 5501 5502 csv_write_na: la stringa usata per rappresentare i valori mancanti quando 5503 si esportano dati in formato CSV. Massimo 7 caratteri; il default è NA. 5504 5505 csv_read_na: la stringa usata per rappresentare i valori mancanti quando 5506 si esportano dati in formato CSV. Massimo 7 caratteri; il default dipende 5507 se una colonna di dati contiene dati numerici (o per lo più tali) o 5508 stringa. Per dati numerici, i valori seguenti sono tutti sinomimi di "dato 5509 mancant": una cella vuota, or una qualunque delle stringhe NA, N.A., na, 5510 n.a., N/A, #N/A, NaN, .NaN, ., .., -999, and -9999. Per valori stringa, si 5511 conta come mancante una cella vuota o una contenente una stringa vuota. 5512 Questi valori di default possono essere reimpostati dando default come 5513 valore per csv_read_na. Per specificare che siano considerate mancanti 5514 solo celle vuote, va dato un valore di "". Si noti comunque che celle 5515 vuote vengono lette come valori mancanti indipendentemente da questo 5516 settaggio. 5517 5518 csv_digits: un intero positivo contenente il numero di cifre significative 5519 da usare quando si salva in formato CSV. Di default, si usano fino a 15 5520 cifre (a seconda della precisione dei dati originali). Si noti che 5521 l'output in CSV usa la funzione fprintf della libreria C con la 5522 conversione "%g", il che implica che gli zeri in fondi non vengono 5523 stampati. 5524 5525 display_digits: un intero da 3 a 6, specificante il numero di cifre 5526 significative da usare nell'output di coefficienti di regressione e 5527 corrispondenti errori standard (il default è 6). Questo settaggio è 5528 anche attivo sul numero di cifre usato dal comando "summary"; in questo 5529 caso, il default (che è anche il massimo) è 5, o 4 con l'opzione 5530 --simple. 5531 5532 mwrite_g: on or off (the default). When writing a matrix to file as text, 5533 gretl by default uses scientific notation with 18-digit precision, hence 5534 ensuring that the stored values are a faithful representation of the 5535 numbers in memory. When writing primary data with no more than 6 digits of 5536 precision it may be preferable to use %g format for a more compact and 5537 human-readable file; you can make this switch via set mwrite_g on. 5538 5539 force_decpoint: on o off (valore predefinito). Forza gretl a usare il 5540 carattere punto come separatore decimale, in un ambiente in cui il 5541 separatore standard è un altro carattere (tipicamente la virgola). 5542 5543 loop_maxiter: un valore intero non negativo. Imposta il numero massimo di 5544 iterazioni consentite prima che un loop di tipo while si fermi (si veda 5545 "loop"). Si noti che questa impostazione riguarda solo la variante while, 5546 visto che lo scopo è quello di interrompere possibili cicli infiniti. Il 5547 valore speciale 0 viene usato per rendere tali cicli potenzialmente 5548 infiniti, visto che non viene fatto alcun controllo sul numero di 5549 iterazioni. Usare con cautela. 5550 5551 max_verbose: on o off (valore predefinito). Attiva l'output aggiuntivo per 5552 la funzione BFGSmax (si veda la Guida all'uso per i dettagli). 5553 5554 debug: 1, 2 o 0 (valore predefinito). Da usare per le funzioni definite 5555 dall'utente. Impostare debug a 1 equivale a impostare messages in tutte 5556 queste funzioni; impostando la variabile a 2 ha l'effetto aggiuntivo di 5557 impostare max_verbose in tutte le funzioni. 5558 5559 shell_ok: on o off (valore predefinito). Abilita l'esecuzione di programmi 5560 esterni da gretl attraverso la shell di sistema. Per motivi di sicurezza, 5561 la funzione è disabilitata per impostazione predefinita; inoltre è 5562 possibile abilitarla solo tramite l'interfaccia grafica 5563 (Strumenti/Preferenze/Generali). Una volta abilitata, l'impostazione 5564 rimarrà attiva per le successive sessioni, fino a che non sarà 5565 disabilitata esplicitamente. 5566 5567 bfgs_verbskip: un intero. Questo parametro regola l'effetto dell'opzione 5568 --verbose per quei comandi che usano BFGS come algoritmo di 5569 ottimizzazione, e serve a rendere l'output più compatto. Se bfgs_verbskip 5570 è, ad esempio, 3, allora l'opzione --verbose farà si che vengano 5571 stampate solo le iterazioni 3, 6, 9 e così via. 5572 5573 skip_missing: on (il default) oppure off. Controlla ciò che gretl fa 5574 quando si costruisce una matrice da una o più serie: il default è di 5575 saltare le righe che contengono almeno un valore mancante, ma impostando 5576 questo parametro a off i valori mancanti vengono convertiti in NaNs. 5577 5578 matrix_mask: il nome di una serie, o la parola null. Questo parametro 5579 permette di costruire matrici da serie con maggiore flessibilità rispetto 5580 a skip_missing: le righe che andranno nella matrice sono quelle per cui la 5581 serie specificata presenta valori validi non-zero. Questo settaggio resta 5582 in vigore finché non viene specificata una serie diversa, o rimosso 5583 usando la parola null. 5584 5585 huge: un numero grande positivo (di default, 1.0E100). Questo settaggio 5586 controlla il valore ritornato dall'accessore "$huge". 5587 5588 assert: off (default), warn oppure stop. Controlla cosa succede se la 5589 funzione "assert" fallisce, ossia ritorna 0. 5590 5591 datacols: un intero da 1 a 15, con valore di default 5. Fissa il massimo 5592 numero di serie mostrate fianco a fianco quando i dati sono mostrati per 5593 osservazione. 5594 5595 plot_collection: on, auto o off. Questo parametro determina il modo in cui 5596 i grafici sono mostrati durante l'uso interattivo. Quando è on, grafici 5597 della stessa dimensione (in termini di pixel) sono raggruppati in una 5598 "collezione", ossia una finestra unica nella quale si può scorrere avanti 5599 e indietro per visualizzare i diversi grafici. Quando è off, invece, 5600 verrà generata una finestra per grafico, come nelle versioni precedenti 5601 di gretl. Infine, il valore auto fa sì che la collezione venga abilitata 5602 solo per grafici che sono generati con un intervallo inferiore agli 1.25 5603 secondi l'uno dall'altro (ad esempio, quando il comando di generazione 5604 grafico fa parte di un loop). 5605 5606Metodi numerici 5607 5608Queste impostazioni vengono usate per controllare gli algoritmi numerici 5609usati da gretl per la stima. 5610 5611 optimizer: auto (il default), BFGS oppure newton. Seleziona il metodo di 5612 ottimizzazione usato in vari stimatori ML, quando sono applicabili sia 5613 BFGS che Newton-Raphson. Il settaggio di default è di usare 5614 Newton-Raphson quando sia disponibile l'hessiana analitica, e se no BFGS. 5615 5616 bhhh_maxiter: un intero. Imposta il massimo numero di iterazioni per la 5617 routine BHHH, che è usata dal comando "arma". Se non viene raggiunta la 5618 convergenza dopo bhhh_maxiter, il programma segnala un errore. Il valore 5619 predefinito è 500. 5620 5621 bhhh_toler: un valore a virgola mobile, oppure la stringa default. Viene 5622 usato dalla routine BHHH di gretl per controllare se viene raggiunta la 5623 convergenza. L'algoritmo di calcolo ferma le iterazioni non appena 5624 l'incremento nella log-verosimiglianza tra le iterazioni è minore di 5625 bhhh_toler. Il valore predefinito è 1.0E-06; questo valore può essere 5626 reimpostato usando la stringa default invece di un valore numerico. 5627 5628 bfgs_maxiter: un valore intero. Rappresenta il massimo numero di 5629 iterazioni per la routine BFGS di gretl, usata da "mle", "gmm" e altri 5630 stimatori. Se non si raggiunge la convergenza nel numero specificato di 5631 iterazioni, il programma produce un messaggio di errore. Il valore 5632 predefinito dipende dal contesto, ma tipicamente è nell'ordine delle 500 5633 iterazioni. 5634 5635 bfgs_toler: un valore in virgola mobile, o la stringa default. Viene usato 5636 nella routine BFGS di gretl per controllare se si è raggiunta la 5637 convergenza. L'algoritmo si ferma appena l'incremento relativo nella 5638 funzione obiettivo tra un'iterazione e l'altra è minore di bfgs_toler. Il 5639 valore predefinito è pari alla precisione della macchina elevata alla 5640 potenza 3/4; questo valore può essere re-impostato usando la stringa 5641 default invece di un valore numerico. 5642 5643 bfgs_maxgrad: one floating point value. This is used in gretl's BFGS 5644 routine to check if the norm of the gradient is reasonably close to zero 5645 when the bfgs_toler criterion is met. A warning is printed if the norm of 5646 the gradient exceeds 1; an error is flagged if the norm exceeds 5647 bfgs_maxgrad. At present the default is the permissive value of 5.0. 5648 5649 bfgs_richardson: on or off (the default). Use Richardson extrapolation 5650 when computing numerical derivatives in the context of BFGS maximization. 5651 5652 initvals: una matrice pre-specificata. Permette di inizializzare il 5653 vettore dei parametri per certi comandi che usano algoritmi di 5654 ottimizzazione numerica (arma, garch, logit e probit, tobit e intreg, 5655 biprobit, duration), nonché quando vengono imposte certe restrizioni 5656 associate ai VECM. A differenza di altri settaggi, initvals non è 5657 persistente: dopo, l'uso, viene automaticamente resettato. Per i dettagli 5658 legati alla stima di modelli ARMA, si veda la guida all'uso di gretl (il 5659 capitolo 31). 5660 5661 lbfgs: on o off (valore predefinito). Usa la versione a memoria limitata 5662 di BFGS, al posto dell'algoritmo standard. Può essere vantaggioso quando 5663 la funzione da massimizzare non è globalmente concava. 5664 5665 lbfgs_mem: un intero da 3 a 20 (il default è 8). Determina il numero di 5666 correzioni usate nella matrice di memoria limitata quando si usa il metodo 5667 L-BFGS-B. 5668 5669 nls_toler: un valore in virgola mobile (il valore predefinito è pari alla 5670 precisione della macchina elevata alla potenza 3/4). Imposta la tolleranza 5671 usata per stabilire se è stata raggiunta la convergenza nelle procedure 5672 iterative di stima con i minimi quadrati non lineari usate dal comando 5673 "nls". 5674 5675 svd: on o off (valore predefinito). Usa la decomposizione SVD invece di 5676 quella di Cholesky o della QR nel calcolo delle stime OLS. Questa opzione 5677 si applica alla funzione mols e a vari altri calcoli eseguiti 5678 internamente, ma non al comando "ols". 5679 5680 force_qr: on or off (the default). This applies to the "ols" command. By 5681 default this command computes OLS estimates using Cholesky decomposition 5682 (the fastest method), with a fallback to QR if the data seem too 5683 ill-conditioned. You can use force_qr to skip the Cholesky step; in 5684 "doubtful" cases this may ensure greater accuracy. 5685 5686 fcp: on o off (valore predefinito). Usa l'algoritmo di Fiorentini, 5687 Calzolari e Panattoni al posto del codice interno di gretl per calcolare 5688 le stime GARCH. 5689 5690 gmm_maxiter: un intero, il numero massimo di iterazioni per il comando 5691 "gmm" con l'opzione --iterate. Il default è 250. 5692 5693 nadarwat_trim: un intero, il parametro di taglio usato dalla funzione 5694 "nadarwat". 5695 5696 fdjac_quality: un intero fra 0 e 2, corrsipondente all'algoritmo usato 5697 nella funzione "fdjac". 5698 5699 quantile_type: una stringa ("Q6", "Q7" o "Q8"), corrispondente al metodo 5700 usato per calcolare i quantili campionari secondo la classificazione di 5701 Hyndman e Fan (1996). Il default è "Q6". 5702 5703Generazione di numeri casuali 5704 5705 seed: un intero senza segno. Imposta il seme per il generatore di numeri 5706 pseudo-casuali. Di solito il seme viene impostato a partire dall'ora di 5707 sistema, ma se si intende generare sequenze ripetibili di numeri casuali 5708 occorre impostare il seme manualmente. 5709 5710Stima robusta 5711 5712 bootrep: un intero. Imposta il numero di replicazioni per il comando 5713 "restrict" con l'opzione --bootstrap. 5714 5715 garch_vcv: unset, hessian, im (matrice di informazione) , op (matrice dei 5716 prodotti esterni), qml (stimatore QML), bw (Bollerslev-Wooldridge). 5717 Specifica la variante da usare per stimare la matrice di covarianza dei 5718 coefficienti nei modelli GARCH. Se si usa unset (valore predefinito), 5719 viene usata l'Hessiana, a meno di usare l'opzione "robust" col comando 5720 garch, nel qual caso viene usato QML. 5721 5722 arma_vcv: hessian (predefinito) o op (prodotto esterno). Specifica la 5723 variante da usare per calcolare la matrice di covarianza per i modelli 5724 ARIMA. 5725 5726 force_hc: off (predefinito) o on. Lo stimatore HAC viene usato in modo 5727 predefinito con dati serie storiche e quando si usa l'opzione --robust di 5728 ols. Impostando invece force_hc a "on", si forza l'uso della matrice di 5729 covarianza coerente con l'eteroschedasticità (che non tiene conto 5730 dell'autocorrelazione). Si noti che i VAR costituiscono un caso 5731 particolare: con l'opzione --robust il metodo di default è lo HCCM, ma si 5732 può forzare l'uso di uno stimatore HAC con l'opzione --robust-hac. 5733 5734 robust_z: off (the default) or on. This controls the distribution used 5735 when calculating p-values based on robust standard errors in the context 5736 of least-squares estimators. By default gretl uses the Student t 5737 distribution but if robust_z is turned on the normal distribution is used. 5738 5739 hac_lag: nw1 (valore predefinito), nw2, nw3, o un intero. Imposta il 5740 massimo valore di ritardo, o la larghezza di banda, p, usato nel calcolo 5741 degli errori standard HAC (Heteroskedasticity and Autocorrelation 5742 Consistent) con l'approccio Newey-West, per le serie storiche. nw1 e nw2 5743 rappresentano due varianti di calcolo automatico basate sulla dimensione 5744 del campione, T: per nw1, p = 0.75 * T^(1/3), e per nw2, p = 4 * 5745 (T/100)^(2/9). nw3 permette di selezionare la larghezza di banda basandosi 5746 sui dati. Si veda anche qs_bandwidth e hac_prewhiten. 5747 5748 hac_kernel: bartlett (valore predefinito), parzen, o qs (Quadratic 5749 Spectral). Imposta il kernel, o struttura di pesi, usato nel calcolo degli 5750 errori standard HAC. 5751 5752 hac_prewhiten: on o off (valore predefinito). Usa le procedure di 5753 "prewhitening" e "re-coloring" di Andrews-Monahan nel calcolo degli errori 5754 standard HAC. Questo comporta anche la selezione della larghezza di banda 5755 basata sui dati. 5756 5757 hc_version: 0 (valore predefinito), 1, 2, 3 o 3a. Imposta la variante da 5758 usare nel calcolo degli errori standard HAC (Heteroskedasticity and 5759 Autocorrelation Consistent) con dati di tipo cross section. Le prime 4 5760 opzioni corrispondono alle HC0, HC1, HC2 e HC3 discusse da Davidson e 5761 MacKinnon nel capitolo 5 di Econometric Theory and Methods. HC0 produce 5762 quelli che di solito vengono chiamati "errori standard di White". La 5763 variante 3a è la procedura "jackknife" di MacKinnon-White. 5764 5765 pcse: off (impostazione predefinita) o on. Di solito, quando si stima un 5766 modello con pooled OLS su dati panel usando l'opzione --robust, viene 5767 usato lo stimatore di Arellano per la matrice di covarianza. Se si imposta 5768 pcse a "on", verranno usati i Panel Corrected Standard Errors (PCSE) di 5769 Beck e Katz, che non tengono conto dell'autocorrelazione. 5770 5771 qs_bandwidth: larghezza di banda per la stima HAC nel caso in cui si 5772 scelga il kernel "Quadratic Spectral" (a differenza dei kernel Bartlett e 5773 Parzen, la larghezza di banda QS non deve essere necessariamente un 5774 intero). 5775 5776Serie storiche 5777 5778 horizon: un intero (il valore predefinito dipende dalla frequenza dei 5779 dati). Imposta l'orizzonte per le funzioni impulso-risposta e per la 5780 decomposizione della varianza nel contesto delle autoregressioni 5781 vettoriali. 5782 5783 vecm_norm: phillips (valore predefinito), diag, first o none. Usato nel 5784 contesto della stima VECM, attraverso il comando "vecm" per identificare i 5785 vettori di cointegrazione. Si veda la Guida all'uso per i dettagli. 5786 5787Interazione con R 5788 5789 R_lib: on (the default) or off. When sending instructions to be executed 5790 by R, use the R shared library by preference to the R executable, if the 5791 library is available. 5792 5793 R_functions: off (il default) oppure on. Riconosce funzioni di Rcome se 5794 fossero funzioni gretl (premettendo il prefisso "R."). Si veda la guida 5795 all'uso di gretl (il capitolo 44) per dettagli su questo punto e sul 5796 precedente. 5797 5798Varie 5799 5800 mpi_use_smt: on oppure off (default). Questo settaggio influisce sul 5801 numero di processi eseguiti in un blocco mpi presente in uno script. Se è 5802 off, il numero di processi di default è uguale al numero di core fisici 5803 sulla macchina locale; se invece è on, il default sarà dato dal numero 5804 massimo di thread, ossia il doppio dei core fisici se essi supportano lo 5805 standard SMT (Simultaneous MultiThreading, anche noto come 5806 Hyper-Threading). Il settaggio si applica solo al caso in cui l'utente non 5807 ha specificato il numero di processi, n modo diretto o indiretto, 5808 attraverso il file hosts. 5809 5810 graph_theme: una stringa fra altpoints, classic, dark2 (il default 5811 attuale), ethan, iwanthue o sober. Imposta il "tema" ustao per i grafici 5812 prodotti da gretl. Con l'opzione classic si avrà il tema usato fino alla 5813 versione 2020b. 5814 5815# setinfo Dataset 5816 5817Argomento: nome-variabile 5818Opzioni: --description=stringa (imposta la descrizione) 5819 --graph-name=stringa (imposta il nome per i grafici) 5820 --discrete (marca la variabile come discreta) 5821 --continuous (marca la variabile come continua) 5822 --coded (mark come codifica) 5823 --numeric (marca come numerica) 5824 --midas (mark come componente di dati ad alta frequenza) 5825Esempi: setinfo x1 --description "Descrizione di x1" 5826 setinfo y --graph-name="Nome nei grafici" 5827 setinfo z --discrete 5828 5829Se sono usate le opzioni --description o --graph-name l'argomento deve 5830essere una serie singola. Altrimenti, può essere una lista, nel qual caso 5831il comando opera su ognuna delle variabile. Questo comando imposta fino a 5832quattro attributi, come segue. 5833 5834Usando l'opzione --description seguita da una stringa tra virgolette doppie, 5835la stringa verrà usata come etichetta descrittiva per la variabile 5836indicata, che viene mostrata dal comando "labels" e anche nella finestra 5837principale del programma. 5838 5839Usando l'opzione --graph-name seguita da una stringa tra virgolette doppie, 5840la stringa verrà usata nei grafici al posto del nome della variabile. 5841 5842Usando una delle opzioni --discrete o --continuous, viene impostato il 5843carattere numerico della variabile. In modalità predefinita, tutte le 5844variabili sono considerate come continue; marcando una variabile come 5845discreta, essa viene trattata in modo speciale in certi comandi e funzioni, 5846come ad esempio "freq" o "dummify" . 5847 5848Se viene data una fra le opzioni --coded o --numeric,lo stato della serie è 5849impostato di conseguenza. L'impostazione di default è di trattare tutti i 5850valori numerici come tali, per lo meno in un senso ordinale; se una 5851variabile viene impostata come coded, i valori numerici sono considerati una 5852codifica arbitraria di qualche caratteristica qualitativa. 5853 5854L'opzione --midas imposta l'indicazione che una data serie contiene dati a 5855frequenza più alta di quella base del dataset; per esempio, il dataset è 5856trimestrale e la serie contiene valori per il mese 1, 2 o 3 del trimestre. 5857(MIDAS = Mixed Data Sampling.) 5858 5859Accesso dal menù: /Variabile/Modifica attributi 5860Accesso alternativo: Menù pop-up nella finestra principale 5861 5862# setmiss Dataset 5863 5864Argomenti: valore [ lista-variabili ] 5865Esempi: setmiss -1 5866 setmiss 100 x2 5867 5868Imposta il programma in modo da interpretare un dato valore numerico (il 5869primo parametro indicato al comando) come codice per i "valori mancanti" nei 5870dati importati. Se questo valore è l'unico parametro fornito, come nel 5871primo degli esempi precedenti, l'interpretazione verrà applicata a tutte le 5872serie del dataset. Se "valore" è seguito da una lista di variabili, 5873indicate per nome o numero, l'interpretazione è limitata solo alle 5874variabili specificate. Così, nel secondo esempio, il valore 100 è 5875interpretato come codice per "mancante", ma solo per la variabile x2. 5876 5877Accesso dal menù: /Campione/Imposta codice valori mancanti 5878 5879# setobs Dataset 5880 5881Varianti: setobs periodicità oss-iniziale 5882 setobs variabile-unità variabile-periodi 5883Opzioni: --cross-section (interpreta come cross section) 5884 --time-series (interpreta come serie storiche) 5885 --special-time-series (vedi sotto) 5886 --stacked-cross-section (interpreta come panel) 5887 --stacked-time-series (interpreta come panel) 5888 --panel-vars (usa variabili indice (si veda oltre)) 5889Esempi: setobs 4 1990:1 --time-series 5890 setobs 12 1978:03 5891 setobs 1 1 --cross-section 5892 setobs 20 1:1 --stacked-time-series 5893 setobs unita anno --panel-vars 5894 5895Forza il programma a interpretare il dataset in uso secondo la struttura 5896specificata. 5897 5898Nella prima forma del comando, la periodicità, che deve essere un valore 5899intero, nel caso delle serie storiche rappresenta la frequenza delle 5900osservazioni (1 = annuale; 4 = trimestrale; 12 = mensile; 52 = settimanale; 59015, 6, o 7 = giornaliera; 24 = oraria). Nel caso di dati panel, la 5902periodicità è il numero di righe per ogni blocco di dati, ossia il numero 5903di unità cross section se i dati sono organizzati come pila di dati cross 5904section, o il numero di periodi se i dati sono organizzati come pila di 5905serie storiche. Nel caso di semplici dati cross section, la periodicità 5906dev'essere impostata a 1. 5907 5908L'osservazione iniziale rappresenta la data iniziale nel caso delle serie 5909storiche. Gli anni possono essere indicati con due o quattro cifre, mentre i 5910sotto-periodi (ad esempio i trimestri o i mesi) devono essere separati dagli 5911anni con un carattere "due punti". Nel caso di dati panel, l'osservazione 5912iniziale va indicata come 1:1, mentre nel caso di dati cross section come 1. 5913L'osservazione iniziale per i dati giornalieri o settimanali va indicata 5914nella forma AA/MM/GG o AAAA/MM/GG (oppure semplicemente 1 per i dati non 5915datati). 5916 5917Alcune periodicità temporali hanno interpretazioni convenzionali; ad 5918esempio, 12 = mensile e 4 = trimestrale. Se questa interpretazione non si 5919applica alle vostre serie storiche,si può usare l'opzione 5920--special-time-series. In tal caso, gretl si asterrà dall'indicare come (ad 5921esempio) mensile una periodicità pari a 12. 5922 5923Se non viene data alcuna opzione esplicita per indicare la struttura dei 5924dati, il programma tenterà di desumerla dalle informazioni in suo possesso. 5925 5926La seconda forma del comando (che richiede l'uso dell'opzione --panel-vars) 5927può essere usata per imporre un'interpretazione panel dei dati, quando il 5928dataset contiene variabili che identificano in modo univoco le unità cross 5929section e i periodi. Il dataset verrà ordinato come pila di serie storiche, 5930per valori crescenti della variabile che rappresenta le unità, 5931variabile-unità. 5932 5933Opzioni specifiche per dati panel 5934 5935Le opzioni --panel-time e --panel-groups possono essere usate solo con 5936dataset già impostati come panel. 5937 5938La funzione di --panel-time è di stabilire informazioni extra sulla 5939dimesnione temporale del panel. Essa deve essere indicata sul modello della 5940proma forma di setobs (vedi sopra). Ad esempio, il compando seguente indica 5941che la dimensione temporale del panel è trimestrale, e comincia nel primo 5942trimestre 1990. 5943 5944 setobs 4 1990:1 --panel-time 5945 5946La funzione di --panel-groups è di creare una serie con valori stringa 5947contentent i nomi delle unità longitudinal inel panel. (Quest'informazione 5948verrà, eventualmente, usata nei grafici.) Con quest'opzione vanno indicati 5949uno o due argomenti, come segue. 5950 5951Caso uno: l'unico argomento è il nome di una serie a valori stringa. Se il 5952numero di stringhe diverse eguaglia il numero di unità nel panel, allora 5953questi vengono usati come nomi dei gruppi. Se necessario, il contenuto 5954numerico della serie sarà aggiustato per far sì che i valori siano tutti 1 5955per la prima unità, 2 per la seconda eccetera. Se il numero di valori 5956stringa non corrisponde a quello delle unità, il programma segnala un 5957errore. 5958 5959Caso due: il primo argomento è il nome di una serie e il secondo è una 5960stringa (o il nome di una variabile stringa) con etichette per ciascuna 5961unità. Se la serie non esiste, verrà creata al momento. Nel secondo 5962argomento, i nomi delle unità vanno separati da spazi; se il nome stesso 5963include degli spazi, allora va racchiuso fra virgolette doppie. Se no, il 5964secondo argomento può essere un array di stringhe. 5965 5966Ad esempio, il codice seguente creerò una serie di nome paese in cui i nomi 5967npaesi sono ripetuti ognuno T volte, dove T è l'ampiezza temporale del 5968panel. 5969 5970 string npaesi = sprintf("Francia Germania Italia \"Regno Unito\"") 5971 setobs paese npaesi --panel-groups 5972 5973Accesso dal menù: Dati/Struttura dataset 5974 5975# setopt Programming 5976 5977Argomenti: command [ action ] options 5978Esempi: setopt mle --hessian 5979 setopt ols persist --quiet 5980 setopt ols clear 5981 5982Questo comando abilita la preselezione di opzioni per un dato comando. Di 5983solito questo non è necessario, ma potrebbe essere utile per chi scrive 5984funzioni in hansl, quando certe opzioni devono essere rese condizionali a un 5985argomento fornito dal livello chiamante. 5986 5987Ad esempio, se una funnzione prevede un argomento booleano "quiet", il cui 5988effetto è sopprimere la stampa dei risultati di una regressione eseguita 5989dentro la funzione, si può usare "setopt" come segue: 5990 5991 if quiet 5992 setopt ols --quiet 5993 endif 5994 ols ... 5995 5996L'opzione --quiet verrà applicata al comando ols seguente se e solo se la 5997variabile quiet è non-zero. 5998 5999Di default, le opzioni specificate in questo modo si applicano solo alla 6000prima invocazione del comando a cui si riferiscono; non sono persistenti. 6001Tuttavia, usando persist come valore per action, le opzioni scelte saranno 6002attive fino a nuovo ordine. L'antidoto a persist è clear, che ha l'effetto 6003di cancellare tutte le opzioni stabilite in precedenza. 6004 6005Si noti che le opzioni fissate con setopt si sommano a qualsiasi altra 6006opzione data al comando direttamente. Per esempio, si può dare l'opzione 6007--hessian a un comando mle incondizionatamente e allo stesso tempo usare 6008setopt per aggiungere --quiet condizionalmente. 6009 6010# shell Utilities 6011 6012Argomento: comando-shell 6013Esempi: ! ls -al 6014 ! notepad 6015 launch notepad 6016 6017Un "!", o la parola chiave "launch", all'inizio di una riga di comando è 6018interpretato come passaggio all'interprete di comandi (shell) usato 6019dall'utente nel sistema operativo. In questo modo è possibile eseguire 6020comandi shell arbitrari dall'interno di gretl. Quando si usa "!", il comando 6021esterno viene eseguito in modalità sincrona, ossia gretl aspetta il termine 6022della sua esecuzione prima di procedere. Se invece si vuole avviare un altro 6023programma da dentro gretl senza aspettare che abbia completato la sua 6024esecuzione (modalità asincrona), occorre usare "launch". 6025 6026Per motivi di sicurezza, questa funzionalità è disabilitata in modalità 6027predefinita. Per attivarla, occorre selezionare la casella "Abilita comandi 6028shell" nel menù File, Preferenze. In questo modo si renderanno disponibili 6029i comandi shell anche nella modalità a riga di comando di gretl (questo è 6030l'unico modo per farlo). 6031 6032# smpl Dataset 6033 6034Varianti: smpl oss-iniziale oss-finale 6035 smpl +i -j 6036 smpl variabile-dummy --dummy 6037 smpl condizione --restrict 6038 smpl --no-missing [ lista-variabili ] 6039 smpl --no-all-missing [ lista-variabili ] 6040 smpl --contiguous [ lista-variabili ] 6041 smpl n --random 6042 smpl full 6043Opzioni: --dummy (l'argomento è una variabile dummy) 6044 --restrict (applica una restrizione booleana) 6045 --replace (rimpiazza tutte le restrizioni booleane preesistenti) 6046 --no-missing (restringi il campione alle osservazioni valide) 6047 --no-all-missing (ometti le osservazioni vuote (vedi oltre)) 6048 --contiguous (vedi oltre) 6049 --random (forma un sottocampione casuale) 6050 --permanent (vedi oltre) 6051 --balanced (dati panel: mantieni, ove possibile, un campione bilanciato) 6052Esempi: smpl 3 10 6053 smpl 1960:2 1982:4 6054 smpl +1 -1 6055 smpl x > 3000 --restrict 6056 smpl y > 3000 --restrict --replace 6057 smpl 100 --random 6058 6059Reimposta l'intervallo del campione. Il nuovo intervallo può essere 6060definito in vari modi. Nel primo modo (corrispondente ai primi due esempi 6061precedenti) oss-iniziale e oss-finale devono essere coerenti con la 6062periodicità dei dati. Una delle due può essere sostituita da un punto e 6063virgola per lasciare intatto il valore attuale. Nel secondo modo, gli interi 6064i e j (che possono essere positivi o negativi e vanno indicati con il segno) 6065sono presi come spostamenti relativi ai punti iniziale e finale del campione 6066in uso. Nel terzo modo, variabile-dummy deve essere una variabile 6067indicatrice che assume solo valori 0 o 1 e il campione verrà ristretto alle 6068osservazioni per cui la variabile dummy vale 1. Il quarto modo, che usa 6069--restrict, limita il campione alle osservazioni che soddisfano la 6070condizione Booleana specificata secondo la sintassi del comando "genr". 6071 6072Le opzioni no-missing e no-all-missing possono essere usate per escludere 6073dal campione dati mancanti. La prima variante esclude le osservazioni in cui 6074almeno una variabile è mancante, mentre la seconda esclude solo le 6075osservazioni per cui tutte le variabili hanno valori validi (non mancanti). 6076In ambedue i casi, il test è limitato alle variabili in lista-variabili se 6077l'opzione ha un argomento; se no, viene applicato a tutte le serie nel 6078dataset; a parte che nel caso --no-all-missing senza un'esplicita 6079lista-variabili, le variaili generiche index e time vengono ignorate. 6080 6081La forma --contiguous viene usata nei dataset di serie storiche. L'effetto 6082è quello di tagliare il campione all'inizio e alla fine finché vengano 6083trovate osservazioni con valori mancanti (per la lista specificata, o per 6084tutte le serie se lista-variabili non è specificata). Dopodiché viene 6085effettuato un controllo per vedere se nel sottocampione risultante rimangono 6086valori mancanti, nel qual caso, viene segnalato un errore. 6087 6088Con la forma --random, viene estratto casualmente dal dataset il numero 6089indicato di osservazioni. Per essere in grado di replicare questa selezione, 6090occorre per prima cosa impostare il seme del generatore di numeri casuali 6091(si veda il comando "set"). 6092 6093La forma finale, smpl full, ripristina l'intervallo completo del campione. 6094 6095Si noti che i vincoli sul campione di solito sono cumulativi: il valore di 6096riferimento di ogni comando smpl è il campione attuale, così che ogni 6097vincolo si aggiunge a quelli già impostati. Se si vuole che il comando 6098funzioni sostituendo i vincoli esistenti, occorre usare l'opzione --replace 6099alla fine del comando. 6100 6101La variabile interna obs può essere usata con la forma --restrict di smpl 6102per escludere particolari osservazioni dal campione. Ad esempio, 6103 6104 smpl obs!=4 --restrict 6105 6106scarterà la quarta osservazione. Se le osservazioni sono identificate da 6107etichette, 6108 6109 smpl obs!="USA" --restrict 6110 6111scarterà l'osservazione a cui è associata l'etichetta "USA". 6112 6113Per le forme --dummy, --restrict e --no-missing di smpl, occore tenere 6114presente che tutte le informazioni "strutturali" contenute nel file dei dati 6115(a proposito della struttura di serie storiche o di panel dei dati) vengono 6116perse. È possibile reimpostare la struttura originale con il comando 6117"setobs". Un'opzione rilevante, per l'uso coi dati panel, è l'opzione 6118--balanced: quest'opzione serve a fare in modo che vengsa ricostituito un 6119campione bilanciato dopo il sottocampionamento, per mezzo dell'inserimento 6120di "righe mancanti" se necessario. Si noti, tuttavia, che non sempre è 6121possibile onorare questa richiesta. 6122 6123Di default, le restrizioni sul campione attivo sono reversibili: col comando 6124smpl full si ritorna al dataset completo. Tuttavia, con l'opzione 6125--permanent il dataset ridotto rimpiazza quello originale. Quest'opzione è 6126disponibile per le opzioni --restrict, --dummy, --no-missing, 6127--no-all-missing o --random. 6128 6129Si veda la guida all'uso di gretl (il capitolo 5) per ulteriori dettagli. 6130 6131Accesso dal menù: /Campione 6132 6133# spearman Statistics 6134 6135Argomenti: x y 6136Opzione: --verbose (mostra i dati ordinati) 6137 6138Mostra il coefficiente di correlazione di rango di Spearman per le variabili 6139x e y. Le variabili non devono essere state ordinate manualmente in 6140precedenza, se ne occupa la funzione. 6141 6142L'ordinamento automatico è dal massimo al minimo (ossia il valore massimo 6143nei dati assume il rango 1). Se occorre invertire l'ordinamento, creare una 6144variabile che è il negativo della variabile originale, ad esempio: 6145 6146 genr altx = -x 6147 spearman altx y 6148 6149Accesso dal menù: /Modello/Stima robusta/SPEARMAN - Correlazione di rango 6150 6151# sprintf Printing 6152 6153Questo comando è obsoleto: al suo posto, usare la funzione "sprintf". 6154 6155# square Transformations 6156 6157Argomento: lista-variabili 6158Opzione: --cross (genera anche i prodotti incrociati, oltre ai quadrati) 6159 6160Genera nuove variabili che sono i quadrati delle variabili nella 6161lista-variabili (con anche i prodotti incrociati, se si usa l'opzione 6162--cross). Ad esempio, "square x y" genera sq_x = x al quadrato, sq_y = y al 6163quadrato e (opzionalmente) x_y = x per y. Se una particolare variabile è 6164una dummy, non ne viene fatto il quadrato, visto che si otterrebbe la stessa 6165variabile. 6166 6167Accesso dal menù: /Aggiungi/Quadrati delle variabili selezionate 6168 6169# stdize Transformations 6170 6171Argomento: varlist 6172Opzioni: --no-df-corr (non effettua correzioni per gradi di libertà) 6173 --center-only (non divide per lo sqm) 6174 6175Per impostazione predefinita, questo comando aggiunge al dataset come nuove 6176serie la versione standardizzata di quelle originali, col prefisso s_. Ad 6177esempio, "stdize x y" crea le nuove serie s_x e s_y, s_x ognuna delle quali 6178viene formata sottraendo la rispettiva media, dopodiché il risultato viene 6179diviso per il suo scarto quadratico medio (con una correzione per gradi di 6180libertà pari a 1). 6181 6182Con l'opzione --no-df-corr non si ha la correzione per gradi di libertà, e 6183si usa il cosiddetto stimatore ML. Con l'opzione --center-only verranno 6184prodotte serie che sono soltanto centrate (la media viene sottratta ma i 6185dati non vengono scalati). In questo caso, il prefisso sarà c_ anziché s_. 6186 6187La funzione "stdize" produce lo stesso risultato, ma la sua sintassi è un 6188po' più flessibile. 6189 6190Accesso dal menù: /Aggiungi/Standardizza le variabili selezionate 6191 6192# store Dataset 6193 6194Argomenti: file-dati [ lista-variabili ] 6195Opzioni: --omit-obs (si veda oltre, a proposito del formato CSV) 6196 --no-header (si veda oltre, a proposito del formato CSV) 6197 --gnu-octave (usa il formato GNU Octave) 6198 --gnu-R (usa il formato GNU R) 6199 --gzipped[=livello] (comprime con gzip) 6200 --jmulti (usa il formato ASCII di JMulti) 6201 --dat (usa il formato ASCII di PcGive) 6202 --decimal-comma (usa la virgola come separatore decimale) 6203 --database (usa il formato database di gretl) 6204 --overwrite (cfr oltre, a proposito del formato dei database) 6205 --comment=string (vedi sotto) 6206 --matrix=nome-matrice (vedi sotto) 6207 --compat (compatibilità gdtb, vedi sotto) 6208 6209Salva i dati nel file filename. Per default, vengono salvate tutte le serie 6210attualmente definite, ma usando l'argomento opzionale varlist è possibile 6211salvarne solo una parte. Se il dataset è sottocampionato, verranno salvate 6212solo le osservazioni attualmente attive. 6213 6214Il file di output verrà scritto nella directory corrispondente al valore 6215corrente di "workdir", a meno che il nome di file contenga un percorso 6216completo. 6217 6218Il comando store funziona in modo speciale se è compreso in un "progressive 6219loop". Vedi la guida all'uso di gretl (il capitolo 13) per dettagli. 6220 6221Formati nativi 6222 6223Se file-dati ha estensione .gdt o .gtdb, il salvataggio avverrà in uno dei 6224formati nativi di gretl. Se non viene specificata alcuna estensione, si dà 6225.gdt come scelta implicita e il suffisso viene aggiunto automaticamente. Il 6226formato gdt è XML, con compressione gzip opzionale, mentre il formato gdtb 6227è binario. Il primo è la scelta tipica per dati di dimensione moderata 6228(fino a qualche centinaio di kilobyte); per dataset grandi, il formato 6229binario è molto più efficiente. 6230 6231A partire dalla versione 2021a, il formato gdtb è stato modificato in modo 6232da velocizzare la lettura e scrittura di file molto grandi. Per salvare col 6233vecchio formato, così che il file sia leggibile con versioni precedenti di 6234gretl, si deve usare l'opzione --compat. 6235 6236Quando si salva in formato nativo, l'opzione --gzipped abilita la 6237compressione, cosa che può essere utile per grandi dataset. Pewr questa 6238opzione, il parametro opzione controla il livello di compressione (da 0 a 62399): livelli più alti producono file più piccoli, ma in tempi più lunghi. 6240Il valore di default è 1; col livello 0 non c'è alcuna compressione. 6241 6242Altri formati 6243 6244Il formato in cui i dati vengono salvati è controllato, in primo luogo 6245dall'estensione di filename, come segue: 6246 6247 .csv: testo separato da virgole (CSV). 6248 6249 .txt o .asc: testo separato da spazi. 6250 6251 .m: formato GNU Octave. 6252 6253 .dta: formato Stata (version 113). 6254 6255Le opzioni di formato mostrate sopra possono essere usate per forzare un 6256certo formato indipendentemente dall'estensione data al file, o per generare 6257un file di formato PcGive o JMulTi 6258 6259Le opzioni --omit-obs e --no-header sono applicabile solo quando si salvano 6260dati in formato CSV. In modalità predefinita, se i dati sono serie storiche 6261o panel, o se il dataset include marcatori per osservazioni specifiche, il 6262file CSV comprende una prima colonna che identifica le osservazioni (ad 6263esempio per data). Se si usa --omit-obs, questa colonna verrà omessa e 6264verranno salvati solo i dati effettivi. L'opzione --no-header fa sì che 6265venga omessa la stampa dei nomi di variabile in cima al file. 6266 6267L'opzione --decimal-comma è anch'essa specifica al salvgataggio in formato 6268CSV, e fa sì che venga usata la virgola come separatore decimale e il punto 6269e virgola come separatore di campo. 6270 6271Salvataggio in formato database 6272 6273L'opzione di salvataggio in formato database di gretl è indicata se occorre 6274costruire dei grandi dataset di serie, magari con frequenze diverse e 6275diversi intervalli di osservazioni. Al momento questa opzione è disponibile 6276solo per dati annuali, trimestrali o mensili. Salvando su un file che esiste 6277già, il comportamento predefinito è quello di accodare le nuove serie al 6278contenuto del database preesistente. In questo contesto, se una o più delle 6279variabili da salvare hanno lo stesso nome di una delle variabili già 6280presenti nel database si otterrà un messaggio di errore. L'opzione 6281--overwrite permette invece di sovrascrivere eventuali variabili del dataset 6282che hanno lo stesso nome delle nuove variabili, in modo che queste ultime 6283rimpiazzino le variabili preesistenti. 6284 6285L'opzione --comment è disponibile quando si salva come database o come CSV. 6286Il parametro richiesto consta du una linea, racchiusa da virgolette doppie, 6287passata all'opzone dopo un segno di uguale. Tale stringa verrà inserita 6288come commento nel file indice del database o all'inizio del file CSV. 6289 6290Salvare una matrice come dataset 6291 6292L'opzione --matrix richiede, come parametro, il nome di una matrice non 6293vuota. L'effetto del comando store sarà quello di trasformare la matrice in 6294un dataset "dietro le quinte" e salvarlo su file come tale. Le colonne della 6295matrice diventano serie, e i loro nomi sono dati dai nomi di colonn, se 6296presenti; altrimenti, saranno dati da v1, v2 e così via. Se la matrice ha 6297nomi di riga, questi verranno convertiti in "etichette di osservazione". 6298 6299Si noti che la funzione "mwrite" permette di salvare su file matrici in 6300quanto tali, ma a volte può essere più utile salvarle come dataset. 6301 6302Accesso dal menù: /File/Salva dati; /File/Esporta dati 6303 6304# summary Statistics 6305 6306Varianti: summary [ lista ] 6307 summary --matrix=nomematrice 6308Opzioni: --simple (solo statistiche di base) 6309 --weight=wvar (variabile peso) 6310 --by=byvar (vedi sotto) 6311Esempi: frontier.inp 6312 6313Nella prima forma, mostra le statistiche descrittive per le variabili nella 6314lista-variabili, o per tutte le variabili nel dataset, se non si indica una 6315lista-variabili. L'output comprende media, scarto quadratico medio, 6316coefficiente di variazione (= scarto quadratico medio / media), mediana, 6317minimo, massimo, coefficiente di asimmetria, curtosi in eccesso. Dando 6318l'opzione --simple, si avranno soltanto media, minimo, massimo e scarto 6319quadratico medio. 6320 6321L'opzione --by (dove il parametro byvar dev'essere il nome di una variabile 6322discreta), provoca la stampa delle statistiche per sottocampioni definiti 6323dai diversi valori di byvar. Ad esempio, se byvar è una variabile binaria 6324(dummy), verranno riportate separatamente le statistiche relative ai 6325sottocampioni definitia dai due casi byvar = 0 e byvar = 1. Nota: al 6326momento, questa opzione è incompatibile con l'altra opzione --weight. 6327 6328Se si usa la forma alternativa in cui il parametro è una matrice, allora le 6329statistiche descrittive sono calcolate per le colonne della matrice. 6330L'opzione --by non è disponibile per questo caso. 6331 6332La tavola prodotta dal comando summary è disponibile sotto forma di matrice 6333con l'accessore "$result". 6334 6335Accesso dal menù: /Visualizza/Statistiche descrittive 6336Accesso alternativo: Menù pop-up nella finestra principale 6337 6338# system Estimation 6339 6340Varianti: system method=stimatore 6341 nome-sistema <- system 6342Esempi: "Klein Model 1" <- system 6343 system method=sur 6344 system method=3sls 6345 Vedi anche klein.inp, kmenta.inp, greene14_2.inp 6346 6347Inizia un sistema di equazioni. Esistono due versioni del comando, a seconda 6348che si voglia salvare il sistema per poterlo stimare in più modi diversi, 6349oppure stimare il sistema una volta sola. 6350 6351Per salvare il sistema occorre dargli un nome, come nel primo esempio 6352proposto (se il nome contiene spazi, occorre racchiuderlo tra virgolette). 6353In questo caso, è possibile stimare il sistema con il comando "estimate". 6354Una volta che il sistema è stato salvato, è possibile imporre dei vincoli 6355su di esso (compresi vincoli incrociati tra equazioni) usando il comando 6356"restrict". 6357 6358In alternativa, è possibile indicare uno stimatore per il sistema usando 6359method= seguito da una stringa che identifica uno degli stimatori 6360supportati: "ols" (ordinary least squares - minimi quadrati ordinari), 6361"tsls" (two-stage least squares - minimi quadrati a due stadi), "sur" 6362(seemingly unrelated regressions - regressioni apparentemente non 6363collegate), "3sls" (three-stage least squares - minimi quadrati a tre 6364stadi), "fiml" (full information maximum likelihood - massima 6365verosimiglianza con informazione completa) o "liml" (limited information 6366maximum likelihood - massima verosimiglianza con informazione limitata). In 6367questo caso, il sistema viene stimato appena completata la sua definizione. 6368 6369Un sistema di equazioni termina con la riga "end system". All'interno del 6370sistema possono essere definiti i quattro tipi di istruzioni seguenti. 6371 6372 "equation": specifica un'equazione del sistema. Occorre indicarne almeno 6373 due. 6374 6375 "instr": per i sistemi da stimare con i minimi quadrati a tre stadi, 6376 indica la lista degli strumenti (indicati dal nome o dal numero della 6377 variabile). In alternativa, è possibile fornire questa informazione nella 6378 riga "equation" usando la stessa sintassi accettata dal comando "tsls". 6379 6380 "endog": per i sistemi di equazioni simultanee, indica la lista delle 6381 variabili endogene. È indicato principalmente per la stima FIML, ma può 6382 essere usato anche nella stima minimi quadrati a tre stadi al posto 6383 dell'istruzione "instr": in questo modo tutte le variabili non 6384 identificate come endogene verranno usate come strumenti. 6385 6386 "identity": per la stima FIML, un'identità che collega due o più 6387 variabili del sistema. Questo tipo di istruzione è ignorata se viene 6388 usato uno stimatore diverso da FIML. 6389 6390Dopo la stima eseguita con i comandi "system" o "estimate" è possibile 6391recuperare informazioni aggiuntive dalle seguenti variabili accessorie: 6392 6393 "$uhat": la matrice dei residui, una colonna per equazione. 6394 6395 "$yhat": la matrice dei valori stimati, una colonna per equazione. 6396 6397 "$coeff": il vettore colonna dei coefficienti (tutti i coefficienti della 6398 prima equazione, seguiti da quelli della seconda equazione, e così via). 6399 6400 "$vcv": la matrice di covarianza dei coefficienti. Se il vettore "$coeff" 6401 ha k elementi, questa matrice ha dimensione k per k. 6402 6403 "$sigma": la matrice di covarianza dei residui incrociata tra equazioni. 6404 6405 "$sysGamma", "$sysA" e "$sysB": matrici dei coefficienti in forma 6406 strutturale (si veda oltre). 6407 6408Se si vuole salvare i residui o i valori stimati per una specifica equazione 6409come serie di dati, basta selezionare la colonna dalla matrice "$uhat" o 6410"$yhat" e assegnarla a una serie, come in 6411 6412 series uh1 = $uhat[,1] 6413 6414Le matrici in forma strutturale corrispondono alla seguente rappresentazione 6415di un modello ad equazioni simultanee: 6416 6417 Gamma y(t) = A y(t-1) + B x(t) + e(t) 6418 6419Se ci sono n variabili endogene e k variabili esogene, Gamma è una matrice 6420n x n e B è n x k. Se il sistema non contiene ritardi delle variabili 6421endogene, la matrice A non è presente. Se il massimo ritardo di un 6422regressore endogeno è p, la matrice A è n x np. 6423 6424Accesso dal menù: /Modello/Equazioni simultanee 6425 6426# tabprint Printing 6427 6428Opzioni: --format="f1|f2|f3|f4" (Specifica un formato personalizzato) 6429 --output=filename (invia l'output al file specificato) 6430 6431Va eseguito dopo la stima di un modello. Stampa il modello stimato sotto 6432forma di tabella, in formato LaTeX o in formato RTF o CSV, se viene usata 6433l'opzione corrispondente. Se viene specificato un nome di file dopo 6434l'opzione --output, l'output viene scritto nel file, altrimenti viene 6435scritto in un file col nome model_N.tex (o model_N.rtf), dove N è il numero 6436dei modelli stimati finora nella sessione in corso. 6437 6438Il file di output verrà scritto nella directory corrispondente al valore 6439corrente di "workdir", a meno che il nome di file contenga un percorso 6440completo. 6441 6442Selezionando il formato CSV, i valori sono separati da virgole, a meno che 6443il delimitatore decimale non sia esso stesso la virgola, nel qual caso viene 6444usato il punto e virgola. Si noti che l'output in CSV potrebbe essere meno 6445completo degli altri formati. 6446 6447Le opzioni illustrate di seguito sono disponibili solo per il formato LaTeX. 6448 6449Usando l'opzione --complete, il file LaTeX è un documento completo, pronto 6450per essere processato; altrimenti il file va incluso in un documento. 6451 6452Se si intende modificare lo stile del formato tabulare, è possibile 6453specificare un formato personalizzato usando l'opzione --format, seguita da 6454una stringa di formato. La stringa di formato va inclusa tra virgolette 6455doppie e deve essere unita all'opzione con un segno di uguale. La 6456composizione della stringa di formato è la seguente: ci sono quattro campi, 6457che rappresentano il coefficiente, l'errore standard, il rapporto t e il 6458p-value. Questi campi vanno separati usando barre verticali e possono 6459contenere una specificazione di formato per valori numerici nello stile 6460della funzione printf, oppure possono essere lasciati in bianco, in modo da 6461sopprimere la visualizzazione del campo nella rispettiva colonna dela 6462tabella (con l'unico vincolo che non è possibile lasciare in bianco tutti i 6463campi). Ecco alcuni esempi: 6464 6465 --format="%.4f|%.4f|%.4f|%.4f" 6466 --format="%.4f|%.4f|%.3f|" 6467 --format="%.5f|%.4f||%.4f" 6468 --format="%.8g|%.8g||%.4f" 6469 6470La prima specificazione stampa i valori di tutte le colonne usando 4 cifre 6471decimali. La seconda sopprime il p-value e mostra il rapporto t con 3 cifre 6472decimali. La terza omette il rapporto t, mentre l'ultima omette il rapporto 6473t e mostra sia il coefficiente che l'errore standard con 8 cifre 6474significative. 6475 6476Una volta che si imposta un formato in questo modo, esso viene ricordato e 6477usato per tutta la sessione di lavoro. Per tornare ad usare il formato 6478predefinito, basta usare la parola chiave --format=default. 6479 6480Accesso dal menù: Finestra del modello, /LaTeX 6481 6482# textplot Graphs 6483 6484Argomento: lista-variabili 6485Opzioni: --time-series (disegna per osservazione) 6486 --one-scale (forza l'uso di un'unica scala) 6487 --tall (usa 40 linee) 6488 6489Grafica ASCII nuda e cruda. Senza l'opzione --time-series, varlist deve 6490contenere almeno due serie, l'ultima delle quali va sull'asse delle ascisse, 6491e verrà prodotto un diagramma a dispersione. In questo caso, si può usare 6492l'opzione --tall per produrre un grafico in cui l'asse y è rappresentato da 649340 righe di caratteri (il default è 20 righe). 6494 6495Con l'opzione --time-series, viene prodotto un grafico per osservazione. In 6496questo caso, l'opzione --one-scale forza l'uso di una scala singola; 6497altrimenti, se varlist contiene più di una serie i dati potrebbero essere 6498riscalati. Ogni riga rappresenta un'osservazione, con i dati disegnati 6499orizzontalmente. 6500 6501Vedi anche "gnuplot". 6502 6503# tobit Estimation 6504 6505Argomenti: variabile-dipendente variabili-indipendenti 6506Opzioni: --llimit=lval (specifica il limite sinistro) 6507 --rlimit=rval (specifica il limite destro) 6508 --vcv (mostra la matrice di covarianza) 6509 --robust (standard error robusti) 6510 --opg (vedi sotto) 6511 --cluster=clustvar (vedi "logit" per una spiegazione) 6512 --verbose (mostra i dettagli delle iterazioni) 6513 6514Stima un modello Tobit. Il modello può essere appropriato quando la 6515variabile dipendente è "censurata". Ad esempio, vengono osservati valori 6516positivi o nulli della spesa dei consumatori per beni durevoli, ma non 6517valori negativi; tuttavia le decisioni di spesa possono essere pensate come 6518derivanti da una propensione al consumo, sottostante e non osservata, che 6519può anche essere negativa in alcuni casi. 6520 6521Si assume, di default, che la variabile dipendente si censurata a 0 sulla 6522sinistra e non censurata a destra. Tuttavia, usando le opzioni --llimit e 6523--rlimit si può specificare uno schema di censura diverso. Se si specifica 6524soltanto un limite destro, si assume che la variabile dipendente sia non 6525limitata a sinistra. 6526 6527Il modello Tobit è un caso particolare della regressione ad intervallo. Si 6528veda la documentazione del comando "intreg" per una descrizione delle 6529opzioni --robust e --opg. 6530 6531Accesso dal menù: /Modello/Modelli non lineari/Tobit 6532 6533# tsls Estimation 6534 6535Argomenti: variabile-dipendente variabili-indipendenti ; strumenti 6536Opzioni: --no-tests (omette i test diagnostici) 6537 --vcv (mostra la matrice di covarianza) 6538 --quiet (non stampare i risultati) 6539 --no-df-corr (omette la correzione per gradi di libertà) 6540 --robust (errori standard robusti) 6541 --cluster=clustvar (standard error clusterizzati) 6542 --liml (usa massima verosimiglianza a informazione limitata) 6543 --gmm (usa il metodo generalizzato dei momenti) 6544Esempi: tsls y1 0 y2 y3 x1 x2 ; 0 x1 x2 x3 x4 x5 x6 6545 Vedi anche penngrow.inp 6546 6547Calcola le stime con variabili strumentali, per impostazione predefinita 6548usando i minimi quadrati a due stadi (TSLS), ma è possibile scegliere altre 6549opzioni. Occorre specificare la variabile-dipendente, la lista di 6550variabili-indipendenti (che si intende includere alcuni regressori 6551endogeni), e infine gli strumenti, la lista completa delle variabili esogene 6552e predeterminate. Se la lista degli strumenti non è lunga almeno quanto 6553quella delle variabili-indipendenti, il modello non è identificato. 6554 6555Nell'esempio precedente, le y sono le variabili endogene e le x sono le 6556variabili esogene e predeterminate. Si noti che eventuali regressori esogeni 6557devono essere inclusi in entrambe le liste. 6558 6559L'output delle stime TSLS comprende il test di Hausman e, se il modello è 6560sovra-identificato, il test di Sargan per la sovra-identificazione. Nel test 6561di Hausman, l'ipotesi nulla è che le stime OLS siano consistenti, o in 6562altre parole che non sia richiesta la stima per mezzo di variabili 6563strumentali. Un modello di questo tipo è sovra-identificato se ci sono più 6564strumenti di quelli strettamente necessari. Il test di Sargan è basato su 6565una regressione ausiliaria dei residui del modello minimi quadrati a due 6566stadi sull'intera lista degli strumenti. L'ipotesi nulla è che tutti gli 6567strumenti siano validi, cosa di cui si dovrebbe dubitare se la regressione 6568ausiliaria ha un significativo potere esplicativo. Davidson e MacKinnon 6569(2004) al capitolo 8 forniscono un'eccellente spiegazione di entrambi i 6570test. 6571 6572Per gli stimatori TSLS e LIML, viene mostrata una statistica aggiuntiva se 6573il modello è stimato senza l'opzione --robust, che riguarda la presenza di 6574strumenti deboli. Con sttrumenti deboli, possono esserci seri problemi 6575inferenziali: stime distorte e/o livelli di significatività sbagliati per 6576le statistiche test basate sulla matrice di covarianze, con tassi di rifiuto 6577ben più grandi del livello di significatività nominale (Stock, Wright and 6578Yogo, 2002). La statistica è la F di primo stadio se il modello contiene un 6579solo regressore endogeno, o il più piccolo autovalore della matrice 6580corrispondente in caso contrario. Quando disponibili, sono mostrati i valori 6581critici derivati dall'analisi di Monte Carlo contenuta in Stock e Yogo 6582(2003). 6583 6584Il valore R-quadro mostrato i modelli stimati con i minimi quadrati a due 6585stadi è il quadrato della correlazione tra la variabile dipendente e i 6586valori stimati. 6587 6588Per dettagli sull'effetto delle opzioni --robust e --cluster si veda la 6589documentazione per il comando "ols". 6590 6591In alternativa al metodo TSLS, il modello può essere stimato usando la 6592massima verosimiglianza a informazione limitata (opzione --liml) o il metodo 6593generalizzato dei momenti (opzione --gmm). Si noti che se il modello è 6594esattamente identificato, questi metodi dovrebbero produrre gli stessi 6595risultati del metodo TSLS, ma se il modello è sovraidentificato, i 6596risultati saranno in genere diversi. 6597 6598Se si usa la stima GMM, è possibile usare le seguenti opzioni aggiuntive: 6599 6600 --two-step: esegue la stima GMM in due passi, invece che in un passo solo. 6601 6602 --iterate: itera il GMM fino alla convergenza. 6603 6604 --weights=Pesi: specifica una matrice quadrata di pesi da usare nel 6605 calcolo della funzione criterio del GMM. La dimensione di questa matrice 6606 deve essere pari al numero di strumenti. L'impostazione predefinita 6607 consiste nell'usare una matrice identità di dimensione opportuna. 6608 6609Accesso dal menù: /Modello/TSLS - Minimi quadrati a due stadi 6610 6611# var Estimation 6612 6613Argomenti: ordine lista-variabili [ ; lista-esogene ] 6614Opzioni: --nc (non include una costante) 6615 --trend (include un trend) 6616 --seasonals (include variabili dummy stagionali) 6617 --robust (errori standard robusti) 6618 --robust-hac (errori standard HAC) 6619 --quiet (omette l'output delle singole equazioni) 6620 --silent (non stampa nulla) 6621 --impulse-responses (mostra le risposte di impulse) 6622 --variance-decomp (mostra scomposizioni della varianza) 6623 --lagselect (mostra i criteri di informazione per la selezione dei ritardi) 6624 --minlag=ritardo minimo (solo per la selezione dei ritardi, vedi sotto) 6625Esempi: var 4 x1 x2 x3 ; time mydum 6626 var 4 x1 x2 x3 --seasonals 6627 var 12 x1 x2 x3 --lagselect 6628 Vedi anche sw_ch14.inp 6629 6630Imposta e stima (usando OLS) un'autoregressione vettoriale (VAR). Il primo 6631argomento specifica l'ordine di ritardo (o il massimo ordine di ritardi se 6632è stata usata l'opzione --lagselect). L'ordine può essere indicato 6633numericamente o con il nome di una variabile scalare preesistente. Quindi 6634segue l'impostazione della prima equazione. Non occorre includere i ritardi 6635tra gli elementi della lista-variabili: verranno aggiunti automaticamente. 6636Il punto e virgola separa le variabili stocastiche, per cui verrà incluso 6637un numero di ritardi pari a ordine, dai termini deterministici o esogeni 6638presenti nella lista-esogene. Si noti che viene inclusa automaticamente una 6639costante, a meno che non si usi l'opzione --nc; inoltre è possibile 6640aggiungere un trend con l'opzione --trend e variabili dummy stagionali con 6641l'opzione --seasonals. 6642 6643Benché normalmente un VAR comprenda tutti i ritardi da 1 a un dato ordine, 6644è possibile selezionare un set di ritardi specifico. Per farlo, occorre 6645sostituire l'argomento scalare order col nome di un vettore predefinito o 6646con una lista di ritardi separati da virgole, racchiusi da parentesi graffe. 6647Qui di seguito, mostriamo due modi per specificare un VAR contenente i 6648ritardi 1, 2 e 4 (ma non il 3): 6649 6650 var {1,2,4} ylist 6651 matrix p = {1,2,4} 6652 var p ylist 6653 6654Viene stampata una regressione separata per ognuna delle variabili nella 6655lista-variabili. Il risultato di ogni equazione include i test F per i 6656vincoli di uguaglianza a zero su tutti i ritardi delle variabili, un test F 6657per la significatività del ritardo massimo e, se è stata usata l'opzione 6658--impulse-responses, la scomposizione della varianza della previsione e le 6659funzioni di impulso-risposta. 6660 6661Le scomposizioni della varianza della previsione e le funzioni di risposta 6662di impulso sono basate sulla decomposizione di Cholesky della matrice di 6663covarianza contemporanea, e in questo contesto l'ordine in cui vengono date 6664le variabili stocastiche conta. La prima variabile nella lista viene 6665considerata come la "più esogena" all'interno del periodo. L'orizzonte per 6666le decomposizioni della varianza e le funzioni di impulso-risposta può 6667essere impostato usando il comando "set". Per salvare una specifica risposta 6668di impulso sotto forma di matrice, si veda la funzione "irf". 6669 6670Con l'opzione --robust gli errori standard sono corretti per 6671l'eteroschedsasticità. In alternativa, l'opzione --robust-hac produce 6672errori standard HAC, cioè robusti tanto all'eteroschedasticità che 6673all'autocorrelazione. In generale, la seconda opzione non dovrebbe essere 6674necessaria se il modello include abbastanza ritardi. 6675 6676Se si usa l'opzione --lagselect, il primo parametro del comando var viene 6677interpretato come il massimo ordine di ritardo. In questo caso, il comando 6678produce una tabella che mostra i valori dei criteri di informazione di 6679Akaike (AIC), Schwartz (BIC) e Hannan-Quinn (HQC) calcolati per VAR 6680dall'ordine 1 fino all'ordine massimo indicato. Questa opzione viene usata 6681per scegliere l'ordine del VAR più appropriato, e l'output consueto del VAR 6682non viene mostrato. La tavola coi criteri di informazione è recuperabile 6683sotto forma di matrice tramite l'accessore "$test". In questo contesto, 6684l'opzione --minlag serve a stabilire l'ordine minimo. Usando il valore 0 si 6685ammette la possibilità che il ritardo ottimale sia nullo, e che in realtà 6686il modello non sia affatto un VAR. Al contrario, se si dà per scontato che 6687l'ordine minimo sia 4, con --minlag=4 si risparmia qualche millisecondo. 6688 6689Accesso dal menù: /Modello/Serie storiche/VAR - Autoregressione vettoriale 6690 6691# varlist Dataset 6692 6693Opzione: --type=nometipo (tipo di oggetto mostrato) 6694 6695Di default, mostra un elenco delle variabili disponibili nel dataset. "list" 6696e "ls" sono sinonimi. 6697 6698L'opzione --type deve essere seguita dal segno di uguale e da una delle 6699seguenti parole chiave: series, scalar, matrix, list, string, bundle or 6700accessor. L'effetto è di stampare i nomi di tutti gli oggetti di quel certo 6701tipo attualmente definiti. 6702 6703Un caso particolare è dato quando il tipo è accessor: in questo caso, 6704verrà stampato l'elenco delle variabili interne di tipo "accessore", come 6705ad esempio "$nobs" e "$uhat" (indipendentemente dal tipo). 6706 6707# vartest Tests 6708 6709Argomenti: var1 var2 6710 6711Calcola la statistica F per l'ipotesi nulla che le varianze della 6712popolazione per le variabili var1 e var2 siano uguali e mostra il p-value. 6713La statistica test e il p-value sono disponibili tramite gli accessori 6714"$test" e "$pvalue". Il codice seguente 6715 6716 open AWM18.gdt 6717 vartest EEN EXR 6718 eval $test 6719 eval $pvalue 6720 6721calcola il test e mostra come usare gli accessori: 6722 6723 Equality of variances test 6724 6725 EEN: Number of observations = 192 6726 EXR: Number of observations = 188 6727 Ratio of sample variances = 3.70707 6728 Null hypothesis: The two population variances are equal 6729 Test statistic: F(191,187) = 3.70707 6730 p-value (two-tailed) = 1.94866e-18 6731 6732 3.7070716 6733 1.9486605e-18 6734 6735Accesso dal menù: /Modello/Modelli bivariati/Differenza delle varianze 6736 6737# vecm Estimation 6738 6739Argomenti: ordine rango lista-y [ ; lista-x ] [ ; lista-rx ] 6740Opzioni: --nc (senza costante) 6741 --rc (costante vincolata) 6742 --uc (costante non vincolata) 6743 --crt (costante e trend vincolato) 6744 --ct (costante e trend non vincolato) 6745 --seasonals (include dummy stagionali centrate) 6746 --quiet (omette l'output delle singole equazioni) 6747 --silent (non stampa nulla) 6748 --impulse-responses (mostra impulso-risposta) 6749 --variance-decomp (mostra decomposizioni della varianza delle previsioni) 6750Esempi: vecm 4 1 Y1 Y2 Y3 6751 vecm 3 2 Y1 Y2 Y3 --rc 6752 vecm 3 2 Y1 Y2 Y3 ; X1 --rc 6753 Vedi anche denmark.inp, hamilton.inp 6754 6755Un VECM è un tipo di autoregressione vettoriale, o VAR (si veda "var"), 6756applicabile quando le variabili del modello sono individualmente integrate 6757di ordine 1 (ossia, sono "random walk" con o senza deriva), ma esibiscono 6758cointegrazione. Questo comando è strettamente connesso al test di Johansen 6759per la cointegrazione (si veda "johansen"). 6760 6761Il parametro ordine rappresenta l'ordine di ritardo del sistema VAR. Il 6762numero di ritardi nel VECM (dove la variabile dipendente è data da una 6763differenza prima) è pari a ordine meno uno. 6764 6765Il parametro rango rappresenta il rango di cointegrazione, o in altre parole 6766il numero di vettori di cointegrazione. Questo deve essere maggiore di zero 6767e minore o uguale (in genere minore) al numero di variabili endogene 6768contenute nella lista-y. 6769 6770La lista-y rappresenta l'elenco delle variabili endogene, nei livelli. 6771L'inclusione di trend deterministici nel modello è controllata dalle 6772opzioni del comando. Se non si indica alcuna opzione, viene inclusa una 6773"costante non vincolata", che permette la presenza di un'intercetta diversa 6774da zero nelle relazioni di cointegrazione e di un trend nei livelli delle 6775variabili endogene. Nella letteratura originata dal lavoro di Johansen (si 6776veda ad esempio il suo libro del 1995), si fa riferimento a questo come al 6777"caso 3". Le prime quattro opzioni mostrate sopra, che sono mutualmente 6778esclusive, producono rispettivamente i casi 1, 2, 4 e 5. Il significato di 6779questi casi e i criteri per scegliere tra di essi sono spiegati nella guida 6780all'uso di gretl (il capitolo 33). 6781 6782Le liste opzionali xlist e rxlist permottoni di specificare delle variabili 6783esogene che entrano nel modello senza vincoli (xlist) o solo nello spazio di 6784cointegrazione (rxlist). Queste liste sono separate da ylist e fra loro 6785tramite punto e virgola. 6786 6787L'opzione --seasonals, che può accompagnare una qualsiasi delle altre 6788opzioni, specifica l'inclusione di un gruppo di variabili dummy stagionali 6789centrate. Questa opzione è disponibile solo per dati trimestrali o mensili. 6790 6791Il primo degli esempi mostrati sopra specifica un VECM con ordine di ritardo 6792pari a 4 e un unico vettore di cointegrazione. Le variabili endogene sono 6793Y1, Y2 e Y3. Il secondo esempio usa le stesse variabili ma specifica un 6794ritardo di ordine 3 e due vettori di cointegrazione, oltre a specificare una 6795"costante vincolata", che è appropriata se i vettori di cointegrazione 6796possono avere un'intercetta diversa da zero, ma le variabili Y non hanno 6797trend. 6798 6799Dopo la stima di un VECM sono disponibili alcuni accessori specializzati: 6800$jalpha, $jbeta e $jvbeta contengono, rispettivamente, le matrici α e beta 6801e la varianza stimata di beta. Per accedere a una specifica funzione di 6802risposta di impulso in forma matriciale, si veda la funzione "irf". 6803 6804Accesso dal menù: /Modello/Serie storiche/VECM 6805 6806# vif Tests 6807 6808Opzione: --quiet (soppprime la stampa dei risultati) 6809Esempi: longley.inp 6810 6811Deve seguire la stima di un modello che includa almeno due variabili 6812indipendenti. Calcola e mostra i informazioni diagnostiche relative alla 6813collinearità 6814 6815Il VIF per il regressore j è definito come 6816 6817 1/(1 - Rj^2) 6818 6819dove R_j è il coefficiente di correlazione multipla tra il regressore j e 6820gli altri regressori. Il fattore ha un valore minimo di 1.0 quando la 6821variabile in questione è ortogonale alle altre variabili indipendenti. 6822Neter, Wasserman, e Kutner (1990) suggeriscono di usare il VIF maggiore come 6823test diagnostico per la collinearità; un valore superiore a 10 è in genere 6824considerato indice di un grado di collinearità problematico. 6825 6826Dopo l'esecusione di questo comando, l'accessore "$result" conterrà un 6827vetttore colonna con glil indici VIF. Per un approccio più sofisticato alla 6828diagnosi della collinearità, si vedia il comando "bkw". 6829 6830Accesso dal menù: Finestra del modello, /Test/collinearità 6831 6832# wls Estimation 6833 6834Argomenti: variabile-pesi variabile-dipendente variabili-indipendenti 6835Opzioni: --vcv (mostra la matrice di covarianza) 6836 --robust (errori standard robusti) 6837 --quiet (non mostra i risultati) 6838 --allow-zeros (vedi sotto) 6839 6840Calcola stime con minimi quadrati ponderati (WLS - Weighted Least Squares), 6841prendendo i pesi da variabile-pesi. In pratica, detta w la radice quadrata 6842positiva della variabile-pesi, viene calcolata una regressione OLS di w * 6843variabile-dipendente rispetto a w * variabili-indipendenti. L'R-quadro, 6844comunque, è calcolato in un modo speciale, ossia come 6845 6846 R^2 = 1 - ESS / WTSS 6847 6848dove ESS è la somma dei quadrati degli residui dalla regressione ponderata, 6849mentre WTSS denota la "somma totale ponderata dei quadrati", che è pari 6850alla somma dei quadrati dei residui della regressione della variabile 6851dipendente ponderata sulla sola costante ponderata. 6852 6853Nel caso particolare in cui variabile-pesi sia una variabile dummy, la stima 6854WLS equivale a una stima OLS in cui tutte le osservazioni per cui essa vale 6855zero sono eliminate. In tutti gli altri casi, la presenza di zeri nella 6856variabile di ponderazione è considerata un errore, ma se per qualche motivo 6857si desidera ponderare per una variabile che contenga degli zeri, si può 6858disattivare tale errore usando l'opzione --allow-zeros. 6859 6860Per la stima con minimi quadrati ponderati in un contesto panel, in cui i 6861pesi sono basati sulle varianze delle unità longitudinali, si veda il 6862comando "panel" con l'opzione --unit-weights option. 6863 6864Accesso dal menù: /Modello/Altri modelli lineari/WLS - Minimi quadrati ponderati 6865 6866# xcorrgm Statistics 6867 6868Argomenti: var1 var2 [ maxlag ] 6869Opzioni: --plot=mode-or-filename (vedi sotto) 6870 --quiet (non produrre il grafico) 6871Esempio: xcorrgm x y 12 6872 6873Mostra il correlogramma incrociato per le variabili var1 e var2, che possono 6874essere specificate per nome o per numero. I valori sono i coefficienti di 6875correlazione campionari tra il valore presente di var1 e i valori ritardati 6876e anticipati di var2. 6877 6878Se si indica un valore maxlag, la lunghezza del correlogramma è limitata al 6879numero di ritardi e anticipi indicati, altrimenti è determinata 6880automaticamente in funzione della frequenza dei dati e del numero di 6881osservazioni. 6882 6883Di default, viene prodotto un grafico del correlogramma incrociato: un 6884grafico gnuplot in modo interattivo o un grafico ASCII in modalità batch. 6885Questo comportamento può essere aggiustato con l'opzione --plot. Per essa, 6886i valori accettabili dei parametri sono none (pr sopprimere il grafico); 6887ascii (per produrre un grafico testuale anche se in modo interattivo); 6888display (per produrre un grafico gnuplot anche se in modo batch), o il nome 6889di un file. L'effetto di quest'ultima scelta è identico a quello descritto 6890sotto l'opzione --output del comando "gnuplot". 6891 6892Accesso dal menù: /Visualizza/Correlogramma 6893Accesso alternativo: Menù pop-up nella finestra principale (selezione multipla) 6894 6895# xtab Statistics 6896 6897Argomenti: lista-y [ ; lista-x ] 6898Opzioni: --row (mostra le percentuali per riga) 6899 --column (mostra le percentuali per colonna) 6900 --zeros (mostra i valori pari a zero) 6901 --no-totals (elimina la stampa delle marginali) 6902 --matrix=matname (usa le frequenze da una matrice) 6903 --quiet (vedi il caso bivariato più sotto) 6904 --tex[=nomefile] (produce output LaTeX) 6905 --equal (vedi il caso LaTeX più sotto) 6906Esempi: xtab 1 2 6907 xtab 1 ; 2 3 4 6908 xtab --matrix=A 6909 xtab 1 2 --tex="xtab.tex" 6910 6911Mostra la tabella di contingenza, o la tabulazione incrociata, tra ogni 6912combinazione delle variabili della lista-y; se si indica anche una seconda 6913lista, lista-x, ogni variabile della lista-y viene tabulata (per riga) 6914rispetto ad ogni variabile della lista-x (per colonna). Le variabili in 6915queste liste possono essere referenziate per nome o per numero, e devono 6916essere state marcate come discrete. Alternativamente, con l'opzione 6917--matrix, la matrice specificata verrà trattata come un insieme di 6918frequenze già calcolate e il comando si limiterà a stamparla col formato 6919appropriato (vedi anche la funzione "mxtab"). In questo caso, gli argomenti 6920di tipo lista vanno omessi. 6921 6922Per impostazione predefinita le celle indicano la frequenza assoluta. Le 6923opzioni --row e --column (che sono mutualmente esclusive) sostituiscono la 6924frequenza assoluta con le frequenze in percentuale relativamente a ciascuna 6925riga o colonna. Le celle con valore di frequenza nullo sono lasciate vuote, 6926a meno che non venga usata l'opzione --zeros, che mostra esplicitamente i 6927valori pari a zero; questa opzione può essere comoda se occorre importare 6928la tabella in un altro programma, come un foglio di calcolo. 6929 6930Il test chi quadro di Pearson per l'indipendenza viene mostrato se la 6931frequenza attesa nell'ipotesi di indipendenza è pari almeno a 1.0e-7 per 6932tutte le celle. Una regola approssimativa usata spesso nel giudicare la 6933validità di questa statistica richiede che la frequenza attesa sia 6934superiore a 5 per almeno l'80 per cento delle celle; se questa condizione 6935non viene soddisfatta viene mostrato un messaggio di avvertimento. 6936 6937Se la tabella di contingenza è 2 x 2, viene calcolato il test esatto di 6938Fisher per l'indipendenza. Si noti che questo test si basa sull'ipotesi che 6939i totali per riga e colonna siano fissi; questo può essere appropriato o 6940meno a seconda di come sono stati generati i dati. Il p-value sinistro va 6941usato nel caso in cui l'ipotesi alternativa a quella di indipendenza sia 6942quella dell'associazione negativa (ossia i valori tendono ad accumularsi 6943nelle celle che non appartengono alla diagonale della tabella), mentre il 6944p-value destro va usato nell'ipotesi alternativa di associazione positiva. 6945Il p-value a due code di questo test è calcolato seguendo il metodo (b) 6946descritto in Agresti (1992), (capitolo 2.1): esso è la somma delle 6947probabilità di tutte le possibili tabelle che hanno i totali per riga e per 6948colonna pari a quelli della tabella data e che hanno una probabilità minore 6949o uguale a quella della tabella data. 6950 6951Il caso bivariato 6952 6953Nel caso base di una semplice tabella a doppia entrata si possono usare gli 6954accessori "$test" e "$pvalue" per il test chi-quadro di Pearson ed il 6955p-value corrispondente, a patto che sia rispettata la condizione sul valore 6956atteso minimo. In questo contesto, l'opzione --quiet fa sì che la tavola 6957non venga stampata. 6958 6959LaTeX output 6960 6961Dando l'opzione --tex, la tabella a doppia entrata viene stampata sotto 6962forma di un ambiente tabular di LaTeX. L'output verrà prodotto direttamente 6963(così da poterlo copincollare) o, se viene specificato il parametro 6964nomefile, nel file corrispondente. (Se nomefile non contiene un percorso 6965completo, il file sarà scritto nella locazione "workdir" attuale). la 6966statistica test non viene calcolata. L'opzione addizionale --equal viene 6967usata per far sì che venganp stampati in grassetto gli elementi della 6968tabella per cui le variabili riga e colonna hanno lo stesso valore numerico. 6969Quest'opzione è ignorata a se non è presente anche l'opzione --tex o 6970quando una delle due variabili sia di tipo stringa. 6971 6972Salvare la tavola come matrice 6973 6974Quando l'argomento del comando è dato da una sola lista, la tavola di 6975contingenza può essere salvata come matrice attraverso l'accessore 6976"$result". 6977 6978