1headings 10
2Tests 24
3add
4adf
5bds
6bkw
7chow
8coeffsum
9coint
10cusum
11difftest
12johansen
13kpss
14leverage
15levinlin
16meantest
17modtest
18normtest
19omit
20panspec
21qlrtest
22reset
23restrict
24runs
25vartest
26vif
27Graphs 10
28boxplot
29gnuplot
30graphpg
31hfplot
32panplot
33plot
34qqplot
35rmplot
36scatters
37textplot
38Statistics 13
39anova
40corr
41corrgm
42fractint
43freq
44hurst
45mahal
46pca
47pergm
48spearman
49summary
50xcorrgm
51xtab
52Dataset 18
53append
54data
55dataset
56delete
57genr
58info
59join
60labels
61markers
62nulldata
63open
64rename
65setinfo
66setmiss
67setobs
68smpl
69store
70varlist
71Estimation 34
72ar
73ar1
74arch
75arima
76arma
77biprobit
78dpanel
79duration
80equation
81estimate
82garch
83gmm
84heckit
85hsk
86intreg
87lad
88logistic
89logit
90midasreg
91mle
92mpols
93negbin
94nls
95ols
96panel
97poisson
98probit
99quantreg
100system
101tobit
102tsls
103var
104vecm
105wls
106Programming 19
107break
108catch
109clear
110elif
111else
112end
113endif
114endloop
115flush
116foreign
117funcerr
118function
119if
120include
121loop
122makepkg
123run
124set
125setopt
126Transformations 10
127diff
128discrete
129dummify
130lags
131ldiff
132logs
133orthdev
134sdiff
135square
136stdize
137Utilities 7
138eval
139help
140modeltab
141pkg
142pvalue
143quit
144shell
145Printing 7
146eqnprint
147modprint
148outfile
149print
150printf
151sprintf
152tabprint
153Prediction 1
154fcast
155
156# add Tests
157
158Argomento:  lista-variabili
159Opzioni:    --lm (effettua un test LM (solo OLS))
160            --quiet (non mostra le stime del modello aumentato)
161            --silent (non mostra nulla)
162            --vcv (mostra la matrice di covarianza)
163            --both (aggiunge come regressore e come strumento, solo per TSLS)
164Esempi:     add 5 7 9
165            add xx yy zz --quiet
166
167Va invocato dopo un comando di stima. Esegue un test congiunto per
168l'aggiunta delle variabili specificate all'ultimo modello stimato; si può
169avere accesso ai risultati del test tramite "$test" e "$pvalue".
170
171Di default, aggiunge al modello precedente le variabili nella
172lista-variabili e stima il nuovo modello. Il test è un test di Wald sul
173modello aumentato, che rimpiazza quello originale come "ultimo modello" per
174quanto riguarda,ad esempio, il contenuto di $uhat o test ulteriori.
175
176Alternativamente, con l'opzione --lm (disponibile solo per i modelli stimati
177via OLS), viene effettuato un test LM. Viene eseguita una regressione
178ausiliaria in cui la variabile dipendente è il residuo dell'ultimo modello
179e le variabili indipendenti sono quello del modello originale più
180lista-variabili. Sotto l'ipotesi nulla che le variabili aggiuntive non hanno
181potere esplicativo, il prodotto fra l'R-quadro non aggiustato della
182regressione ausiliaria e il numero di osservazioni si distribuisce come una
183chi quadro con tanti gradi di libertà quante sono le variabili in
184lista-variabili. In questo caso, il modello originale non viene rimpiazzato.
185
186L'opzione --both è specifica per le stime con i minimi quadrati a due
187stadi: essa indica che le nuove variabili vanno aggiunte sia alla lista dei
188regressori che a quella degli strumenti; di default, infatti, la
189lista-variabili viene aggiunta soltanto ai regressori.
190
191Accesso dal menù:    Finestra del modello, /Test/ADD - Aggiungi variabili
192
193# adf Tests
194
195Argomenti:  ordine lista-variabili
196Opzioni:    --nc (test senza costante)
197            --c (solo con la costante)
198            --ct (con costante e trend)
199            --ctt (con costante, trend e trend al quadrato)
200            --seasonals (include variabili dummy stagionali)
201            --gls (rimuove la media o il trend usando GLS)
202            --verbose (mostra i risultati della regressione)
203            --quiet (non mostra i risultati)
204            --difference (usa la differenza prima della variabile)
205            --test-down[=criterio] (ordine di ritardo automatico)
206            --perron-qu (si veda di seguito)
207Esempi:     adf 0 y
208            adf 2 y --nc --c --ct
209            adf 12 y --c --test-down
210            Vedi anche jgm-1996.inp
211
212Le opzioni precedenti e la discussione seguente si riferiscono per lo più
213all'uso del comando adf con serie storiche vere e proprie. La discussione
214dell'uso con dati panel è esposta nella sezione "Dati Panel".
215
216Calcola una serie di test Dickey-Fuller sulle variabili specificate,
217assumendo come ipotesi nulla che le variabili abbiano una radice unitaria.
218Se si usa l'opzione --difference, i test vengono condotti sulla differenza
219prima delle variabili e la discussione che segue va riferita a questa
220trasformazione delle variabili.
221
222Per impostazione predefinita, vengono mostrate due varianti del test: una
223basata su una regressione che contiene solo una costante, e una che include
224la costante e un trend lineare. È possibile controllare le varianti
225specificando una o più fra le opzioni --nc, --c, --ct, --ctt.
226
227L'opzione --gls può essere utilizzata congiuntamente alle opzioni --c e
228--ct. L'effetto di questa opzione è che la rimozione della media o del
229trend lineare dalla variabile che deve essere testata è fatta utilizzando
230la procedura GLS suggerita da Elliott, Rothenberg e Stock (1996), la quale
231restituisce un test di potenza superiore al test standard di Dickey-Fuller.
232Questa opzione non è compatibile con --nc,--ctt o --seasonals.
233
234In tutti i casi, la variabile dipendente nella regressione usata per
235calcolare il test è la differenza prima della variabile specificata, y, e
236la variabile dipendente più importante è il ritardo (di ordine uno) di y.
237Il modello è costruito in modo che il coefficiente della variabile
238ritardata y è pari a 1 meno la radice. Ad esempio, il modello con una
239costante può essere scritto come
240
241  (1 - L)y(t) = b0 + (a-1)y(t-1) + e(t)
242
243Sotto l'ipotesi nulla di radice unitaria il coefficiente della y ritardata
244è nullo; sotto l'alternativa che y sia stazionaria il coefficiente è
245negativo. Di conseguenza, questo test è intrinsecamente a una coda.
246
247Selezione dell'ordine dei ritardi
248
249Nella versione più semplice del test Dickey-Fuller test si assume che il
250termine di errore nella regressione di test sia serialmente incorrelato.
251Poiché questo è spesso implausibile, la specificazione viene spesso estesa
252includendo uno o più ritardi della variabile dipendente, dando così luogo
253al cosiddetto test ADF (Augmented Dickey-Fuller). L'argomento ordine indica
254il numero di tali ritardi, k, che può dipendere dall'ampiezza campiopnaria
255T.
256
257  Per selezionare un k fisso, basta inserire un numero non negativo per
258  ordine.
259
260  Per avere un numero di ritardi dipendente da T, specificare come order il
261  numero -1. In questo caso, l'ordine viene automaticamente scelto secondo
262  l'indicazione di Schwert (1989), ossia la parte intera di 12(T/100)^0.25.
263
264In generale, però, non si sa quanti ritardi siano necessari per "sbiancare"
265i residui Dickey-Fuller. Spesso si specifica il valore massimo di k e si
266lascia decidere ai dati il numero di ritardi effettivo. Per fare questo,
267c'è l'opzione --test-down: il criterio usato per scegliere il k ottimale è
268determinato dal parametro dato a questa opzione, che deve essere uno fra AIC
269(default), BIC o tstat.
270
271Quando si testa "all'indietro" con lo AIC o il BIC, l'ordine dei ritardi
272finale viene scelto in modo da ottimizzare rispettivamente una versione
273modificata del Criterio di Informazione di Akaike o del Criterio Bayesiano
274di Schwartz. La procedura varia a seconda se si sia scelta l'opzione --gls:
275con la de-trendizzazione GLS, i valori AIC e BIC sono quelli "modificati"
276descritti in Ng e Perron (2001), altrimenti sono quelli standard. Nel caso
277GLS è disponibile un'ulteriore opzione, e cioè --perron-qu; essa fa sì
278che i criteri di informazione modificati sono calcolati secondo il metodo
279raccomandato in Perron e Qu (2007). In quest'ultimo caso, i dati sono prima
280centrati in media o detrendizzati via OLS; il GLS viene applicato dopo aver
281scelto l'ordine dei ritardi.
282
283Quando si testa "all'indietro" usando la statistica t, la procedura è la
284seguente:
285
2861. Stima la regressione Dickey-Fuller con k ritardi della variabile
287   dipendente.
288
2892. Se questo ordine di ritardi è significativo, esegue il test con l'ordine
290   di ritardo k. Altrimenti, prova il test con k = k - 1; se k = 0, esegue
291   il test con ordine di ritardo 0, altrimenti va al punto 1.
292
293Durante il punto 2 spiegato sopra, "significativo" significa che la
294statistica t per l'ultimo ritardo abbia un p-value asintotico a due code per
295la distribuzione normale pari a 0.10 o inferiore.
296
297In sostanza, se accettiamo i vari argomenti di Perron, Ng, Qu e Schwert
298citati sopra, il comando più appropriato per testare una serie y è
299qualcosa del tipo:
300
301	adf -1 y --c --gls --test-down --perron-qu
302
303(Sosotituendo --ct a --c se la serie contiene un trend evidente.) L'ordine
304dei ritardi del test verrà determinato testando all'indietro con il
305criterio AIC modificato partendo del massimo di Schwert maximum, col
306raffinamento di Perron-Qu.
307
308I p-value per questo test sono basati su stime della superficie di risposta.
309Se non si usa il GLS, essi sono tratti da MacKinnon (1996). Altrimenti, si
310usa Cottrell (2015) o, quando si testa all'indietro, Sephton (2021). I
311P-value sono specifici per ampiezza campionaria, a meno che non vengano
312dichiarati come asintotici nell'output.
313
314Dati panel
315
316Quando il comando adf è usato con dati panel per calcolare un test panel di
317radici unitarie le opzioni applicabili sono piuttosto diverse.
318
319In primo luogo, mentre nel caso di serie storiche pure è possibile indicare
320un elenco di variabili da testare, con dati panel ciascun comando può
321esaminare una sola variabile alla volta. Secondo, le opzioni che governano
322l'inclusione di trend deterministici diventano mutualmente esclusive: è
323necessario scegliere fra il caso senza costante, quello con solo la
324costante, e quello che la costante e il trend; il default è il secondo.
325L'opzione --seasonals, inoltre, non è disponibile. Terzo, l'opzione
326--verbose ha un significato diverso: produce un breve resoconto del test per
327ciascuna singola serie storica (il default prevede di mostrare solo il
328risultato complessivo).
329
330Il test complessivo (ipotesi nulla: la variabile in questione ha una radice
331unitaria per tutte le unità panel) viene calcolata in uno o in entrambi i
332modi disponibili: usando il metodo di Im, Pesaran e Shin (Journal of
333Econometrics, 2003) oppure quello di Choi (Journal of International Money
334and Finance, 2001). Il test di Choi richiede che siano disponibili i P-value
335dei test singoli; se così non fosse, per via delle opzioni selezionate,
336esso viene omesso. La statistica riportata per il test di Im, Pesaran e Shin
337varia come segue: se l'ordine di ritardi per il test è positivo, viene
338riportata la statistica W; altrimenti, viene riportata la statistica Z se la
339lunghezza delle serie è diversa fra individui, quella t barrato se è
340uguale per tutte le unità. vedi anche il comando "levinlin".
341
342Accesso dal menù:    /Variabile/Test di radice unitaria/Test Dickey-Fuller
343      aumentato
344
345# anova Statistics
346
347Argomenti:  response treatment [ block ]
348Opzione:    --quiet (non stampa i risultati)
349
350Analisi della varianza: response è una serie che misura un effetto di
351interesse e treatment deve essere una variabile discreta che identifica due
352o più tipi di trattamento (o non trattamento). Nel caso dell'ANOVA a due
353vie, la variabile block (anch'essa discreta) identifica i valori di qualche
354variabile di controllo.
355
356Se non è stata selezionata l'opzione --quiet, questo comando stampa una
357tabella che mostra le somme e le medie dei quadrati, nonché un test F. Il
358test F e il suo p-value possono essere recuperati rispettivamente con gli
359accessori "$test" e "$pvalue".
360
361L'ipotesi nulla del test F è che la risposta media sia invariante rispetto
362al tipo di trattamento; in altre parole, che il trattamento non abbia alcun
363effetto. Formalmente, la validità del test richiede che la varianza della
364risposta sia la stessa per tutti i tipi di trattamento.
365
366Si noti che i risultati prodotti da questo comando costituiscono in realtà
367un sottoinsieme dell'informazione fornita dalla procedura seguente,
368facilmente implementabile in gretl. Create un insieme di variabili dummy
369associate a tutti i tipi di trattamento, tranne uno. Nel caso dell'ANOVA a
370due vie, create anche un insieme di variabili dummy associate a tutti i
371"blocchi", tranne uno. Una volta fatto questo, regredite response su una
372costante e le dummy usando "ols". Per un'analisi a una via la tabella ANOVA
373può essere creata ricorrendo all'opzione --anova del comando ols. Nel caso
374di un'analisi a due vie il test F può essere calcolato usando il comando
375"omit". Per esempio, se assumiamo che y sia la risposta, xt identifichi il
376trattamento e xb identifichi i blocchi:
377
378	# analisi a una via
379	list dxt = dummify(xt)
380	ols y 0 dxt --anova
381	# analisi a due vie
382	list dxb = dummify(xb)
383	ols y 0 dxt dxb
384	# test di significatività congiunta di dxt
385	omit dxt --quiet
386
387Accesso dal menù:    /Modello/Altri modelli lineari/ANOVA
388
389# append Dataset
390
391Argomento:  file-dati
392Opzioni:    --time-series (si veda oltre)
393            --fixed-sample (si veda oltre)
394            --update-overlap (si veda oltre)
395            --quiet (non stampa nulla)
396            Si veda oltre per opzioni speciali addizionali
397
398Apre un file di dati e aggiunge il suo contenuto al dataset attuale, se i
399nuovi dati sono compatibili. Il programma cerca di riconoscere il formato
400del file di dati (interno, testo semplice, CSV, Gnumeric, Excel, ecc.).
401
402I dati aggiunti possono avere la forma di osservazioni aggiuntive su
403variabili già presenti nel dataset, o di nuove variabili. In quest'ultimo
404caso occorre che il numero delle nuove osservazioni sia pari a quello delle
405osservazioni presenti nel dataset, oppure che i nuovi dati includano
406informazioni precise sulle osservazioni in modo che gretl possa capire come
407aggiungere i valori.
408
409Attenzione: non è supportato il caso i nuovo dati inizino prima e finiscano
410dopo quelli originali. Per aggiungere nuove serie in tal caso bisogna usare
411l'opzione --fixed-sample; ciò ha l'effetto di di sopprimere l'aggiunta di
412osservazioni, e quindi restringere l'operazione all'aggiunta di nuove serie.
413
414Nel caso di aggiunta di dati a un dataset panel, c'è una possibilità
415speciale. Siano n il numero di unità cross-section, T il numero di periodi
416temporali, e m il numero di nuove osservazioni da aggiungere. Se m = n i
417nuovi dati saranno considerati invarianti nel tempo, e saranno copiati per
418ognuno dei periodi temporali. D'altra parte, se m = T i dati saranno
419trattati come invarianti tra le unità. Se il panel è "quadrato", ed m è
420pari sia ad n che a T, il comportamento predefinito consiste nel trattare i
421nuovi casi come invarianti nel tempo, ma è possibile forzare
422l'interpretazione dei nuovi dati come serie storiche usando l'opzione
423--time-series (che verrà ignorata in tutti gli altri casi).
424
425Quando viene scelto per l'aggiunta un file di dati, potrebbe esserci una
426parziale sovrapposizione con il dataset esistente; in altre parole, una o
427più serie potrebbero avere osservazioni in comune dalle due fonti. Se viene
428passata l'opzione --update-overlap, il comando append sostituirà le
429osservazioni in comune con quelle provenienti dal file dei dati; se no, i
430valori presenti nel dataset in quel momento saranno lasciati inalterati.
431
432Le opzioni specializzate aggiuntive --sheet, --coloffset, --rowoffset e
433--fixed-cols funzionano come quelle corrispondenti per il comando "open".
434
435Vedi anche "join" per una gestione più sofisticata di più di un file di
436dati esterno.
437
438Accesso dal menù:    /File/Aggiungi dati
439
440# ar Estimation
441
442Argomenti:  ritardi ; variabile-dipendente variabili-indipendenti
443Opzioni:    --vcv (mostra la matrice di covarianza)
444            --quiet (non riporta i parametri stimati)
445Esempio:    ar 1 3 4 ; y 0 x1 x2 x3
446
447Calcola le stime parametriche usando la procedura iterativa generalizzata di
448Cochrane-Orcutt (si veda il Capitolo 9.5 di Ramanathan (2002). La procedura
449termina quando le somme dei quadrati degli errori consecutivi non
450differiscono per più dello 0.005 per cento, oppure dopo 20 iterazioni.
451
452"ritardi" è una lista di ritardi nei residui, conclusa da un punto e
453virgola. Nell'esempio precedente, il termine di errore è specificato come
454
455  u(t) = rho(1)*u(t-1) + rho(3)*u(t-3) + rho(4)*u(t-4)
456
457Accesso dal menù:    /Modello/Serie storiche/AR - Stima autoregressiva
458
459# ar1 Estimation
460
461Argomenti:  depvar indepvars
462Opzioni:    --hilu (usa la procedura di Hildreth-Lu)
463            --pwe (usa lo stimatore di Prais-Winsten)
464            --vcv (mostra la matrice di covarianza)
465            --no-corc (non affinare i risultati con Cochrane-Orcutt)
466            --loose (usa un criterio di convergenza più blando)
467            --quiet (non stampa nulla)
468Esempi:     ar1 1 0 2 4 6 7
469            ar1 y 0 xlist --hilu --no-corc
470            ar1 y 0 xlist --pwe
471
472Calcola stime feasible GLS per un modello in cui il termine di errore segue
473un processo autoregressivo del prim'ordine.
474
475Il metodo predefinito è la procedura iterativa di Cochrane-Orcutt (si veda
476ad esempio il capitolo 9.4 di Ramanathan, 2002). La procedura termina quando
477le stime successive del coefficiente di autocorrelazione non differiscono
478per più di 0.001, oppure dopo 20 iterazioni. Sarà segnalato un errore se
479la convergenza non è avvenuta dopo 100 iterazioni. Se ciò non si verifica
480entro la 100esima iterata verrà stampato un messaggio di errore.
481
482Se si usa l'opzione --pwe, viene usato lo stimatore di Prais-Winsten, che
483prevede una procedura simile a quella di Cochrane-Orcutt; la differenza è
484che mentre Cochrane-Orcutt tralascia la prima osservazione, Prais-Winsten ne
485fa uso. Per i dettagli, si veda per esempio il capitolo 13 di Econometric
486Analysis di Greene (2000).
487
488Se si usa l'opzione --hilu, verrà usata la procedura di ricerca di
489Hildreth-Lu. I risultati sono quindi ottimizzati con la procedura iterativa
490di Cochrane-Orcutt, a meno che non si usi l'opzione --no-corc (che viene
491ignorata se non viene specificata --hilu).
492
493Accesso dal menù:    /Modello/Serie storiche/Cochrane-Orcutt
494Accesso dal menù:    /Modello/Serie storiche/Hildreth-Lu
495Accesso dal menù:    /Modello/Serie storiche/Prais-Winsten
496
497# arch Estimation
498
499Argomenti:  ordine variabile-dipendente variabili-indipendenti
500Opzione:    --quiet (non stampa nulla)
501Esempio:    arch 4 y 0 x1 x2 x3
502
503Questo comando è attualmente mantenuto per ragioni di compatibilità con le
504versioni precedenti, ma è preferibile usare lo stimatore di massima
505verosimiglianza disponibile mediante il comando "garch"; per un modello ARCH
506puro, fissate a 0 il primo parametro GARCH.
507
508Stima il modello specificato tenendo conto della possibile
509eteroschedasticità condizionale autoregressiva (ARCH, Autoregressive
510Conditional Heteroskedasticity). Per prima cosa il modello viene stimato con
511OLS, quindi viene eseguita una regressione ausiliaria, in cui i quadrati dei
512residui della prima regressione vengono regrediti sui loro valori ritardati.
513Il passo finale è una stima con minimi quadrati ponderati, in cui i pesi
514sono i reciproci delle varianze dell'errore della regressione ausiliaria (se
515la varianza prevista di qualche osservazione nella regressione ausiliaria
516non risulta positiva, viene usato il corrispondente residuo al quadrato).
517
518I valori alpha mostrati sotto i coefficienti sono i parametri del processo
519ARCH stimati nella regressione ausiliaria.
520
521Si veda anche "garch" e "modtest" (l'opzione --arch).
522
523Accesso dal menù:    /Modello/Serie storiche/ARCH
524
525# arima Estimation
526
527Argomenti:  p d q [ ; P D Q ] ; variabile-dipendente [ variabili-indipendenti ]
528Opzioni:    --verbose (mostra i dettagli delle iterazioni)
529            --quite (non mostra i risultati)
530            --vcv (mostra la matrice di covarianza)
531            --hessian (si veda sotto)
532            --opg (si veda sotto)
533            --nc (non include l'intercetta)
534            --conditional (usa la massima verosimiglianza condizionale)
535            --x-12-arima (usa X-12-ARIMA, o X13, per la stima)
536            --lbfgs (usa il massimizzatore L-BFGS-B)
537            --y-diff-only (speciale per ARIMAX, si veda sotto)
538Esempi:     arima 1 0 2 ; y
539            arima 2 0 2 ; y 0 x1 x2 --verbose
540            arima 0 1 1 ; 0 1 1 ; y --nc
541
542Nota: arma è un sinomimo di questo comando.
543
544Se non viene fornita una lista di variabili-indipendenti, stima un modello
545autoregressivo integrato a media mobile (ARIMA: Autoregressive, Integrated,
546Moving Average) univariato. I valori p, d e q rappresentano rispettivamente
547gli ordini dei termini autoregressivi (AR), l'ordine di differenziazione, e
548quello dei termini a media mobile (MA). Questi valori possono essere
549indicati in forma numerica o con i nomi di variabili scalari preesistenti.
550Ad esempio, un valore d pari a 1 significa che prima di stimare i parametri
551ARMA occorre prendere la differenza della variabile dipendente.
552
553Se si vuole includere solo alcuni specifici ritardi AR o MA (invece che
554tutti i ritardi fino all'ordine specificato) è possibile sostituire p e/o q
555in due modi: col nome di una matrice predefinita che contiene un insieme di
556valori interi, oppure con un'espressione come {1 4}, ossia un insieme di
557ritardi separati da spazi e racchiusi tra parentesi graffe.
558
559I valori interi opzionali P, D e Q rappresentano rispettivamente, l'ordine
560dei termini AR stagionali, l'ordine di differenziazione stagionale e
561l'ordine dei termini MA stagionali. Essi sono rilevanti solo la frequenza
562dei dati è superiore a 1 (ad esempio, dati trimestrali o mensili). Questi
563valori devono essere indicati in forma numerica o come variabili scalari.
564
565Nel caso univariato la scelta predefinita include un'intercetta nel modello,
566ma questa può essere soppressa con l'opzione --nc. Se vengono aggiunte
567delle variabili-indipendenti, il modello diventa un ARMAX: in questo caso
568occorre indicare esplicitamente la costante se si desidera un'intercetta
569(come nel secondo degli esempi proposti).
570
571È disponibile una sintassi alternativa per questo comando: se non si
572intende applicare alcuna operazione di differenziazione (stagionale o non
573stagionale), è possibile omettere totalmente i termini d e D, invece che
574impostarli esplicitamente pari a 0. Inoltre, arma è un sinonimo di arima,
575quindi ad esempio il comando seguente è un modo valido per specificare un
576modello ARMA(2,1):
577
578	arma 2 1 ; y
579
580Il funzionamento predefinito utilizza la funzionalità ARMA "interna" di
581gretl, che usa la stima di massima verosimiglianza esatta usando il filtro
582di Kalman; come opzione è possibile usare la stima di massima
583verosimiglianza condizionale. Se è stato installato il programma X-12-ARIMA
584è possibile usare questo al posto del codice interno di gretl. Per i
585dettagli su queste opzioni si veda la guida all'uso di gretl (il capitolo
58631).
587
588Quando si usa il codice ARMA interno, le deviazioni standard sono stimate
589basandosi su un'approssimazione numerica all'inversa negativa dell'Hessiana,
590passando automaticamente al prodotto esterno del gradiente (OPG) in caso di
591problemi numerici. Se si usa l'opzione --opg il prodotto esterno del
592gradiente viene usato in ogni caso. L'opzione --hessian, invece, disabilita
593il passaggio automatico all'OPG in caso di problemi. Si noti, peraltro, che
594l'impossibilità di calcolare numericamente l'hessiana è per solito indice
595di un modello mal specificato.
596
597L'opzione --lbfgs è riservata alla stima basata su codice ARMA nativo e MV
598esatta; quando viene indicata, la stima usa l'algoritmo L-BFGS a "memoria
599limitata" anziché l'ottimizzatore BFGS consueto. Questa variante può
600essere utile in alcune situazioni nelle quali la convergenza all'ottimo è
601problematica.
602
603L'opzione --y-diff-only è riservata alla stima di modelli ARIMAX (modelli
604con ordine di integrazione non nullo e che includono regressori esogeni), e
605si applica solo con la stima di MV esatta nativa di gretl. Per questi
606modelli il comportamento di default consiste nel differenziare sia la
607variabile dipendente che i regressori, ma quando viene indicata questa
608opzione viene differenziata solo la variabile dipendente, mentre i
609regressori restano nei livelli.
610
611Il valore AIC mostrato nei modelli ARIMA è calcolato secondo la definizione
612usata in X-12-ARIMA, ossia
613
614  AIC = -2L + 2k
615
616dove L è la log-verosimiglianza e k è il numero totale di parametri
617stimati. Si noti che X-12-ARIMA non produce criteri di informazione come
618l'AIC quando la stima è effettuata col metodo della massima verosimiglianza
619condizionale.
620
621Le radici AR e MA mostrate in occasione della stima ARMA sono basate sulla
622seguente rappresentazione di un processo ARMA(p,q):
623
624	(1 - a_1*L - a_2*L^2 - ... - a_p*L^p)Y =
625        c + (1 + b_1*L + b_2*L^2 + ... + b_q*L^q) e_t
626
627Di conseguenza le radici AR sono la soluzione di
628
629        1 - a_1*z - a_2*z^2 - ... - a_p*L^p = 0
630
631e la stazionarietà del processo richiede che queste radici si trovino al di
632fuori del cerchio di raggio unitario.
633
634Il valore di "frequenza" mostrato insieme alle radici AR e MA è il valore
635di lambda che risolve z = r * exp(i*2*pi*lambda)dove z è la radice in
636questione e r è il suo modulo.
637
638Accesso dal menù:    /Modello/Serie Storiche/ARIMA
639Accesso alternativo: Menù pop-up nella finestra principale (selezione singola)
640
641# arma Estimation
642
643Vedi "arima"; arma è un alias.
644
645# bds Tests
646
647Argomenti:  ordine x
648Opzioni:    --corr1=rho (vedi sotto)
649            --sdcrit=multiple (vedi sotto)
650            --boot=N (vedi sotto)
651            --matrix=m (usa una matrice come input)
652            --quiet (non mostra i risultati)
653Esempi:     bds 5 x
654            bds 3 --matrix=m
655            bds 4 --sdcrit=2.0
656
657Esegue il test BDS (Brock, Dechert, Scheinkman and LeBaron, 1996) per la
658nonlinearità della serie x. In un contesto econometrico il suo uso è
659tipicamente associato all'analisi dei residui per la violazione della
660condizione IID. Il test si basa su un insieme di integrali di correlazione,
661pensati per rintracciare la nonlinearità in dimensioni via via più ampie,
662e l'argomento ordine indica il numero di tali integrali. Esso deve essere
663almeno 2; il primo integrale stabilisce una base ma non può essere usato
664per calcolare il test. Il test è di tipo generico: rintraccia ogni tipo di
665deviazione dalla linearità ma non è informativo sul perché questa
666condizione venisse eventualmente violata.
667
668Il test può essere calcolato su un vettore (riga o colonna) anziché su una
669serie usando l'opzione --matrix.
670
671Criterio di contiguità
672
673Gli integrali di correlazione sono, in sostanza, misure di "contiguità",
674ove due punti sono considerati vicini se la differenza fra loro non eccede
675ε. Per specificare ε, di default gretl segue la raccomandazione di Kanzler
676(1999): ε è scelto in modo tale che l'integrale di correlazione del primo
677ordine sia intorno a 0.7. Una possibile alternativa (meno intensiva
678computazionalmente) è quella di specificare ε come multiplo delle scarto
679quadratico medio della serie in esame. L'opzione --sdcrit è usata per
680quest'ultimo metodo; nel terzo esempio fornito sopra ε è posto al doppio
681dello sqm di x. L'opzione --corr1 implica invece l'uso del metodo di
682Kanzler's ma consente di specificare un valore di scala diverso da 0.7.
683Ovviamente, queste due opzioni non possono essere usate insieme.
684
685Bootstrap
686
687Le statistiche test sono asintoticamente distribuite come N(0,1) ma il test
688tende a sovra-rigettare la nulla in piccoli campioni. Per questa ragione, i
689P-values sono ottenuti con una procedura di bootstrap se la lunghezza di x
690fosse minore di 600 (in caso contrario, si fa riferimento alla normale
691standard). Per usare il bootstrap in campioni più grandi basta dare un
692valore non zero all'opzione --boot. Al contrario, per evitare il bootstrap
693in piccoli campioni, basta settarla a 0.
694
695Il default per il numero di iterazioni bootstrap è di 1999, ma questo
696settaggio può essere modificato dandolo come argomento all'opzione --boot.
697
698Matrice accessore
699
700Se il comando va a buon fine, "$result" conterrà i risultati sotto forma di
701una matrice con due righe e maxdim - 1 colonne. La prima riga contiene le
702statistiche test, mentre la seconda contiene i P-values per ognuna delle
703dimensioni, sotto l'ipotesi nulla per cui x sia lineare/IID.
704
705# biprobit Estimation
706
707Argomenti:  depvar1 depvar2 indepvars1 [ ; indepvars2 ]
708Opzioni:    --vcv (stampa la matrice di covarianze)
709            --robust (errori standard robusti)
710            --cluster=clustvar (vedi "logit" per una spiegazione)
711            --opg (vedi sotto)
712            --save-xbeta (vedi sotto)
713            --verbose (stampa informazione extra)
714Esempi:     biprobit y1 y2 0 x1 x2
715            biprobit y1 y2 0 x11 x12 ; 0 x21 x22
716            Vedi anche biprobit.inp
717
718Stima un modello probit bivariato massimizzando la verosimiglianza con il
719metodo di Newton-Raphson.
720
721L'elenco degli argomenti inizia con due variabili dipendenti (binarie),
722seguite da una lista di regressori. Un'eventuale seconda lista, separata
723dalla precedente da un punto e virgola, viene interpretata come contenente
724l'insieme dei regressori specifici alla seconda equazione, mentre indepvars1
725è specifica alla prima equazione; in caso contrario il comando assume che
726indepvars1 rappresenti un insieme di regressori comuni alle due equazioni.
727
728Per default, gli errori standard sono calcolati usando l'Hessiana analitica
729calcolata in corrispondenza delle stime dei parametri. L'opzione --opg
730permette di stimare la matrice di covarianza usando il prodotto esterno del
731gradiente (Outer Product of the Gradient, OPG); l'opzione --robust permette
732di calcolare gli standard error QML a partire dalla matrice di covarianza
733"sandwich" che usa sia l'inversa dell'Hessiana che la matrice OPG.
734
735Si noti che la stima di rho, il coefficiente di correlazione fra i due
736termini di disturbo, è incluso nel vettore dei coefficienti, all'ultimo
737posto, con le ovvie conseguenze sugli accessori coeff, stderr e vcv.
738
739Una volta completata con successo la stima, l'accessore "$uhat" consente di
740recuperare una matrice di due colonne contenente i residui generalizzati
741delle due equazioni; in altre parole, i valori attesi degli errori
742condizionali ai valori osservati delle variabili dipendenti e delle
743covariate. Di default "$yhat" restituisce una matrice di quattro colonne
744contenente le stime delle probabilità dei quattro possibili esiti congiunti
745per (y_1, y_2), nell'ordine (1,1), (1,0), (0,1), (0,0). In alternativa, se
746il comando è seguito dall'opzione --save-xbeta , "$yhat" ha due colonne
747contenenti i valori delle funzioni indice delle rispettive equazioni.
748
749L'output comprende un test dell'ipotesi che gli errori delle due equazioni
750siano incorrelati fra loro. Il test è un test di tipo LR, a meno che lo
751stimatore sia inteso come stimatore QMLE e quindi venga usata l'opzione
752--robust; in questo caso, si usa un test di Wald.
753
754# bkw Tests
755
756Opzione:    --quiet (non stampa nulla)
757Esempi:     longley.inp
758
759Deve seguire la stima di un modello che includa almeno due variabili
760indipendenti. Calcola e mostra le informazioni relative alla collinearità,
761ovvero la tabella BKW, basandosi sul lavoro di Belsley, Kuh e Welsch (1980).
762Questa tabella riporta una sofisticata analisi del grado di collinearità e
763delle sue fonti, attraverso l'analisi degli autovalori ed autovettori
764dell'inversa della matrice di correlazione. Per un resoconto completo circa
765l'approccio BKW con riferimento a gretl, ed a diversi altri esempi, si veda
766Adkins, Waters e Hill (2015).
767
768Utilizzando l'accessore "$result" è possibile recuperare la tabella BKW
769come matrice. Si veda anche il comando "vif" per un approccio semplificato
770alla diagnostica della collinearità.
771
772Esiste anche una funzione chiamata "bkw" che offre maggior flessibilità.
773
774Accesso dal menù:    Finestra del modello, /Analisi/Collinearità
775
776# boxplot Graphs
777
778Argomento:  lista-variabili
779Opzioni:    --notches (mostra l'intervallo di confidenza al 90 per cento per la mediana)
780            --factorized (vedi sotto)
781            --panel (vedi sotto)
782            --matrix=name (opera su colonne di una matrice)
783            --output=filename (manda l'output a un file specificato)
784
785Questo tipo di grafici (da Tukey e Chambers) mostra la distribuzione di una
786variabile. La "scatola" centrale (box) racchiude il 50 per cento centrale
787dei dati, ossia è delimitato dal primo e terzo quartile. I "baffi"
788(whiskers) si estendono fino un valore dato da una volta e mezzo il range
789interquartile a partire dai bordi della scatola. Valori esterni a tale
790intervallo sono considerati "outlier" e rappresentati con dei punti. Una
791linea trasversale sulla scatola indica la mediana, mentre un segno "+"
792indica la media. Se viene selezionata l'opzione di mostrare un intervallo di
793confidenza per la mediana, questo viene calcolato via bootstrap e mostrato
794sotto forma di lnee tratteggiate orizzontali sopra e sotto la mediana.
795
796L'opzione "factorized" permette di esaminare la distribuzione di una
797variabile condizionata ai valori di un fattore discreto. Ad esempio, se un
798dataset contiene salari e una variable binaria per il genere, si può
799scegliere di analizzare la distribuzione del salario condizionata al genere
800e visualizzare boxplot dei salari per i maschi e per le femmine uno di
801fianco all'altro, come ad esempio
802
803	boxplot wage gender --factorized
804
805Si noti che, in questo caso, bisogna specificare esattamente due variabili,
806col fattore per secondo.
807
808Se il dataset corrente è un panel ed è stata specificata una sola
809variabile, l'opzione --panel produce una serie di grafici boxplot
810affiancati, uno per ogni "unità" o gruppo panel.
811
812In generale l'argomento varlist è necessario e deve indicare una o più
813variabili nel dataset corrente (usando il nome o il numero di ID). Se viene
814fornita una matrice usando l'opzione --matrix, tuttavia, questo argomento
815diventa opzionale: di default viene mostrato un grafico per ciascuna delle
816colonne della matrice specificata.
817
818Il grafici boxplot di gretl sono generati usando gnuplot, ed è possibile
819arricchire il grafico specificando altri comandi gnuplot, includendoli fra
820parentesi graffa. Per maggiori dettagli consultate per favore l'help del
821comando "gnuplot".
822
823In modalità interattiva il risultato viene mostrato immediatamente. In
824batch il comportamento di default di gretl è di scrivere nella directory di
825lavoro dell'utente un file di comandi gnuplot chiamato gpttmpN.plt,
826iniziando da N = 01. I grafici veri e propri possono essere generati in
827seguito usando gnuplot (in MS Windows, wgnuplot). Questo comportamento può
828essere modificato usando l'opzione --output=filename. Per ulteriori
829dettagli, si veda il comando "gnuplot".
830
831Accesso dal menù:    /Visualizza/Grafico/Boxplot
832
833# break Programming
834
835Esce da un ciclo. Questo comando può essere usato solo all'interno di un
836ciclo e causa l'immediata interruzione dell'esecuzione del ciclo (o di
837quello più interno, nel caso di cicli nidificati). Si veda anche il comando
838"loop".
839
840# catch Programming
841
842Sintassi:
843        catch command
844
845Non si tratta di un vero e proprio comando, quanto piuttosto di un prefisso
846applicabile alla maggior parte dei comandi consueti; il suo effetto è
847quello di prevenire l'interruzione di uno script nel caso in cui si
848verifichi un errore nell'esecuzione di un comando. Un eventuale errore viene
849registrato in un codice d'errore interno cui è possibile accedere con
850"$error" (un valore nullo indica che l'esecuzione ha avuto successo). Il
851valore di "$error" dovrebbe sempre essere controllato subito dopo aver usato
852catch, in modo da adottare le misure più opportune nel caso in cui il
853comando non dovesse aver avuto successo.
854
855catch non può essere usato prima di if, elif o endif. Inoltre, non può
856essere neanche usato per chiamate a funzioni definite dall'utente; il suo
857uso è limitato ai comandi di gretl e alle chiamate a funzioni od operatori
858"nativi".
859
860# chow Tests
861
862Varianti:   chow obs
863            chow dummyvar --dummy
864Opzioni:    --dummy (usa una variabile dummy preesistente)
865            --quiet (non mostra le stime del modello aumentato)
866            --limit-to=lista (limita il test a un sottoinsieme di regressori)
867Esempi:     chow 25
868            chow 1988:1
869            chow female --dummy
870
871Va eseguito dopo una regressione OLS e fornisce un test per l'ipotesi nulla
872che non esista un break strutturale del modello in corrispondenza del punto
873di rottura specificato. La procedura consiste nel creare una variabile dummy
874che vale 1 a partire dal punto di rottura specificato da osservazione fino
875alla fine del campione, 0 altrove; inoltre vengono creati dei termini di
876interazione tra questa dummy e i regressori originali. Viene quindi stimata
877una regressione che include questi termini.
878
879Per impostazione predefinita viene calcolata una statistica F, prendendo la
880regressione aumentata come non vincolata e la regressione originale come
881vincolata. Se il modello originale usa uno stimatore robusto per la matrice
882di covarianza, come statistica test viene usato un valore chi-quadro di
883Wald, basato su uno stimatore robusto della matrice di covarianza della
884regressione aumentata.
885
886L'opzione --limit-to si può usare per limitare l'insieme di regressori che
887verrà interagito con la dummy di sottocampionamento a un sottoinsieme di
888quelli originali. Il parametro di questa opzione dev'essere una lista
889pre-definita, contenente un sottoinsieme delle variabili esplicative; la
890costante non può farne parte.
891
892Accesso dal menù:    Finestra del modello, /Test/CHOW
893
894# clear Programming
895
896Opzioni:    --dataset (cancella solo il dataset)
897            --other (cancella tutto fuorché il dataset)
898
899Senza alcuna opzione, cancella dalla memoria tutti gli oggetti salvati,
900compreso l'eventuale campione corrente. Si noti che anche aprire un nuovo
901dataset o usare il comando "nulldata" per creare un dataset vuoto ha lo
902stesso effetto; per questo motivo di solito non è necessario usare "clear".
903
904Con l'opzione --dataset viene cancellato dalla memoria solo il dataset;
905tutti gli altri oggetti, come matrici e scalari salvati in precedenza,
906vengono conservati.
907
908# coeffsum Tests
909
910Argomento:  lista-variabili
911Opzione:    --quiet (non stampa nulla)
912Esempi:     coeffsum xt xt_1 xr_2
913            Vedi anche restrict.inp
914
915Deve essere usato dopo una regressione. Calcola la somma dei coefficienti
916delle variabili nella lista-variabili e ne mostra l'errore standard e il
917p-value per l'ipotesi nulla che la loro somma sia zero.
918
919Si noti la differenza tra questo test e "omit", che assume come ipotesi
920nulla l'uguaglianza a zero di tutti i coefficienti di un gruppo di variabili
921indipendenti.
922
923L'opzione --quiet potrebbe risultare utile se si vuole accedere ai valori
924"$test" e "$pvalue", che vengono registrati al completamento della
925procedura.
926
927Accesso dal menù:    Finestra del modello, /Test/Somma dei coefficienti
928
929# coint Tests
930
931Argomenti:  ordine variabile-dipendente variabili-indipendenti
932Opzioni:    --nc (non include la costante)
933            --ct (include la costante e il trend)
934            --ctt (include la costante e il trend quadratico)
935            --seasonals (include dummy stagionali)
936            --skip-df (non esegue i test DF sulle variabili individuali)
937            --test-down[=criterio] (scelta automatica dell'ordine dei ritardi)
938            --verbose (mostra dettagli extra sulle regressioni)
939            --silent (non stampa nulla)
940Esempi:     coint 4 y x1 x2
941            coint 0 y x1 x2 --ct --skip-df
942
943Test di cointegrazione di Engle-Granger. La procedura predefinita è la
944seguente: (1) eseguire dei test Dickey-Fuller aumentati, sull'ipotesi nulla
945che ognuna delle variabili elencate abbia una radice unitaria; (2) stimare
946la regressione di cointegrazione; (3) eseguire un test DF sui residui della
947regressione di cointegrazione. Se si usa l'opzione --skip-df, il passo (1)
948viene saltato.
949
950Se l'ordine di ritardo specificato è positivo, tutti i test Dickey-Fuller
951utilizzano questo ordine. Se l'ordine indicato viene preceduto da un segno
952meno, viene interpretato come l'ordine massimo, e l'ordine utilizzato
953effettivamente viene ricavato con la stessa procedura di test "all'indietro"
954descritta per il comando "adf".
955
956L'impostazione predefinita consiste nell'includere una costante nella
957regressione di cointegrazione; se si vuole omettere la costante, basta usare
958l'opzione --nc. Se si vuole aggiungere all'elenco dei termini deterministici
959della regressione un trend lineare o quadratico, basta usare le opzioni --ct
960o --ctt. Queste opzioni sono mutualmente esclusive. Volendo, se i dati sono
961trimestrali o mensili, la regressione può comprendere dummy stagionali.
962
963Test di cointegrazione di Engle-Granger. La procedura predefinita è la
964seguente: (1) eseguire dei test Dickey-Fuller aumentati, sull'ipotesi nulla
965che ognuna delle variabili elencate abbia una radice unitaria; (2) stimare
966la regressione di cointegrazione; (3) eseguire un test DF sui residui della
967regressione di cointegrazione. Se si attiva la casella Salta i test DF
968iniziali, il passo (1) viene saltato.
969
970I pvalue per questo test si basano su MacKinnon (1996). Il codice relativo
971è stato incluso per gentile concessione dell'autore.
972
973Per il test di cointegrazione di Søren Johansen, si veda il comando
974"johansen".
975
976Accesso dal menù:    /Modello/Serie storiche/Test di cointegrazione/Engle-Granger
977
978# corr Statistics
979
980Varianti:   corr [ lista-variabili ]
981            corr --matrix=nome-matrice
982Opzioni:    --uniform (assicura l'uniformità del campione)
983            --spearman (Rho di Spearman)
984            --kendall (Tau di Kendall)
985            --verbose (mostra i ranghi)
986            --plot=modo o nome del file (si veda di seguito)
987            --triangle (si veda di seguito)
988Esempi:     corr y x1 x2 x3
989            corr ylist --uniform
990            corr x y --spearman
991
992Per impostazione predefinita, mostra le coppie di coefficienti di
993correlazione (la correlazione del prodotto dei momenti di Pearson) per le
994variabili date nella lista-variabili, o per tutte le variabili del dataset
995se non viene specificata alcuna lista-variabili. Il comportamento
996predefinito consiste nell'usare tutte le osservazioni disponibili per
997calcolare ognuno dei coefficienti, ma se si usa l'opzione --uniform il
998campione verrà limitato (se necessario) in modo che per tutti i
999coefficienti venga usato lo stesso insieme di osservazioni. Questa opzione
1000ha effetto solo se le diverse variabili contengono un numero diverso di
1001valori mancanti.
1002
1003Le opzioni (mutualmente esclusive) --spearman e --kendall producono
1004rispettivamente, la correlazione di rango di Spearman (rho) e la
1005correlazione di rango di Kendall (tau), invece del solito coefficiente di
1006Pearson. Quando si usa una di queste opzioni, la lista-variabili deve
1007contenere solo due variabili.
1008
1009Quando viene calcolata la correlazione di rango, si può usare l'opzione
1010--verbose per mostrare i dati originali e ordinati (altrimenti questa
1011opzione verrà ignorata).
1012
1013Se lista-variabili contiene più di due serie e il programma non è in
1014modalità batch, verrà mostrato un grafico a "temperatura" della matrice di
1015correlazione, regolato dall'opzione --plot. Per questa opzione, i parametri
1016possibili sono none (per non averlo), display (per mostrarlo a video anche
1017in modo batch), o un nome di file. Quest'ultima scelta ha effetti uguali a
1018quelli dell'opzione --output per il comando "gnuplot". L'opzione --triangle
1019fa sì che il grafico contenga solo il triangolo inferiore della matrice.
1020
1021Se si usa la forma alternativa, dando come argomento un nome di matrice
1022piuttosto che una lista variabili, le opzioni --spearman e --kendall non
1023sono disponibili -- si veda quindi la funzione "npcorr".
1024
1025L'accessore "$result" può essere utilizzato per ottenere le correlazioni
1026risultati dal comando sottoforma di matrice utilizzabile.
1027
1028Accesso dal menù:    /Visualizza/Matrice di correlazione
1029Accesso alternativo: Menù pop-up nella finestra principale (selezione multipla)
1030
1031# corrgm Statistics
1032
1033Argomenti:  variabile [ max-ritardo ]
1034Opzioni:    --bartlett (usa gli errori standard di Bartlett)
1035            --plot=modo o nome di file (si veda sotto)
1036            --quiet (non mostra il grafico)
1037Esempio:    corrgm x 12
1038
1039Mostra i valori della funzione di autocorrelazione per la variabile
1040specificata (dal nome o dal numero). I valori sono definiti come rho(u_t,
1041u_t-s) dove u_t è la t-esima osservazione della variabile u e s è il
1042numero dei ritardi.
1043
1044Vengono mostrate anche le autocorrelazioni parziali (calcolate con
1045l'algoritmo di Durbin-Levinson), ossia al netto dell'effetto dei ritardi
1046intermedi. Il comando produce anche un grafico del correlogramma e mostra la
1047statistica Q di Ljung-Box per testare l'ipotesi nulla che la serie sia
1048"white noise" (priva di autocorrelazione). La statistica si distribuisce
1049asintoticamente come chi-quadro con gradi di libertà pari al numero di
1050ritardi specificati.
1051
1052La significatività statistica delle singole autocorrelazioni viene indicata
1053per mezzo di asterischi. Di default, essa è calcolata per mezzo della
1054radice inversa dell'ampiezza campionaria, ma con l'opzione --bartlett
1055vengono usate le formule di Bartlett per l'ACF. Quest'opzione, se
1056applicabile, controlla anche la banda di confidenza mostrata nel grafico.
1057
1058Se viene specificato un valore max-ritardo, la lunghezza del correlogramma
1059viene limitata al numero di ritardi specificato, altrimenti viene scelta
1060automaticamente in funzione della frequenza dei dati e del numero di
1061osservazioni.
1062
1063Di default viene mostrato un grafico del correlogramma: un grafico gnuplot
1064in modalità interattiva o un grafico ASCII in modalità batch. Questo
1065comportamento può essere modificato con l'opzione --plot. Per questa
1066opzione i parametri accettabili sono none (per eliminare il grafico); ascii
1067(per produrre un grafico in formato testo anche in modalità interattiva);
1068display (per produrre un grafico gnuplot anche in modalità batch); oppure
1069il nome di un file. In quest'ultimo caso l'effetto è quello descritto per
1070l'opzione --output del comando "gnuplot".
1071
1072Se il comando va a buon fine, gli accessori "$test" e "$pvalue" conterranno
1073i valori corrispondenti per la statistica di Ljung-Box, per l'ordine
1074max-ritardo. Peraltro, se si vuole semplicemente calcolare la statistica Q
1075senza che il programma produca alcun output, consigliamo di usare la
1076funzione "ljungbox" anziché questo comando.
1077
1078Accesso dal menù:    /Variabile/Correlogramma
1079Accesso alternativo: Menù pop-up nella finestra principale (selezione singola)
1080
1081# cusum Tests
1082
1083Opzioni:    --squares (esegue il test CUSUMSQ)
1084            --quiet (stampa solamente il test di Harvey-Collier)
1085            --plot=output (vedi sotto)
1086
1087Va eseguito dopo la stima di un modello OLS. Esegue il test CUSUM (o, se si
1088usa l'opzione --squares, il test CUSUMSQ) per la stabilità dei parametri.
1089Viene calcolata una serie di errori di previsione per il periodo successivo,
1090attraverso una serie di regressioni: la prima usa le prime k osservazioni e
1091viene usata per generare la previsione della variabile dipendente per
1092l'osservazione k + 1; la seconda usa le prime k + 1 osservazioni per
1093generare una previsione per l'osservazione k + 2 e cos via (dove k è il
1094numero dei parametri nel modello originale).
1095
1096Viene mostrata, anche graficamente, la somma cumulata degli errori scalati
1097di previsione (o dei quadrati degli errori). L'ipotesi nulla della
1098stabilità dei parametri è rifiutata al livello di significatività del 5
1099per cento se la somma cumulata va al di fuori delle bande di confidenza al
110095 per cento.
1101
1102Nel caso di test CUSUM, viene mostrata anche la statistica t di
1103Harvey-Collier per testare l'ipotesi nulla della stabilità dei parametri.
1104Si veda il Capitolo 7 di Econometric Analysis di Greene, per i dettagli. Per
1105il test CUSUMSQ, la banda di confidenza al 95% è calcolata usando
1106l'algoritmo descritto in Edgerton e Wells (1994).
1107
1108Di default, se il programma non è in modalità batch, viene mostrato un
1109grafico della series cumulata con la sua banda di confidenza. Questo
1110comportamento può essere modificato tramite l'opzione --plot, che può
1111prendere come parametri none (per non produrre il grafico); display (per
1112mostrarlo anche quando si è in modo batch); oppure, un nome di file.
1113Nell'ultimo caso l'effetto è lo stesso dell'opzione --output del comando
1114"gnuplot".
1115
1116Accesso dal menù:    Finestra del modello, /Test/CUSUM(SQ)
1117
1118# data Dataset
1119
1120Argomento:  lista-variabili
1121Opzioni:    --compact=metodo (specifica un metodo di aggregazione)
1122            --interpolate (interpola i dati a bassa frequenza)
1123            --quiet (non mostra i risultati tranne che in caso di errore)
1124            --name=identificatore (rinomina le serie importate)
1125            --odbc (importa via ODBC)
1126            --no-align (specifico per ODBC, vedi sotto)
1127
1128Legge le variabili nella lista-variabili da un database (gretl, RATS 4.0 o
1129PcGive), che deve essere stato precedentemente aperto con il comando "open".
1130Il comando data è anche usat pe rimportare dati da DB.NOMICS o da una fonte
1131dati ODBC; per maggiori dettugli su queste varianti si vedano
1132rispettivamente gretl + DB.NOMICS e la guida all'uso di gretl (il capitolo
113342).
1134
1135La frequenza dei dati e l'intervallo del campione possono essere impostati
1136usando i comandi "setobs" e "smpl" prima di questo comando. Ecco un esempio
1137completo:
1138
1139	open fedstl.bin
1140	setobs 12 2000:01
1141	smpl ; 2019:12
1142	data unrate cpiaucsl
1143
1144Questi comandi aprono il database chiamato fedstl.bin (fornito con gretl),
1145impostano un dataset mensile che va da gennaio 2000 a dicembre 2019 e infine
1146importano le serie unrate e cpiaucsl.
1147
1148Se non si specificano setobs e smpl nel modo descritto, la frequenza dei
1149dati e l'intervallo del campione vengono impostati usando la prima variabile
1150letta dal database.
1151
1152Se le serie da leggere hanno frequenza maggiore di quella impostata nel
1153dataset, è possibile specificare un metodo di compattamento, come mostrato
1154di seguito
1155
1156	data LHUR PUNEW --compact=average
1157
1158I cinque metodi di compattamento disponibili sono "average" (usa la media
1159delle osservazioni ad alta frequenza), "last" (usa l'ultima osservazione),
1160"first", "sum" e "spread". Se non si specifica alcun metodo, verrà usata la
1161media delle osservazioni. Il metodo "spread" è speciale: l'informazione,
1162anziché essere condensata, verrà suddivisa su più serie, una per
1163sottoperiodo. Ad esempio, l'aggiunta di una serie mensile ad un dataset
1164trimestrale provoca la creazione di tre, serie, una per ogni mese del
1165trimestre; nei loro nomi compaiono i suffissi m01, m02 e m03.
1166
1167Se la serie in ingresso è a frequenza più bassa di quella del dataset, il
1168default è ripetere il valore dei dati in ingresso; in seguito, si può
1169usare la funzione "tdisagg" per disaggregare temporalmente la serie.
1170
1171Se il database è in formato nativo gretl, i caratteri "glob" * e ? can be
1172used in varlist, nella ricerca delle serie da importare. L'esempio che segue
1173importerà tutte le serie i cui nomi comiciano per cpi:
1174
1175	data cpi*
1176
1177L'opzione --name può essere utilizzata per impostare un nome diverso
1178dall'originale per le nuove serie storiche importate nel dataset. Il
1179parametro deve essere un identificatore valido. Questa opzione è
1180circoscritta al caso in cui è stata specificata una singola serie storica
1181per l'importazione.
1182
1183L'opzione --no-align produce effetti solo quando si importano serie via
1184ODBC. Per impostazione predefinita, la query ODBC deve ritornare delle
1185informazioni con cui gretl possa piazzare i dati in ingresso nelle righe
1186appropriate del dataset -- o per lo meno, che il numero di cifre in entrata
1187coincida con la lunghezza del dataset o del sottocampione attuale. Con
1188l'opzione --no-align questo requisito viene allentato: se le condizioni di
1189cui sopra non sono rispettate, i datri in ingresso sono semplicemente messi
1190all'inizio del dataset, partendo dalla prima riga. Se i dati in ingresso
1191sono meno della dimensione del campione, le righe in eccesso saranno
1192riempite con NAs; altrimenti, i dati in più verranno buttati via. Per
1193maggiori dettagli sull'importazione via ODBC, si veda la guida all'uso di
1194gretl (il capitolo 42).
1195
1196Accesso dal menù:    /File/Database
1197
1198# dataset Dataset
1199
1200Argomenti:  parola-chiave parametri
1201Opzione:    --panel-time (vedi oltre, sotto addobs)
1202Esempi:     dataset addobs 24
1203            dataset insobs 10
1204            dataset compact 1
1205            dataset compact 4 last
1206            dataset expand
1207            dataset transpose
1208            dataset sortby x1
1209            dataset resample 500
1210            dataset renumber x 4
1211            dataset pad-daily 7
1212            dataset clear
1213
1214Esegue varie operazioni sull'intero dataset, a seconda della parola-chiave
1215usata, che può essere addobs, insobs, clear, compact, expand, transpose,
1216sortby, dsortby, resample, renumber o pad-daily. Nota: ad eccezione del
1217comando clear questi comandi non sono disponibili quando sul dataset è
1218definito un sotto-campione ottenuto selezionando le osservazioni con un
1219criterio Booleano.
1220
1221addobs: deve essere seguito da n, un intero positivo. Aggiunge n
1222osservazioni alla fine del dataset, tipicamente a scopo di ottenere delle
1223previsioni. I valori della maggior parte delle variabili nell'intervallo
1224aggiunto sono impostati come valori mancanti, ma alcune variabili
1225deterministiche, ad esempio le tendenze lineari e le variabili dummy
1226periodiche, sono riconosciute ed estese. Se il dataset aperto è di tipo
1227panel, l'opzione --panel-time è quella di allungare il campione di n
1228osservazioni per ogni unità cross-sezionale (mentre il default è di
1229aggiungere nunità).
1230
1231insobs: Deve essere seguito da un intero positivo inferiore o uguale al
1232numero corrente di osservazioni. Inserisce una singola osservazione nella
1233posizione specificata. Tutti i dati successivi sono spostati di una
1234posizione e il dataset è allungato di un'osservazione. In corrispondenza
1235della nuova osservazione a tutte le variabili, a parte la costante, vengono
1236assegnati valori mancanti. Questa azione non è disponibile in dataset
1237panel.
1238
1239clear: Non richiede parametri. Elimina il campione corrente e riporta gretl
1240al suo stato iniziale senza dati.
1241
1242compact: deve essere seguito da un intero positivo che rappresenta la nuova
1243frequenza dei dati, che dovrebbe essere minore di quella attuale (ad esempio
1244un valore 4 quando la frequenza attuale è 12 significa che si compatterà
1245un dataset mensile in uno trimestrale). Questo comando è disponibile solo
1246se il dataset contiene serie storiche: compatta tutte le serie del dataset
1247alla nuova frequenza. È possibile dare un secondo parametro, tra sum,
1248first, last o spread, per specificare, rispettivamente, di compattare usando
1249la somma dei valori alla frequenza maggior, i valori di inizio periodo o
1250fine periodo, o di "spalmare" i valori ad alta frequenza su più serie (una
1251per sottoperiodo). Il comportamento predefinito consiste nel prendere la
1252media dei valori sul periodo.
1253
1254expand: Questo comando è disponibile solo per serie storiche annuali o
1255trimestrali. I dati annuali vengono espansi a trimestrali, quelli
1256trimestrali a mensili. Tutte le serie nel dataset verranno espanse ripetendo
1257il valore a bassa frequenza. Se il dataset originale è annual l'espansione
1258di defaultè trimestrale ma si può far seguire expand dal numero 12 per
1259effettuare l'espansione a mensile.
1260
1261transpose: non richiede parametri aggiuntivi. Traspone il dataset attuale:
1262ogni osservazione (riga) del dataset attuale diventerà una variabile
1263(colonna), e ogni variabile un'osservazione. Questo comando è utile quando
1264si importano da fonti esterne dei dati organizzati con le variabili disposte
1265per riga.
1266
1267sortby: richiede il nome di una variabile o di una lista. Con una variabile,
1268questa viene usata come criterio di ordinamento. Le osservazioni di tutte le
1269altre variabili del dataset sono riordinate secondo valori crescenti della
1270variabile indicata. Nel caso di una lista, il comando procede
1271gerarchicamente: il primo criterio di ordinamento è la prima variabile, nel
1272caso in cui si arrivi ad una situazione di stallo si passa alla seconda
1273variabile della lista per risolvere il problema, e se il problema persiste
1274si passa alla terza e così via, finchè lo stallo non si esaurisce o si
1275esauriscono le variabili presenti nella lista. Questo comando è disponibile
1276solo per dati non datati.
1277
1278dsortby: funziona come sortby ma riordina le osservazioni secondo i valori
1279decrescenti della variabile specificata.
1280
1281resample: costruisce un nuovo dataset attraverso un campionamento causale,
1282con reimmissione, delle righe del dataset attuale. È richiesto un
1283argomento, ossia il numero di righe da includere, che può essere minore,
1284uguale o maggiore del numero di osservazioni nei dati originali. Il dataset
1285originale può essere recuperato usando il comando smpl full.
1286
1287renumber: Richiede il nome di una variabile esistente seguito da un intero
1288compreso fra 1 e il numero delle variabili nel campione meno 1. Sposta la
1289serie specificata nel dataset nella posizione indicata, rinumerando le altre
1290variabili di conseguenza. (La posizione 0 è occupata dalla costante che non
1291può essere spostata.)
1292
1293pad-daily: valido solamente se il dataset corrente contiene dei dati
1294giornalieri di un calendario incompleto. L'effetto prodotto dal comando
1295sarà quello di riempire il calendario aggiungendo le date mancanti come
1296righe vuote (in pratica significa creare delle righe vuote contenenti
1297solamente valori NA). Quest'opzione richiede un parametro intero, ovvero il
1298numero di giorni della settimana (che deve essere un numero tra 5, 6 o 7), e
1299deve essere maggiore, o uguale, alle correnti frequenze del dataset. Una
1300volta avvenuto con successo il completamento, il calendario dei dati
1301risulterà "completo" relativamente al valore del parametro dato. Ad
1302esempio, se i giorni della settimana sono 5 allora tutti i giorni della
1303settimana verranno rappresentati, sia che i dati per questi giorni siano
1304disponibili oppure no.
1305
1306Accesso dal menù:    /Dati
1307
1308# delete Dataset
1309
1310Varianti:   delete varlist
1311            delete varname
1312            delete --type=type-name
1313            delete pkgname
1314Opzioni:    --db (rimuove dal database aperto)
1315            --force (vedi sotto)
1316
1317Questo comando è uno strumento multi-uso per eliminare oggetti. Deve essere
1318usato con cautela: non viene chiesta alcuna conferma.
1319
1320Utilizzandolo nella sua prima forma, varlist è un lista di variabili aventi
1321un nome ed un numero identificativo (ID). Si noti che quando si elimina una
1322serie tutte le restanti serie con un ID maggiore della precedente vengono
1323rinumerate dopo l'eliminazione di quelle selezionate. Se si utilizza
1324l'opzione --db con questo comando verranno eliminate le liste di variabili
1325non dal corrente dataset ma dal database di gretl, assumendo che un database
1326sia stato aperto e che l'utente abbia il permesso scritto per il file in
1327questione. Si veda anche il comando "open".
1328
1329Nella seconda forma, il nome di uno scalare, matrice, stringa o bundle può
1330essere dato al comando per la cancellazione. In questo caso l'opzione --db
1331non è applicabile. Si noti che serie e variabili di tipo diverso non
1332dovrebbero essere mixate all'interno della chiamata delete.
1333
1334Nella terza forma l'opzione --type deve essere accompagnata da uno dei
1335seguenti qualificatori:matrix, bundle, string, list, scalar o array.
1336L'effetto è quello di eliminare tutte le variabili di un certo tipo. In
1337questo caso nessun altro argomento è richiesto oltre l'opzione successiva
1338richiesta.
1339
1340La quarta forma può essere utilizzata per rimuovere un pacchetto di
1341funzioni. In questo caso il suffisso .gfn deve essere fornito, come ad
1342esempio
1343
1344	delete somepkg.gfn
1345
1346Si noti che non elimina il pacchetto, quanto piuttosto lo deselezione e lo
1347rimuove dalla memoria.
1348
1349Cancellazione di variabili in un loop
1350
1351In generale, non è permesso cancellare variabili durante un loop, poiché
1352questo può mettere a repentaglio l'integrità del codice. Ciononostante, se
1353siete sicuri che l'operazione è senza rischi, questa proibizione può
1354essere disattivata usando l'opzione --force.
1355
1356Accesso dal menù:    Pop-up nella finestra principale (selezione singola)
1357
1358# diff Transformations
1359
1360Argomento:  lista-variabili
1361Esempi:     penngrow.inp, sw_ch12.inp, sw_ch14.inp
1362
1363Calcola la differenza prima di ogni variabile nella lista-variabili e la
1364salva in una nuova variabile il cui nome è prefissato con d_. Quindi "diff
1365x y" crea le nuove variabili
1366
1367	d_x = x(t) - x(t-1)
1368        d_y = y(t) - y(t-1)
1369
1370Accesso dal menù:    /Aggiungi/Differenze prime delle variabili selezionate
1371
1372# difftest Tests
1373
1374Argomenti:  var1 var2
1375Opzioni:    --sign (Test del segno, scelta predefinita)
1376            --rank-sum (Test "rank-sum" di Wilcoxon)
1377            --signed-rank (Test "signed-rank" di Wilcoxon)
1378            --verbose (Mostra informazioni aggiuntive)
1379            --quiet (Non stampa l'output)
1380Esempi:     ooballot.inp
1381
1382Esegue un test non parametrico per la differenza tra due popolazioni o
1383gruppi; il tipo di test dipende dall'opzione usata.
1384
1385Con l'opzione --sign, viene eseguito il test del segno, che si basa sul
1386fatto che per due campioni x e y estratti casualmente dalla stessa
1387distribuzione, la probabilità che valga x_i > y_i per ogni osservazione i
1388dovrebbe valere 0.5. La statistica test è w, ossia il numero di
1389osservazioni per cui vale x_i > y_i. Sotto l'ipotesi nulla, questa grandezza
1390si distribuisce come una binomiale con parametri (n, 0.5), dove n è il
1391numero di osservazioni.
1392
1393Con l'opzione --rank-sum, viene eseguito il test "rank-sum" di Wilcoxon.
1394Questo test procede ordinando le osservazioni estratte da entrambi i
1395campioni dalla più piccola alla più grande, e quindi calcolando la somma
1396dei ranghi delle osservazioni da uno dei campioni. I due campioni non devono
1397necessariamente avere la stessa dimensione: se sono diversi, viene usato il
1398campione più piccolo per calcolare la somma dei ranghi. Sotto l'ipotesi
1399nulla che i campioni siano estratti da popolazioni con la stessa mediana, la
1400distribuzione di probabilità della somma dei ranghi può essere calcolata
1401per ogni valore dell'ampiezza dei due campioni, mentre per campioni
1402abbastanza ampi essa approssima la distribuzione normale.
1403
1404Con l'opzione --signed-rank, viene eseguito il test "signed-rank" di
1405Wilcoxon. Questo test è valido per "coppie di campioni", come possono
1406essere ad esempio i valori di una variabile in un gruppo di individui prima
1407e dopo un certo trattamento. Il test procede calcolando le differenze tra le
1408coppie di osservazioni x_i - y_i, ordinando queste differenze per valore
1409assoluto e assegnando ad ogni coppia un valore di rango con segno, in cui il
1410segno rispecchia il segno della differenza. Quindi viene calcolato W_+, la
1411somma di tutti i ranghi con segno positivo. Come avviene per il test
1412rank-sum, questa statistica ha una distribuzione precisa nell'ipotesi nulla
1413che la differenza mediana sia zero, distribuzione che converte alla normale
1414nel caso di campioni abbastanza ampi.
1415
1416Usando l'opzione --verbose con i test di Wilcoxon viene mostrato
1417l'ordinamento delle osservazioni (l'opzione non ha effetto se usata con il
1418test del segno).
1419
1420Se il comando non ha dato errori, sono disponibili gli accessori "$test" e
1421"$pvalue". Per ottenere solo questi valori, si può usare l'opzione --quiet.
1422
1423# discrete Transformations
1424
1425Argomento:  lista-variabili
1426Opzione:    --reverse (marca le variabili come continue)
1427Esempi:     ooballot.inp, oprobit.inp
1428
1429Marca ogni variabile della lista-variabili come discreta. In modalità
1430predefinita, tutte le variabili sono considerate come continue; marcando una
1431variabile come discreta, essa viene trattata in modo speciale nei diagrammi
1432di frequenza, e può esere usata con il comando "dummify".
1433
1434Usando l'opzione --reverse, l'operazione viene invertita, ossia, le
1435variabili nella lista-variabili sono marcate come continue.
1436
1437Accesso dal menù:    /Variabile/Modifica attributi
1438
1439# dpanel Estimation
1440
1441Argomento:  p ; depvar indepvars [ ; instruments ]
1442Opzioni:    --quiet (non mostra il modello stimato)
1443            --vcv (mostra la matrice di covarianza)
1444            --two-step (calcola la stima GMM a due passi)
1445            --system (aggiunge equazioni nei livelli)
1446            --time-dummies (aggiunge variabili dummy temporali)
1447            --dpdstyle (emula il pacchetto DPD per Ox)
1448            --asymptotic (errori standard asintotici non modificati)
1449            --keep-extra (vedi sotto)
1450Esempi:     dpanel 2 ; y x1 x2
1451            dpanel 2 ; y x1 x2 --system
1452            dpanel {2 3} ; y x1 x2 ; x1
1453            dpanel 1 ; y x1 x2 ; x1 GMM(x2,2,3)
1454            Vedi anche bbond98.inp
1455
1456Stima modelli dinamici per dati di panel (in altre parole, modelli panel con
1457uno o più ritardi della variabile dipendente) usando il metodo GMM-DIF o
1458quello GMM-SYS.
1459
1460Il paramtro p rappresenta l'ordine autoregressivo della variabile
1461dipendente. Nel caso più semplice si tratta di uno scalare, ma per
1462specificare un insieme di ritardi (non consecutivi) da è possibile indicare
1463una matrice definita in precedenza.
1464
1465La variabile dipendente e i regressori dovrebbero essere indicati in
1466livelli; il comando provvede autonomamente a differenziarli (dato che questo
1467stimatore usa le differenze per eliminare gli effetti individuali).
1468
1469L'ultimo campo (opzionale) nel comando serve a specificare gli strumenti. Se
1470questi ultimi non vengono indicati si assume che le variabili indipendenti
1471siano tutte strettamente esogene. Se si sceglie di specificare alcuni
1472strumenti è opportuno includere nell'elenco anche le variabili indipendenti
1473strettamente esogene. Nel caso di regressori predeterminati è possibile
1474usare la funzione GMM per includere uno specifico intervallo di ritardi
1475seguendo uno schema diagonale a blocchi. Una situazione di questo tipo è
1476stata illustrata in precedenza nel terzo esempio. Il primo argomento di GMM
1477è il nome della variabile in questione, il secondo è il ritardo minimo da
1478usare come strumento e il terzo è il ritardo massimo. La stessa sintassi
1479può essere utilizzata con la funzione GMMlevel per specificare strumenti di
1480tipo GMM per le equazioni nei livelli.
1481
1482Di default vengono riportati (con errori standard robusti) i risultati della
1483stima al primo stadio; la stima al secondo stadio può essere richiesta
1484indicato l'opzione corrispondente. In entrambi i casi vengono forniti i test
1485di autocorrelazione del primo e del secondo ordine, così come il test di
1486sovraidentificazione di Sargan e un test di Wald della significatività
1487congiunta dei regressori. Si noti che in questo modello nelle differenze
1488l'autocorrelazione del primo ordine non impedisce che il modello sia valido;
1489l'autocorrelazione al secondo ordine, tuttavia, viola le ipotesi statistiche
1490che ne sono alla base.
1491
1492Nel caso della stima a due passi, gli errori standard sono per default
1493calcolati usando la correzione per campioni finiti suggerita da Windmeijer
1494(2005). In generale l'inferenza basata sugli errori standard asintotici
1495associati allo stimatore al secondo stadio è considerata inaffidabile, ma
1496se per qualche ragione desiderate conoscere il loro valore potete usare
1497l'opzione --asymptotic per disattivare la correzione di Windmeijer.
1498
1499Se viene indicata l'opzione --time-dummies il comando aggiunge ai regressori
1500specificati un insieme di variabili dummy. Il numero di queste ultime è
1501pari al numero massimo di periodi usati nella stima meno uno, allo scopo di
1502evitare di avere collinearità perfetta con la costante. Le dummy vengono
1503incluse in differenza, a meno che non sia indicata l'opzione --dpdstyle; in
1504questo caso le dummy sono incluse in livello.
1505
1506Come per altri comandi di stima, un bundle di nome "$model" è disponibile
1507se il comando va a buon fine. Nel caso del comando dpanel, l'opzione
1508--keep-extra provoca l'inclusione nel bundle di elementi addizionali, e
1509cioè i pesi GMM e la matrice degli strumenti.
1510
1511Per ulteriori dettagli ed esempi, si veda la guida all'uso di gretl (il
1512capitolo 24).
1513
1514Accesso dal menù:    /Model/Panel/Dynamic panel model
1515
1516# dummify Transformations
1517
1518Argomento:  lista-variabili
1519Opzioni:    --drop-first (omette dalla codifica il valore minimo)
1520            --drop-last (omette dalla codifica il valore massimo)
1521
1522Per ogni variabile rilevante nella lista-variabili, crea un insieme di
1523variabili dummy che codificano i valori distinti di quella variabile. Le
1524variabili rilevanti sono quelle che sono state marcate esplicitamente come
1525discrete, o quelle che assumono un numero limitato di valori che devono
1526essere "abbastanza arrotondati" (multipli di 0.25).
1527
1528Per impostazione predefinita, viene aggiunta una variabile dummy per ognuno
1529dei valori distinti della variabile in questione. Ad esempio, se una
1530variabile discreta x ha 5 valori distinti, verranno create 5 variabili
1531dummy, di nome Dx_1, Dx_2 e così via. La prima variabile dummy avrà valore
15321 per le osservazioni in cui x assume il suo valore minimo, e 0 altrove; la
1533successiva variabile dummy avrà valore 1 dove x assume il secondo tra i
1534suoi valori, e così via. Se viene usata una delle opzioni --drop-first o
1535--drop-last, il più basso o il più alto dei valori della variabile viene
1536omesso dalla codifica (questa funzione può essere utile per evitare la
1537cosiddetta "trappola delle variabili dummy").
1538
1539Questo comando può anche essere usato nel contesto di una regressione. Ad
1540esempio, la riga seguente specifica un modello in cui y viene regredita
1541sull'insieme di variabili dummy che codificano x (in questo contesto non è
1542possibile passare opzioni al comando "dummify").
1543
1544	ols y dummify(x)
1545
1546# duration Estimation
1547
1548Argomenti:  depvar indepvars [ ; censvar ]
1549Opzioni:    --exponential (usa la distribuzione esponenziale)
1550            --loglogistic (usa la distribuzione log-logistica)
1551            --lognormal (usa la distribuzione log-normale)
1552            --medians (i valori previsti sono mediane)
1553            --robust (errori standard robusti (QML))
1554            --cluster=clustvar (v. "logit" per una spiegazione)
1555            --vcv (mostra la matrice di covarianza)
1556            --verbose (mostra dettagli delle iterazioni)
1557            --quiet (non mostra nulla)
1558Esempi:     duration y 0 x1 x2
1559            duration y 0 x1 x2 ; cens
1560            Vedi anche weibull.inp
1561
1562Stima un modello di durata: la variabile dipendente (che deve essere
1563positiva) rappresenta la durata di un certo fenomeno, per esempio la
1564lunghezza di un periodo di disoccupazione per una cross-section di
1565intervistati. Di default viene utilizzata una distribuzione Weibull, ma sono
1566disponibili anche le distribuzioni esponenziale, log-logistica e
1567log-normale.
1568
1569Se alcune delle durate misurate sono censurate a destra (e.g. il periodo di
1570disoccupazione di un individuo non si è concluso all'interno del periodo di
1571osservazione), deve essere specificato l'argomento accessorio censvar che
1572indica una variabile i cui valori positivi segnalano osservazioni censurate
1573a destra.
1574
1575Di default i valori stimati ottenuti mediante l'accessore "$yhat"
1576rappresentano le medie condizionali delle durate; se tuttavia viene indicata
1577l'opzione --medians, "$yhat" fornisce le mediane condizionali.
1578
1579Vedi la guida all'uso di gretl (il capitolo 38) per ulteriori dettagli.
1580
1581Accesso dal menù:    /Modello/Variabile dipendente limitata/Dati di durata
1582
1583# elif Programming
1584
1585Si veda "if".
1586
1587# else Programming
1588
1589Si veda "if". Si noti che "else" dev'essere su un linea a sé stante, prima
1590del comando corrispondente. Si può aggiungere un commento, come ad esempio
1591
1592	else # OK, fa' un'altra cosa
1593
1594ma non si può aggiungere un comando, come in
1595
1596	else x = 5 # wrong!
1597
1598# end Programming
1599
1600Termina un blocco di comandi di qualsiasi tipo. Ad esempio, "end system"
1601termina un "system" (sistema di equazioni).
1602
1603# endif Programming
1604
1605Si veda "if".
1606
1607# endloop Programming
1608
1609Indica la fine di un ciclo (loop) di comandi. Si veda "loop".
1610
1611# eqnprint Printing
1612
1613Opzioni:    --complete (crea un documento completo)
1614            --output=filename (indirizza l'output ad uno specifico file)
1615
1616Va eseguito dopo la stima di un modello. Stampa il modello stimato sotto
1617forma di equazione LaTeX. Se viene specificato un nome di file usando
1618l'opzione --output, il risultato viene scritto in quel file, altrimenti
1619viene scritto in un file il cui nome ha la forma equation_N.tex, dove N è
1620il numero di modelli stimati finora nella sessione in corso. Si veda anche
1621"tabprint".
1622
1623Il file di output verrà scritto nella directory correntamente impostata
1624"workdir", a meno che la stringa filename contenga il percorso specifico
1625completo.
1626
1627Usando l'opzione --complete, il file LaTeX è un documento completo, pronto
1628per essere processato; altrimenti il file va incluso in un documento.
1629
1630Accesso dal menù:    Finestra del modello, /LaTeX
1631
1632# equation Estimation
1633
1634Argomenti:  variabile-dipendente variabili-indipendenti
1635Esempio:    equation y x1 x2 x3 const
1636
1637Specifica un'equazione all'interno di un sistema di equazioni (si veda
1638"system"). La sintassi per specificare un'equazione in un sistema SUR è la
1639stessa usata ad esempio in "ols". Per un'equazione in un sistema con minimi
1640quadrati a tre stadi, invece è possibile usare una specificazione simile a
1641quella usata per OLS e indicare una lista di strumenti comuni usando
1642l'istruzione "instr" (si veda ancora "system"), oppure si può usare la
1643stessa sintassi di "tsls".
1644
1645# estimate Estimation
1646
1647Argomenti:  [ nome-sistema ] [ stimatore ]
1648Opzioni:    --iterate (itera fino alla convergenza)
1649            --no-df-corr (nessuna correzione per i gradi di libertà)
1650            --geomean (si veda oltre)
1651            --quiet (non mostra i risultati)
1652            --verbose (mostra i dettagli delle iterazioni)
1653Esempi:     estimate "Klein Model 1" method=fiml
1654            estimate Sys1 method=sur
1655            estimate Sys1 method=sur --iterate
1656
1657Esegue la stima di un sistema di equazioni, che deve essere stato definito
1658in precedenza usando il comando "system". Per prima cosa va indicato il nome
1659del sistema, racchiuso tra virgolette se contiene spazi, quindi il tipo di
1660stimatore, preceduto dalla stringa method=. Gli stimatori disponibili sono:
1661"ols", "tsls", "sur", "3sls", "fiml" o "liml". Questi argomento sono
1662opzionali si il sistema in questione è già stato stimato e occupa il posto
1663dell'"ultimo modello"; in tal caso, per default viene usato il metodo di
1664stima precedente.
1665
1666Se al sistema in questione sono stati imposti dei vincoli (si veda il
1667comando "restrict"), la stima sarà soggetta a tali vincoli.
1668
1669Se il metodo di stima è "sur" o "3sls" e viene usata l'opzione --iterate,
1670lo stimatore verrà iterato. Nel caso di SUR, se la procedura converge, i
1671risultati saranno stime di massima verosimiglianza. Invece l'iterazione
1672della procedura dei minimi quadrati a tre stadi non produce in genere
1673risultati di massima verosimiglianza a informazione completa. L'opzione
1674--iterate viene ignorata con gli altri metodi di stima.
1675
1676Se vengono scelti gli stimatori "equazione per equazione" "ols" o "tsls",
1677nel calcolo degli errori standard viene applicata in modo predefinito una
1678correzione per i gradi di libertà, che può essere disabilitata usando
1679l'opzione --no-df-corr. Questa opzione non ha effetti nel caso vengano usati
1680altri stimatori, che non prevedono correzioni per i gradi di libertà.
1681
1682La formula usata in modo predefinito per calcolare gli elementi della
1683matrice di covarianza tra equazioni è
1684
1685  sigma(i,j) = u(i)' * u(j) / T
1686
1687Se viene usata l'opzione --geomean, viene applicata una correzione per i
1688gradi di libertà secondo la formula
1689
1690  sigma(i,j) = u(i)' * u(j) / sqrt((T - ki) * (T - kj))
1691
1692dove i k indicano il numero di parametri indipendenti in ogni equazione.
1693
1694Se si usa l'opzione --verbose e un metodo iterativo, vengono mostrati i
1695dettagli delle iterazioni.
1696
1697# eval Utilities
1698
1699Argomento:  espressione
1700Esempi:     eval x
1701            eval inv(X'X)
1702            eval sqrt($pi)
1703
1704Con questo comando, gretl diventa una specie di grande calcolatrice. Il
1705programma valuta l'espressione e stampa il risultato. L'argomento può
1706essere il nome di una variabile, o qualcosa di più complicato. In ogni
1707caso, dev'essere un'espressione ammissibile a destra dell'operatore di
1708assegnamento.
1709
1710Si noti che un comando del tipo
1711
1712	print x^2
1713
1714non funziona in gretl, poiché x^2 non è (né può essere) il nome di una
1715variabile, ma (data una variabile scalare di nome x)
1716
1717	eval x^2
1718
1719funzionerà tranquillamente, e mostrerà il quadrato di x.
1720
1721Vedi anche "printf", per il caso in cui si voglia combinare testo e output
1722numerici.
1723
1724# fcast Prediction
1725
1726Varianti:
1727
1728	    fcast [oss-iniziale oss-finale]
1729	    [nome-variabile]
1730
1731	    fcast [oss-iniziale oss-finale]
1732
1733	  passi-avanti
1734
1735	    [nome-variabile] --recursive
1736
1737Opzioni:    --dynamic (crea previsioni dinamiche)
1738            --static (crea previsioni statiche)
1739            --out-of-sample (genera previsioni fuori dal campione)
1740            --no-stats (non mostra le statistiche di previsione)
1741            --stats-only (stampa solo le statistiche di previsione)
1742            --quiet (non mostra le previsioni)
1743            --recursive (vedi sotto)
1744            --plot=nome di file (vedi sotto)
1745Esempi:     fcast 1997:1 2001:4 f1
1746            fcast fit2
1747            fcast 2004:1 2008:3 4 rfcast --recursive
1748            Vedi anche gdp_midas.inp
1749
1750Deve seguire un comando di stima. Calcola previsioni per un certo intervallo
1751delle osservazioni. L'intervallo può essere specificato indicando
1752oss-iniziale e oss-finale, oppure con l'opzione --out-of-sample (in questo
1753caso la previsione sarà per le osservazioni successive a quelle su cui è
1754stato stimato il modello); se non si usa alcuna opzione, l'intervallo sarà
1755quello attualmente impostato. Se si sceglie una previsione fuori dal
1756campione ma non sono disponibili osservazioni, viene segnalato un errore. A
1757seconda del tipo di modello, calcola anche gli errori standard (si veda
1758oltre). L'opzione --recursive produce un comportamento speciale spiegato
1759oltre.
1760
1761Se l'ultimo modello stimato consiste in un'equazione singola, l'argomento
1762opzionale nome-variabile ha l'effetto seguente: i valori della previsione
1763non sono mostrati, ma vengono salvati nel dataset con il nome di variabile
1764indicato. Se l'ultimo modello stimato è un sistema di equazioni,
1765nome-variabile ha un effetto diverso, ossia seleziona una particolare
1766varabile endogena per cui effettuare la previsione (l'impostazione
1767predefinita consiste nel produrre previsioni per tutte le variabili
1768endogene). Nel caso del sistema, o se non viene specificata nome-variabile,
1769i valori della previsione possono essere recuperati usando la variabile
1770accessoria "$fcast", mentre gli errori standard, se disponibili, sono
1771recuperabili con "$fcse".
1772
1773La scelta tra previsione statica e dinamica è rilevante solo nel caso di
1774modelli dinamici, che comprendono un processo di errore autoregressivo, o
1775che comprendono uno o più valori ritardati della variabile dipendente come
1776regressori. Le previsioni statiche sono per il periodo successivo, basate
1777sui valori effettivi nel periodo precedente, mentre quelle dinamiche usano
1778la regola della previsione a catena. Ad esempio, se la previsione per y nel
17792008 richiede come input il valore di y nel 2007, non è possibile calcolare
1780una previsione statica se non si hanno dati per il 2007. È possibile
1781calcolare una previsione dinamica per il 2008 se si dispone di una
1782precedente previsione per y nel 2007.
1783
1784La scelta predefinita consiste nel fornire una previsione statica per ogni
1785porzione dell'intervallo di previsione che fa parte dell'intervallo del
1786campione su cui il modello è stato stimato, e una previsione dinamica (se
1787rilevante) fuori dal campione. L'opzione dynamic richiede di produrre
1788previsioni dinamiche a partire dalla prima data possibile, mentre l'opzione
1789static richiede di produrre previsioni statiche anche fuori dal campione.
1790
1791L'opzione recursive al momento è disponibile solo per i modelli composti da
1792una singola equazione e stimati via OLS. Quando si usa questa opzione, le
1793previsioni calcolate sono ricorsive, ossia: ogni previsione è generata da
1794una stima del modello che usa i dati a partire da un certo punto fisso
1795(ossia l'inizio dell'intervallo del campione usato per la stima originaria)
1796fino alla data di previsione meno k osservazioni, dove k è il numero di
1797passi-avanti specificato come argomento. Le previsioni sono sempre dinamiche
1798quando è possibile. Si noti che l'argomento passi-avanti deve essere
1799utilizzato solo insieme all'opzione recursive.
1800
1801L'opzione --plot (disponibile solo nel caso della stima di un modello
1802uniequazionale) consente di ottenere un file con un grafico delle
1803previsioni. L'estensione dell'argomento filename di questa opzione controlla
1804il formato del grafico: .eps per EPS, .pdf per PDF, .png per PNG, .plt per
1805un file di comandi gnuplot. Il nome di file dummy display può essere usato
1806per mostrare il grafico in una finestra. Per esempio,
1807
1808	fcast --plot=fc.pdf
1809
1810genererà un grafico in formato PDF. Vengono rispettati gli indirizzi di
1811file assoluti; in caso contrario i fail vengono scritti nella directory di
1812lavoro di gretl.
1813
1814La natura degli errori standard della previsione (se disponibili) dipende
1815dalla natura del modello e della previsione. Per i modelli lineari statici,
1816gli errori standard sono calcolati seguendo il metodo descritto in Davidson
1817e MacKinnon (2004); essi incorporano sia l'incertezza dovuta al processo
1818d'errore, sia l'incertezza dei parametri (sintetizzata dalla matrice di
1819covarianza delle stime dei parametri). Per modelli dinamici, gli errori
1820standard della previsione sono calcolati solo nel caso di previsione
1821dinamica, e non incorporano incertezza dei parametri. Per modelli non
1822lineari, al momento non sono disponibili errori standard della previsione.
1823
1824Accesso dal menù:    Finestra del modello, /Analisi/Previsioni
1825
1826# flush Programming
1827
1828Questo semplice comando non ha argomenti né opzioni; è pensato per
1829l'esecuzione di script, la cui esecuzione richieda qualche tempo, attraverso
1830l'interfaccia grafica (la versione di gretl da linea di comando lo ignora).
1831L'idea è di fornire all'utente un'indicazione visuale che sta succedendo
1832qualcosa e il programma non si è "piantato".
1833
1834Normalmente, quando uno script viene fatto girare nel client grafico, non
1835viene mostrato alcun output finché l'esecuzione non è completa; se perà
1836si usa flush l'effetto prodotto è il seguente:
1837
1838  Alla prima invocazione, gretl apre una finestra, mostra l'output prodotto
1839  fino a quel momento, e aggiunge il messaggio "elaborazione in corso...".
1840
1841  Ad ogni invocazione successiva, il testo mostrato nella finestra di output
1842  viene aggiornato e un nuovo messaggio "elaborazione in corso..." viene
1843  aggiunto.
1844
1845Tutto il resto dell'output viene automaticamente mostrato al completamenteo
1846dell'esecuzione dello script.
1847
1848Attenzione: non ha senso usare flush in uno script la cui esecuzione
1849richiede pochi secondi. Inoltre, bisognerebbe evitare di usare questo
1850comando in un punto dello script dove non c'è più output da mostrare,
1851perché il messaggio "elaborazione in corso..." risulterebbe fuorviante.
1852
1853L'uso che abbiamo in mente per il comando flush è esemplificato dal
1854seguente frammento:
1855
1856	set echo off
1857	scalar n = 10
1858	loop i=1..n
1859	# qualcosa che richiede del tempo
1860	loop 100 --quiet
1861	a = mnormal(200,200)
1862	b = inv(a)
1863	endloop
1864	# stampa qualcosa in output
1865	printf "Iterazione %2d fatta\n", i
1866	if i < n
1867	flush
1868	endif
1869	endloop
1870
1871# foreign Programming
1872
1873Sintassi:   foreign language=lang
1874Opzioni:    --send-data (pre-carica il dataset attuale)
1875            --quiet (sopprime l'output dal programma esterno)
1876
1877Questo comando apre una modalità speciale, in cui vengono accettati comandi
1878che verranno eseguiti da un programma esterno. Con il comando end foreign si
1879esce da questa modalità e i comandi verranno eseguiti.
1880
1881Al momento, i programmi esterni compatibili con questa modalità sono GNU R
1882(language=R), Ox di Jurgen Doornik Ox (language=Ox), GNU Octave
1883(language=Octave), Python, Julia e Stata. I nomi dei programmi esterni sono
1884case-insensitive.
1885
1886Con R, Octave e Stata l'opzione --send-data ha l'effetto di rendere
1887disponibile all'interno del programma di destinazione l'intero dataset
1888corrente. È possibile limitare l'invio dell'intero dataset al programma di
1889destinazione attraverso la creazione preventiva di una lista di variabili, a
1890cui va assegnato un nome che dovrà essere dato in specifica al comando. Di
1891seguito un esempio:
1892
1893	list Rlist = x1 x2 x3
1894	foreign language=R --send-data=Rlist
1895
1896Si veda la guida all'uso di gretl (il capitolo 44) per dettagli ed esempi.
1897
1898# fractint Statistics
1899
1900Argomenti:  series [ order ]
1901Opzioni:    --gph (calcola il test di Geweke e Porter-Hudak)
1902            --all (calcola entrambi i test)
1903            --quiet (non mostra i risultati)
1904
1905Verifica la presenza di integrazione frazionale ("long memory") per la
1906variabile specificata. L'ipotesi nulla è che l'ordine di integrazione della
1907variabile sia zero. Di default viene utilizzato lo stimatore locale di
1908Whittle (Robinson, 1995), ma se si indica l'opzione --gph il comando usa il
1909test GPH (Geweke e Porter-Hudak, 1983). L'opzione --all permette di ottenere
1910i risultati di entrambi i test.
1911
1912Per maggiori dettagli su questo tipo di test, v. Phillips e Shimotsu (2004).
1913
1914Se non si specifica l'argomento opzionale order, l'ordine del test (o dei
1915test) è automaticamente fissato al più piccolo fra T/2 e T^0.6.
1916
1917Gli ordini di integrazione stimati e i loro errori standard sono disponibili
1918con l'accessore "$result". Con l'opzione --all, lo stimatore Local Whittle
1919è nella prima riga e il GPH nella seconda.
1920
1921I risultati possono essere recuperati usando gli accessori "$test" e
1922"$pvalue". Questi valori sono basati sullo stimatore locale di Whittle a
1923meno che non sia stata indicata l'opzione --gph.
1924
1925Accesso dal menù:    /Variabile/Test per radici unitarie/Integrazione frazionale
1926
1927# freq Statistics
1928
1929Argomento:  variabile
1930Opzioni:    --nbins=n (specifica il numero di intervalli)
1931            --min=minval (specifica il valore minimo, v. oltre)
1932            --binwidth=width (specifica l'ampiezza degli intervalli, v. oltre)
1933            --normal (test per la distribuzione normale)
1934            --gamma (test per la distribuzione gamma)
1935            --silent (non mostra nulla)
1936            --matrix=nome (usa una colonna di una matrice indicata per nome)
1937            --show-plot (v. oltre)
1938            --quiet (non mostra il grafico)
1939Esempi:     freq x
1940            freq x --normal
1941            freq x --nbins=5
1942            freq x --min=0 --binwidth=0.10
1943
1944Se non vengono indicate opzioni, mostra la distribuzione di frequenza per la
1945variabile (indicata con il nome o il numero).
1946
1947Se viene indicata l'opzione --matrix, var (che deve essere un intero) viene
1948invece interpretato come un indice di base 1 che individua una colonna in
1949una matrice indicata per nome. Nel caso in cui la matrice in questione sia
1950un vettore colonna allora l'argomento var può essere omesso.
1951
1952Per controllare la presentazione della distribuzione è possibile
1953specificare o il numero di intervalli o il valore minimo più l'ampiezza
1954degli intervalli, come illustrato negli ultimi due esempi precedenti.
1955L'opzione --min fissa il limite inferiore dell'intervallo più a sinistra.
1956
1957Usando l'opzione --normal, vengono mostrati i risultati del test chi-quadro
1958di Doornik-Hansen per la normalità. Usando l'opzione --gamma, al posto del
1959test di normalità viene eseguito il test non parametrico di Locke per
1960l'ipotesi nulla che la variabile segua la distribuzione gamma; si veda Locke
1961(1976), Shapiro e Chen (2001). Si noti che la parametrizzazione della
1962distribuzione gamma in gretl è (forma, scala).
1963
1964Di default, viene mostrato un grafico della distribuzione se il programma
1965non è in batch mode ma in modalità interattiva. Questo comportamento può
1966essere modulato con l'opzione --plot. I parametri accettabili per questa
1967opzione sono none, per sopprimere il grafico, display, per mostrare il
1968grafico a video anche in batch mode, o un nome di file. L'effetto del
1969fornire un nome di file è lo stesso di quello descritto dall'opzione
1970--output del comando "gnuplot".
1971
1972In modalità interattiva viene mostrato anche un grafico della
1973distribuzione, a meno che non si usi l'opzione --quiet. Per converso, il
1974grafico non viene mostrato quando il comando è invocato da script, a meno
1975che non venga usata l'opzione --show-plot. (Questo non si applica alla
1976versione di gretl a linea di comando, gretlcli.)
1977
1978L'opzione --silent sopprime interamente l'output mostrato di solito. Ha
1979senso usarla insieme a una delle opzioni riguardanti la distribuzione: in
1980questo modo la statistica test e il suo p-value verranno salvati, e potranno
1981essere recuperati attraverso l'utilizzo degli accessori "$test" e "$pvalue".
1982Può anche essere utilizzato assieme all'opzione --plot se si è solamente
1983interessati alla visione dei relativi istogrammi e non si è interessati al
1984resto del testo.
1985
1986Si noti che in gretl non è disponibile una funzione che è parallela a
1987questo comando, ma è possibile utilizzare una funzione parallela che
1988permette di raggiungere lo stesso scopo, che è "aggregate". Inoltre la
1989distribuzione di frequenza costruita con il comando freq può essere
1990ottenuta in forma matriciale attraverso l'utilizzo dell'accessore "$result".
1991
1992Accesso dal menù:    /Variabile/Distribuzione di frequenza
1993
1994# funcerr Programming
1995
1996Argomento:  [ messaggio ]
1997
1998Questo comando è utilizzabile soltanto nel contesto di funzioni definite
1999dall'utente (vedi "function"); esso provoca un'interruzione della funzione
2000con errore.
2001
2002Il parametro opzionale messaggio dev'essere una stringa (anche sotto forma
2003di variabile); se presente, viene stampato assieme al messaggio di errore
2004inviato alla funzione chiamante.
2005
2006# function Programming
2007
2008Argomento:  nome_funzione
2009
2010Apre un blocco di istruzioni che definiscono una funzione. Il blocco va
2011chiuso con end function. (Eccezione: per cancellare dalla memoria una
2012funzione definita dall'utente, si usa il comando function pippo delete, dove
2013"pippo" è la funzione da cancellare.) Per maggiori dettagli, si veda la
2014guida all'uso di gretl (il capitolo 14).
2015
2016# garch Estimation
2017
2018Argomenti:  p q ; variabile-dipendente [ variabili-indipendenti ]
2019Opzioni:    --robust (errori standard robusti)
2020            --verbose (mostra i dettagli delle iterazioni)
2021            --quiet (non stampa nulla)
2022            --vcv (mostra la matrice di covarianza)
2023            --nc (non include una costante)
2024            --stdresid (standardizza i residui)
2025            --fcp (usa l'algoritmo di Fiorentini, Calzolari e Panattoni)
2026            --arma-init (parametri di varianza iniziale da ARMA)
2027Esempi:     garch 1 1 ; y
2028            garch 1 1 ; y 0 x1 x2 --robust
2029            Vedi anche garch.inp, sw_ch14.inp
2030
2031Stima un modello GARCH (Generalized Autoregressive Conditional
2032Heteroskedasticity) univariato, o, se sono specificate delle
2033variabili-indipendenti, includendo delle variabili esogene. I valori interi
2034p e q (che possono essere indicati in forma numerica o col nome di variabili
2035scalari preesistenti) rappresentano gli ordini di ritardo nell'equazione
2036della varianza condizionale.
2037
2038  h(t) = a(0) + somma(per i da 1 a q) a(i)*u(t-i)^2 + somma( per j da 1 a p) b(j)*h(t-j)
2039
2040Il parametro p rappresenta quindi l'ordine generalizzato (o "AR"), mentre q
2041rappresenta il consueto ordine ARCH (o "MA"). Se p è diverso da zero, anche
2042q deve essere diverso da zero, altrimenti il modello non è identificato.
2043Comunque, è possibile stimare un semplice modello ARCH impostando q a un
2044valore positivo e p a zero. La somma di p e q non deve superare 5. Si noti
2045che nell'equazione della media viene automaticamente inclusa una costante, a
2046meno che non si usi l'opzione --nc.
2047
2048Per impostazione predefinita, i modelli GARCH vengono stimati usando il
2049codice nativo gretl, ma è anche possibile usare l'algoritmo di Fiorentini,
2050Calzolari e Panattoni (1996). Il primo usa il massimizzatore BFGS, mentre il
2051secondo usa un algoritmo di tipo Newton-Raphson con la matrice di
2052informazione e un successivo raffinamento usando l'Hessiana.
2053
2054Sono disponibili varie stime della matrice di covarianza dei coefficienti.
2055Il metodo predefinito è quello dell'Hessiana, a meno che non si usi
2056l'opzione --robust, nel qual caso viene usata la matrice di covarianza QML
2057(White). Altre possibilità (ad es. la matrice di informazione, o lo
2058stimatore di Bollerslev-Wooldridge) possono essere specificate con il
2059comando "set".
2060
2061In modalità predefinita, le stime dei parametri di varianza sono
2062inizializzate usando la varianza dell'errore non condizionale, ottenuta
2063dalla stima OLS iniziale, per la costante, e piccoli valori positivi per i
2064coefficienti dei valori passati dell'errore al quadrato e per la varianza
2065dell'errore. L'opzione --arma-init fa in modo che i valori iniziali per
2066questi parametri siano ricavati da un modello ARMA iniziale, sfruttando la
2067relazione tra GARCH e ARMA mostrata nel capitolo 21 di Time Series Analysis
2068di Hamilton. In alcuni casi, questo metodo può aumentare le probabilità di
2069convergenza.
2070
2071I residui GARCH e la varianza condizionale stimata sono memorizzate
2072rispettivamente nelle variabili "$uhat" e "$h". Ad esempio, per ottenere la
2073varianza condizionale è possibile scrivere:
2074
2075      genr ht = $h
2076
2077Con l'opzione --stdresid, i valori di "$uhat" vengono divisi per la radice
2078di h_t.
2079
2080Accesso dal menù:    /Modello/Serie storiche/GARCH
2081
2082# genr Dataset
2083
2084Argomenti:  nuova-variabile = formula
2085
2086NOTA: questo comando ha subito molti cambiamenti e migliorie da quando
2087l'help seguente è stato scritto, per cui per informazioni complete e
2088aggiornate consigliamo di far riferimento alla guida all'uso di gretl (il
2089capitolo 10). D'altro canto, il testo che segue non contiene informazioni
2090erronee, per cui può essere interpretato come "questo ed altro".
2091
2092In contesti appropriati, series, scalar, matrix, string e bundle sono
2093sinonimi per questo comando.
2094
2095Crea nuove variabili, di solito per mezzo di trasformazioni di variabili
2096esistenti. Si veda anche "diff", "logs", "lags", "ldiff", "sdiff" e "square"
2097per alcune scorciatoie. Nel contesto di una formula genr, le variabili
2098esistenti devono essere referenziate per nome, non per numero
2099identificativo. La formula dev'essere una combinazione ben definita di nomi
2100di variabile, costanti, operatori e funzioni (descritte oltre). Ulteriori
2101dettagli su alcuni aspetti di questo comando si possono trovare nella guida
2102all'uso di gretl (il capitolo 10).
2103
2104Il comando genr può produrre come risultato una serie o uno scalare. Ad
2105esempio, la formula x2 = x * 2 produce una serie se la variabile x è una
2106serie e uno scalare se x è uno scalare. Le formule x = 0 e mx = mean(x)
2107producono degli scalari. In alcune circostanze, può essere utile che un
2108risultato scalare sia espanso in una serie o in un vettore: è possibile
2109ottenere questo risultato usando series come "alias" per il comando genr. Ad
2110esempio, series x = 0 produce una serie con tutti i valori pari a 0. Allo
2111stesso modo, è possibile usare scalar come alias per genr, ma non è
2112possibile forzare un risultato vettoriale in uno scalare: con questa parola
2113chiave si indica che il risultato dovrebbe essere uno scalare; se non lo è,
2114viene emesso un messaggio di errore.
2115
2116Quando una formula produce come risultato una serie, l'intervallo su cui
2117essi sono definiti dipende dall'impostazione attuale del campione. È quindi
2118possibile definire una serie a pezzi, alternando l'uso dei comandi smpl e
2119genr.
2120
2121Gli operatori aritmetici supportati sono, in ordine di precedenza: ^
2122(esponenziale); *, / e % (modulo o resto); + e -.
2123
2124Gli operatori Booleani disponibili sono (ancora in ordine di precedenza): !
2125(negazione), && (AND logico), || (OR logico), >, <, =, >= (maggiore o
2126uguale), <= (minore o uguale) e != (disuguale). Gli operatori Booleani
2127possono essere usati per costuire variabili dummy: ad esempio (x > 10)
2128produce 1 se x > 10, 0 altrimenti.
2129
2130Le costanti predefinite sono pi e NA. L'ultima rappresenta il codice per i
2131valori mancanti: è possibile inizializzare una variabile con valori
2132mancanti usando scalar x = NA.
2133
2134Il comando genr supporta un'ampia gamma di funzioni matematiche e
2135statistiche, da quelle più comuni a quelle di uso specifico in econometria.
2136Inoltre offre l'accesso a numerose variabili interne che vengono definite
2137nel corso della stima di regressioni, dell'esecuzione di test, e così via.
2138Per un elenco delle funzioni e degli accessori, eseguire: "help functions".
2139
2140Oltre agli operatori e alle funzioni mostrati, ci sono alcuni usi speciali
2141del comando "genr":
2142
2143  "genr time" crea una variabile trend temporale (1,2,3,...) chiamata
2144  "time". "genr index" fa la stessa cosa, ma chiamando la variabile index.
2145
2146  "genr dummy" crea una serie di variabili dummy a seconda della
2147  periodicità dei dati. Ad esempio, nel caso di dati trimestrali
2148  (periodicità 4) il programma crea dq1, che vale 1 nel primo trimestre e 0
2149  altrove, dq2 che vale 1 nel secondo trimestre e 0 altrove, e così via.
2150  Nel caso di dati mensili, le dummy si chiamano dm1, dm2 e così via. Con
2151  altre frequenze dei dati, i nomi delle dummy sono dummy_1, dummy2, ecc.
2152
2153  "genr unitdum" e "genr timedum" creano insiemi di variabili dummy speciali
2154  da usare in un dataset di tipo panel. Il primo comando crea dummy che
2155  rappresentano le unità cross section, il secondo i periodi di
2156  osservazione.
2157
2158Nota: nella versione a riga di comando del programma, i comandi "genr" che
2159estraggono dati relativi al modello si riferiscono sempre al modello stimato
2160per ultimo. Questo vale anche per la versione grafica del programma se si
2161usa "genr" nel "terminale di gretl" o si immette una formula usando
2162l'opzione "Definisci nuova variabile" nel menù Variabile della finestra
2163principale. Usando la versione grafica, però, è possibile anche estrarre i
2164dati da qualunque modello mostrato in una finestra (anche se non è il
2165modello più recente) usando il menù "Analisi" nella finestra del modello.
2166
2167La variabile speciale obs serve da indice per le osservazioni. Ad esempio,
2168genr dum = (obs==15) crea una variabile dummy che vale 1 per l'osservazione
216915 e 0 altrove. È anche possibile usare questa variabile per selezionare
2170alcune osservazioni particolari secondo la data o il nome. Ad esempio genr d
2171= (obs>1986:4), genr d = (obs>"2008/04/01"), oppure genr d = (obs=="CA").
2172Quando si usano in questo contesto date giornaliere o etichette per le
2173osservazioni, bisogna racchiuderle fra virgolette. Questo non è necessario
2174per date trimestrali o annuali. Si noti che, per serie storiche annuali,
2175l'anno non è sintatticmante distiguibile da un semplice intero; per cui,
2176per confrontare un'osservazione con obs per anno, bisogna usare la funzione
2177obsnum per convertire l'anno in un numero progressivo, come ad esempio in in
2178genr d = (obs>obsnum(1986)).
2179
2180È possibile estrarre dei valori scalari da una serie usando una formula
2181genr con la sintassi nome-variabile[osservazione]. Il valore di osservazione
2182può essere specificato con un numero o una data. Esempi: x[5],
2183CPI[1996:01]. Per i dati giornalieri occorre usare la forma AAAA/MM/GG, ad
2184esempio ibm[1970/01/23].
2185
2186È possibile modificare una singola osservazione in una serie usando genr.
2187Per farlo, occorre aggiungere un numero di osservazione o una data valida
2188tra parentesi quadre al nome della variabile nel lato sinistro della
2189formula. Ad esempio: genr x[3] = 30 o genr x[1950:04] = 303.7.
2190
2191  Formula                Commento
2192  -------                -------
2193  y = x1^3               x1 al cubo
2194  y = ln((x1+x2)/x3)
2195  z = x>y                z(t) = 1 se x(t) > y(t), 0 altrove
2196  y = x(-2)              x ritardata di 2 periodi
2197  y = x(+2)              x anticipata di 2 periodi
2198  y = diff(x)            y(t) = x(t) - x(t-1)
2199  y = ldiff(x)           y(t) = log x(t) - log x(t-1), il tasso di crescita
2200                         istantaneo di x
2201  y = sort(x)            ordina x in senso crescente e la salva in y
2202  y = dsort(x)           ordina x in senso decrescente
2203  y = int(x)             tronca x e salva il valore intero in y
2204  y = abs(x)             salva il valore assoluto di x
2205  y = sum(x)             somma i valori di x escludendo i valori mancanti NA
2206  y = cum(x)             cumulativa: y(t) = somma di x(s) per s da 1 a t
2207  aa = $ess              imposta aa uguale alla somma dei quadrati degli
2208                         errori dell'ultima regressione
2209  x = $coeff(sqft)       estrae il coefficiente stimato per la variabile sqft
2210                         nell'ultima regressione
2211  rho4 = $rho(4)         estrae il coefficiente di autoregressione del quarto
2212                         ordine dall'ultimo modello (presume un modello ar
2213                         model)
2214  cvx1x2 = $vcv(x1, x2)  estrae il coefficiente di covarianza stimato tra le
2215                         variabili x1 e x2 dall'ultimo modello
2216  foo = uniform()        variabile pseudo-casuale uniforme nell'intervallo 0-1
2217  bar = 3 * normal()     variabile pseudo-casuale normale con mu = 0, sigma =
2218                         3
2219  samp = ok(x)           vale 1 per le osservazioni dove il valore di x non è
2220                         mancante.
2221
2222Accesso dal menù:    /Variabile/Definisci nuova variabile
2223Accesso alternativo: Menù pop-up nella finestra principale
2224
2225# gmm Estimation
2226
2227Opzioni:    --two-step (Stima a due passi)
2228            --iterate (GMM iterato)
2229            --vcv (Mostra la matrice di covarianza)
2230            --verbose (Mostra i dettagli delle iterazioni)
2231            --quiet (non stampa nulla)
2232            --lbfgs (usa il massimizzatore L-BFGS-B anziché il BFGS standard)
2233Esempi:     hall_cbapm.inp
2234
2235Esegue la stima col metodo dei momenti generalizzato (Generalized Method of
2236Moments, GMM) usando l'algoritmo BFGS (Broyden, Fletcher, Goldfarb, Shanno).
2237Occorre specificare uno o più comandi per aggiornare le quantità rilevanti
2238(tipicamente i residui GMM), una o più condizioni di ortogonalità, una
2239matrice iniziale dei pesi e un elenco dei parametri da stimare, il tutto
2240racchiuso tra le parole chiave gmm e end gmm. Ogni opzione aggiuntiva va
2241messa nella riga del comando end gmm.
2242
2243Si veda la guida all'uso di gretl (il capitolo 27) per i dettagli. Quello
2244che segue è un semplice esempio illustrativo.
2245
2246	gmm e = y - X*b
2247	orthog e ; W
2248	weights V
2249	params b
2250	end gmm
2251
2252Nell'esempio si assume che y e X siano matrici di dati, b sia un vettore con
2253i valori dei parametri, W sia una matrice di strumenti, e V un'appropriata
2254matrice dei pesi. La dichiarazione
2255
2256	orthog e ; W
2257
2258indica che il vettore dei residui e è in linea di principio ortogonale ad
2259ognuno degli strumenti che compongono le colonne di W.
2260
2261Nome dei parametri
2262
2263Nella stima di un modello non lineare spesso risulta conveniente rinominare
2264i parametri in maniera concisa. Durante la stampa dei risultati, comunque,
2265risulta desiderabile l'utilizzo di etichette il più informative possibile.
2266Questo può essere fatto attraverso l'aggiunta della parola chiave
2267param_names dentro il blocco di comando. Per un modello con k parametri
2268l'argomento che segue questa parola chiave dovrebbe essere o una stringa
2269letterale contenente tutti i k nomi separati da spazi e racchiusi dentro le
2270doppie virgolette, oppure il nome di nome di una variabile stringa
2271contenente tutti k nomi dell'elenco.
2272
2273Accesso dal menù:    /Modello/GMM
2274
2275# gnuplot Graphs
2276
2277Argomenti:  variabili-y variabile-x [ variabile-dummy ]
2278Opzioni:    --with-lines[=varspec] (usa linee invece che punti)
2279            --with-lp[=varspec] (usa linee e punti)
2280            --with-impulses[=varspec] (usa linee verticali)
2281            --with-steps[=varspec] (usa segmenti orizzontali e verticali)
2282            --time-series (mostra rispetto al tempo)
2283            --single-yaxis (forza l'uso di un solo asse delle ordinate)
2284            --ylogscale[=base] (ordinate in scala logaritmica)
2285            --dummy (si veda sotto)
2286            --fit=fitspec (si veda sotto)
2287            --font=fontspec (si veda sotto)
2288            --band=bandspec (si veda sotto)
2289            --band-style=style (si veda sotto)
2290            --matrix=name (mostra le colonne di una data matrice)
2291            --output=filename (ridirige l'output su file)
2292            --input=filename (prende l'input da file)
2293Esempi:     gnuplot y1 y2 x
2294            gnuplot x --time-series --with-lines
2295            gnuplot wages educ gender --dummy
2296            gnuplot y x --fit=quadratic
2297            gnuplot y1 y2 x --with-lines=y2
2298
2299Le variabili nella lista variabili-y vengono mostrate rispetto alla
2300variabile variabile-x. Per avere un grafico storico è possibile usare time
2301come variabile-x, oppure usare l'opzione --time-series. Vedi anche i comandi
2302"plot" e "panplot".
2303
2304Per default, i dati sono mostrati come punti; ma questa scelta può essere
2305modificata usando una delle opzioni --with-lines, --with-lp o
2306--with-impulses. Se il grafico contiene più di una serie, l'effetto di
2307queste opzioni può essere limitato ad un sottoinsieme delle variabili
2308usando il parametro varspec. Esso deve essere dato sotto forma di una lista
2309separata da virgole dei nomi (o dei numeri) delle variabili da tracciare con
2310linee e/o con impulsi. L'ultimo tra gli esempi di cui sopra mostra come
2311tracciare y1 e y2 contro x, in modo tale che y2 sia rappresentata da una
2312linea ma y1 da punti.
2313
2314Usando l'opzione --dummy, occorre fornire esattamente tre variabili: una
2315variabile y, una variabile x, e una variabile dummy dumvar. L'effetto è
2316quello di mostrare y rispetto a x colorando in modo diverso i vari punti, a
2317seconda che dumvar valga 1 o 0.
2318
2319Usando l'opzione --ylogscale si punò far sì che l'asse delle ordinate sia
2320logaritmico anziché lineare. L'opzione accetta un parametro come base. Ad
2321esempio,
2322
2323	gnuplot y x --ylogscale=2
2324
2325produce un grafico in cui l'asse delle ordinate è espresso in termini di
2326potenze di 2. Se la base è omessa, si userà il valore 10.
2327
2328Creare un grafico da dati in una matrice
2329
2330In generale è necessario specificare sia l'argomento yvars che quello xvar;
2331entrambi devono indicare variabili nel dataset corrente (per nome o numero
2332identificativo). Se tuttavia viene specificata con l'opzione --matrix una
2333matrice definita in precedenza questi argomenti diventano opzionali: se la
2334matrice specificata ha k colonne, di default le prime k - 1 sono considerate
2335come yvars, e l'ultima come xvar. Se viene indicata l'opzione --time-series,
2336tuttavia, il comando fornisce il grafico di tutte le k variabili rispetto al
2337tempo. Se si desidera il grafico solo di alcune colonne della matrice è
2338necessario identificare yvars e xvar fornendo l'indice delle colonne
2339corrispondenti, dove la prima colonna ha indice 1. Per esempio, se si
2340desidera un grafico a dispersione della colonna 2 della matrice M rispetto
2341alla colonna 1, il comando da digitare è:
2342
2343	gnuplot 2 1 --matrix=M
2344
2345Mostrare una linea interpolante
2346
2347L'opzione "fit" si applica solo al caso di un diagramma a dispersione
2348bivariato, o quando il grafico contiene un'unica serie storica. Il
2349comportamento predefinito consiste nel mostrare la linea con le stime OLS,
2350se il coefficiente di pendenza è significativo almeno al 10 per cento.
2351Azioni diverse possono essere effettuate usando questa opzione con una delle
2352seguenti specificazioni fitspec. Se il grafico contiene un'unica serie
2353storica, x è implicitamente dato dal tempo.
2354
2355  linear: la linea OLS viene mostrata a prescindere dalla sua
2356  significatività.
2357
2358  none: non mostrare alcuna interpolazione.
2359
2360  inverse, quadratic, cubic, semilog o linlog: mostrano una linea
2361  interpolante basata su una regressione del tipo corrispondente. Per
2362  semilog, si intende una regressione del logaritmo y on x; la linea
2363  interpolante mostra la media condizionale di y, ottenuta per
2364  esponenziazione. Per linlog, si intende una regressione di y sul logaritmo
2365  di x.
2366
2367  loess: usa una regressione robusta ponderata localmente (anche nota come
2368  "lowess").
2369
2370Bande
2371
2372L'opzione --band si usa per mostrare zero o più serie assieme ad una
2373"banda" (spesso, ma non sempre, associata ad un intervallo di confidenza).
2374Questa opzione richede due parametri, separati da una virgola: il nome (o
2375numero ID) di una serie con il centro della banda e il nome(o numero ID) di
2376una con la sua ampiezza: l'effetto ottenuto è una banda con coordinate in
2377ordinata date dal centro, più o meno l'ampiezza. Si può usare un terzo
2378parametro opzionale (anch'esso separato da virgola), dato da uno scalare,
2379per specificare un moltiplicatore per l'ampiezza. Ad esempio, il codice che
2380segue disegna y assieme ad una banda di 1.96 volte se_y:
2381
2382	gnuplot y --time-series --band=y,se_y,1.96 --with-lines
2383
2384Assieme all'opzione --band, esiste l'opzione --band-style per controllare
2385l'aspetto della banda. Di default, i limiti alto e basso vengono mostrati
2386con linee continue, ma i parametri fill, dash, bars o step alterano questa
2387scelta, usando rispettivamente un'area, linee tratteggiate, barre verticali
2388o scalini. In più, si può aggiungere una specificazione di colore (dopo
2389una virgola). Ad esempio:
2390
2391	gnuplot ... --band-style=fill
2392	gnuplot ... --band-style=dash,0xbbddff
2393	gnuplot ... --band-style=,black
2394	gnuplot ... --band-style=bars,blue
2395
2396Il primo esempio produce un'area col colore di default; il secondo passa a
2397linee tratteggiate in un azzurro grigiastro; il terzo, linee continue nere,
2398e l'ultimo barre blu. Si noti che i colori possono essere dati con specifica
2399esadecimale o nomi (in inglese); la lista dei colori ammessi da gnuplotpuò
2400essere viaulizzata dando il comando "show colornames" in gnuplot, o
2401eseguendo nella console di gretl il comando
2402
2403	eval readfile("@gretldir/data/gnuplot/gpcolors.txt")
2404
2405Barre di recessione
2406
2407L'opzione "band" descritta sopra può inoltre essere utilizzata per
2408aggiungere di barre di recessione al grafico. Con ciò si intendono delle
2409barre verticali che occuperanno l'intera dimensione y del grafico ed
2410indicando la presenza (con barra) o l'assenza (senza barra) di alcune
2411caratteristiche qualitative in grafico di serie storiche. Queste barre sono
2412comunemente utilizzate per indicare periodi di recessione/periodi di
2413guerra/qualasiasi cosa possa essere codificata da una variabile dummy 0/1.
2414
2415In questo contesto l'opzione --band richiede un solo paramentro:
2416l'identificatore di serie con valori 0 e 1, dove 1 indica "on" e 0 indica
2417"off". L'opzione --band-style può essere utilizzata per specificare il
2418colore delle barre, dando o l'idendificatore esadecimale del colore o il
2419nome riconosciuto da gnuplot (vedi la sezione precedente). Un esempio che
2420mostra l'utilizzo del comandso su una singola barra è il seguente:
2421
2422	open AWM17 --quiet
2423	series dum = obs >= 1990:1 && obs <= 1994:2
2424	gnuplot YER URX --with-lines --time-series \
2425	--band=dum --band-style=0xcccccc --output=display \
2426	{set key top left;}
2427
2428Controllo dell'output
2429
2430In modalità interattiva il risultato è mostrato immediatamente. In
2431modalità "batch", viene scritto un file di comandi gnuplot, chiamato
2432gpttmpN.plt, a partire da N = 01; il grafico vero e proprio può essere
2433generato usando il programma gnuplot (su MS Windows: wgnuplot). Questo
2434comportamento può essere modificato usando l'opzione --output=filename, che
2435controlla il nome del file utilizzato e contemporaneamente permette di
2436specificare un particolare formato di output usando l'estensione del nome
2437del file (le tre lettere che seguono il .): .eps produce un file
2438Encapsulated PostScript (EPS); .pdf produce un file PDF; .png produce un
2439formato PNG, .emf un formato EMF (Enhanced MetaFile), .fig un file Xfig, e
2440.svg uno SVG (Scalable Vector Graphics). Se come nome del file si indica
2441"display", il grafico è inviato allo schermo come nella modalità
2442interattiva. Se si indica un nome del file con un'estensione diversa da
2443quelle appena citate viene prodotto un file di comandi gnuplot.
2444
2445Specificare un font
2446
2447L'opzione --font può essere utilizzata per specificare un particolare tipo
2448di font per il grafico. Il parametro fontspec dovrebbe assumere la forma del
2449nome di un carattere, ed opzionalmente dovrebbe essere seguito da la
2450grandezza dei punti (separati dal nome da una virgola od uno spazione, il
2451tutto messo dentro le doppie virgolette ""). Di seguito un esempio:
2452
2453	--font="serif,12"
2454
2455Nota: i font disponibili per gnuplot variano da piattaforma a piattaforma,
2456quindi se si intende scrivere un comando di plot portabile allora è
2457consigliabile optare per font generici come sans oppure serif.
2458
2459Aggiungere comandi gnuplot
2460
2461È disponibile un'ulteriore opzione per questo comando: dopo la
2462specificazione delle variabili e le eventuali opzioni, è possibile
2463aggiungere direttamente dei comandi gnuplot per modificare l'aspetto visivo
2464del grafico (ad esempio, impostando il titolo e o gli intervalli degli
2465assi). Questi comandi aggiuntivi vanno inclusi tra parentesi graffe e ogni
2466comando va separato con un punto e virgola; è possibile usare una barra
2467rovesciata (\) per continuare un gruppo di comandi gnuplot sulla riga
2468successiva. Ecco un esempio della sintassi:
2469
2470	{ set title 'Il mio titolo'; set yrange [0:1000]; }
2471
2472Accesso dal menù:    /Visualizza/Grafico
2473Accesso alternativo: Menù pop-up nella finestra principale, pulsante grafico sulla barra degli strumenti
2474
2475# graphpg Graphs
2476
2477Varianti:   graphpg add
2478            graphpg fontscale value
2479            graphpg show
2480            graphpg free
2481            graphpg --output=filename
2482
2483La "pagina dei grafici" funzionerà solo se si è installato il sistema di
2484composizione LaTeX e si è in grado di generare e visualizzare file in
2485formato postscript.
2486
2487Nella finestra della sessione, è possibile trascinare fino a otto grafici
2488sull'icona della pagina dei grafici. Facendo doppio clic sull'icona della
2489pagina dei grafici (o facendo clic col tasto destro e selezionando
2490"Mostra"), la pagina contenente i grafici selezionati verrà composta e
2491aperta con il proprio visualizzatore di file postscript, da cui sarà
2492possibile stamparla.
2493
2494Per pulire la pagina dei grafici, fare clic col tasto destro sull'icona e
2495selezionare "Pulisci".
2496
2497Su sistemi diversi da MS Windows, può essere necessario modificare
2498l'impostazione del programma per visualizzare il postscript, che si trova
2499nella sezione "Programmi" della finestra di dialogo delle Preferenze di
2500gretl (nel menù Strumenti della finestra principale).
2501
2502È anche possibile operare sulla pagina del grafico via script, oppure
2503usando la console (nel programma GUI). Sono disponibili i comandi seguenti:
2504
2505Per aggiungere un grafico alla pagina dei grafici, digitate il comando
2506graphpg add dopo aver salvato un grafico con un nome, come in
2507
2508	grf1 <- gnuplot Y X
2509	graphpg add
2510
2511Per aprire la pagina dei grafici: graphpg show.
2512
2513Per svuotare la pagina dei grafici: graphpg free.
2514
2515Per modificare la dimensione del font usato nella pagina dei grafici usate
2516graphpg fontscale scale, dove scale è un moltiplicatore (con un valore di
2517default pari a 1.0). Per rendere il fonto più grande del 50 per cento,
2518dunque, è possibile scrivere
2519
2520	graphpg fontscale 1.5
2521
2522Per stampare su un file la pagina dei grafici usate l'opzione --output=
2523seguita dal nome di un file; questo nome deve avere il suffisso ".pdf",
2524".ps" o ".eps". Per esempio:
2525
2526	graphpg --output="myfile.pdf"
2527
2528Il file di output verrà scritto nella directory corrispondente al valore
2529corrente di "workdir", a meno che il nome di file contenga un percorso
2530completo.
2531
2532In questo contesto l'output usa linee colorate di default; per usare linee
2533punteggiate o tratteggiate al posto dei colori è possibile aggiungere
2534l'opzione --monochrome.
2535
2536# heckit Estimation
2537
2538Argomenti:  variabile-dipendente variabili-indipendenti ; equazione di selezione
2539Opzioni:    --quiet (non mostra i risultati)
2540            --two-step (esegue la stima in due passi)
2541            --vcv (mostra la matrice di covarianza)
2542            --opg (errori standard OPG)
2543            --robust (errori standard QML)
2544            --cluster=clustvar (vedi "logit" per una spiegazione)
2545            --verbose (mostra risultati aggiuntivi)
2546Esempi:     heckit y 0 x1 x2 ; ys 0 x3 x4
2547            Vedi anche heckit.inp
2548
2549Modello di selezione di tipo Heckman. Nella specificazione, la lista che
2550precede il punto e virgola rappresenta l'equazione principale, mentre la
2551seconda lista rappresenta l'equazione di selezione. La variabile dipendente
2552nell'equazione di selezione (ys nell'esempio visto sopra) deve essere una
2553variabile binaria.
2554
2555Per impostazione predefinita, i parametri sono stimati per massima
2556verosimiglianza. La matrice di covarianza dei parametri è calcolata usando
2557l'inversa negativa dell'Hessiana. Se si vuole usare la procedura di stima in
2558due passi, basta usare l'opzione --two-step. In questo caso, la matrice di
2559covarianza dei parametri dell'equazione principale è corretta nel modo
2560descritto da Heckman (1979).
2561
2562Accesso dal menù:    /Modello/Variabile dipendente limitata/Heckit
2563
2564# help Utilities
2565
2566Varianti:   help
2567            help functions
2568            help comando
2569            help funzione
2570Opzione:    --func (sceglie l'aiuto sulle funzioni)
2571
2572Se non vengono indicati argomenti, mostra un elenco dei comandi disponibili.
2573Indicando l'argomento "functions", mostra un elenco delle funzioni
2574disponibili (si veda "genr").
2575
2576"help" comando descrive il comando (ad es. "help smpl"). help funzione
2577descrive la funzione (e.g. help ldet). Alcune funzioni hanno lo stesso nome
2578dei comandi relativi (e.g. diff): in questo caso verrà mostrato l'aiuto
2579relativo al comando, a meno che non si usi l'opzione --func.
2580
2581Accesso dal menù:    /Aiuto
2582
2583# hfplot Graphs
2584
2585Argomenti:  hflist [ ; lflist ]
2586Opzioni:    --with-lines (crea grafico lineare)
2587            --time-series (tempo in ascissa)
2588            --output=filename (manda l'output al file specificato)
2589
2590Consente di creare un grafico di una serie ad alta frequenza, anche assieme
2591ad una o più serie osservate alla frequenza base del dataset. Il primo
2592argomento dev'essere una "MIDAS list"; gli argomenti aggiuntivi opzionali
2593lflist, separati da un punto e virgola, devono essere normali serie a bassa
2594frequenza.
2595
2596Per ulteriori dettagli sull'effetto dell'opzione --output, consultare lo
2597help per il comando "gnuplot".
2598
2599# hsk Estimation
2600
2601Argomenti:  variabile-dipendente variabili-indipendenti
2602Opzioni:    --no-squares (si veda sotto)
2603            --vcv (mostra la matrice di covarianza)
2604            --quiet (non stampa nulla)
2605
2606Questo comando è utile in presenza di eteroschedasticità sotto forma di
2607una funzione incognita dei regressori, che può essere approssimata da una
2608relazione quadratica. In questo contesto, offre la possibilità di avere
2609errori standard consistenti e stime dei parametri più efficienti, rispetto
2610alla stima OLS.
2611
2612La procedura richiede: (a) la stima OLS del modello, (b) una regressione
2613ausiliaria per generare la stima della varianza dell'errore e (c) la stima
2614con minimi quadrati ponderati, usando come peso il reciproco della varianza
2615stimata.
2616
2617Nella regressione ausiliaria (b) il logaritmo dei quadrati dei residui dalla
2618prima regressione OLS viene regredito sui regressori originali e sui loro
2619quadrati (o solamente sui regressori originali se l'opzione --no-squares è
2620data). La trasformazione logaritmica viene effettuata per assicurarsi che le
2621varianze stimate siano non negative. Indicando con u^* i valori stimati da
2622questa regressione, la serie dei pesi per la regressione con minimi quadrati
2623ponderati è data da 1/exp(u^*).
2624
2625Accesso dal menù:    /Modello/Altri modelli lineari/HSK - WLS corretti per eteroschedasticità
2626
2627# hurst Statistics
2628
2629Argomento:  nome-variabile
2630Opzione:    --plot=tipologia o nome del file (si veda sotto)
2631
2632Calcola l'esponente di Hurst (una misura di persistenza, o di memoria lunga)
2633per una serie storica con almeno 128 osservazioni.
2634
2635L'esponente di Hurst è discusso da Mandelbrot (1983). In termini teorici è
2636l'esponente H nella relazione
2637
2638  RS(x) = an^H
2639
2640dove RS è l'"intervallo riscalato" della variabile x in un campione
2641dell'ampiezza n, mentre a è una costante. L'intervallo riscalato è
2642l'intervallo (valore massimo meno valore minimo) del valore cumulato, o
2643somma parziale, di x sul periodo del campione (dopo aver sottratto la media
2644campionaria), diviso per lo scarto quadratico medio campionario.
2645
2646Come punto di riferimento, se x è un rumore bianco (media zero, persistenza
2647zero) l'intervallo dei suoi valori cumulati (che forma una passeggiata
2648casuale), scalato per lo scarto quadratico medio, cresce come la radice
2649quadrata dell'ampiezza campionaria, ossia ha un esponente di Hurst atteso
2650pari a 0.5. Valori dell'esponente sensibilmente maggiori di 0.5 indicano
2651persistenza della serie, mentre valori minori di 0.5 indicano
2652anti-persistenza (autocorrelazione negativa). In teoria l'esponente deve
2653essere compreso tra 0 e 1, ma in campioni finiti è possibile ottenere delle
2654stime per l'esponente maggiori di 1.
2655
2656In gretl, l'esponente è stimato usando il sotto-campionamento binario: si
2657inizia dall'intero intervallo dei dati, quindi si usano le due metà
2658dell'intervallo, poi i quattro quarti, e così via. Per ampiezze campionarie
2659minori dell'intervallo dei dati complessivo il valore RS è la media presa
2660sui vari campioni. L'esponente è quindi stimato come il coefficiente di
2661pendenza della regressione del logaritmo di RS sul logaritmo dell'ampiezza
2662del campione.
2663
2664Di default, viene mostrato un grafico dell'intervallo riscalato se il
2665programma è in modalità interattiva. Questo comportamento può essere
2666calibrato attraverso l'opzione --plot. I parametri accettabili dall'opzione
2667sono none, per non mostrare il grafico, display, per mostrare il grafico
2668anche in batch mode, o un nome di file. L'effetto di fornire un nome di file
2669è reperibile alla descrizione del comando "gnuplot", sotto l'opzione
2670--output.
2671
2672Accesso dal menù:    /Variabile/Esponente di Hurst
2673
2674# if Programming
2675
2676Struttura di controllo per l'esecuzione dei comandi. Sono supportate le tre
2677forme seguenti:
2678
2679  # forma semplice
2680  if condition
2681  commands
2682  endif
2683
2684  # a due rami
2685  if condition
2686  commands1
2687  else
2688  commands2
2689  endif
2690
2691  # a tre o più rami
2692  if condition1
2693  commands1
2694  elif condition2
2695  commands2
2696  else
2697  commands3
2698  endif
2699
2700La "condizione" deve essere un'espressione Booleana, per la cui sintassi si
2701veda "genr". Può essere incluso più di un blocco "elif". Inoltre, i
2702blocchi if ... endif possono essere nidificati.
2703
2704# include Programming
2705
2706Argomento:  filename
2707Opzione:    --force (forza una rilettura dal file)
2708Esempi:     include myfile.inp
2709            include sols.gfn
2710
2711Da usare in uno script di comandi, principalmente per includere definizioni
2712di funzioni. Il comando filename dovrebbe includere l'estensione inp (un
2713script di testo semplice) oppure l'estensione gfn (una pacchetto di funzioni
2714gretl). I comandi del filename vengono eseguiti e il controllo viene
2715restituito allo script principale.
2716
2717L'opzione --force è specifica dei file di tipo gfn: quest'ultima ha come
2718effetto quello di forzare gretl a rileggere il pacchetto di funzioni anche
2719se quest'ultimo è già stato caricato in memoria. (In risposta a questo
2720comando, gli script di testo semplici inp sono sempre ricaricati.)
2721
2722Si veda anche il comando "run".
2723
2724# info Dataset
2725
2726Mostra le informazioni aggiuntive contenute nel file di dati attuale.
2727
2728Accesso dal menù:    /Dati/Visualizza descrizione
2729Accesso alternativo: Finestre di esplorazione dei dati
2730
2731# intreg Estimation
2732
2733Argomenti:  var-min var-max var-indip
2734Opzioni:    --quiet (non mostra i risultati)
2735            --verbose (mostra i dettagli delle iterazioni)
2736            --robust (errori standard robusti)
2737            --opg (vedi sotto)
2738            --cluster=clustvar (vedi "logit" per la spiegazione)
2739Esempi:     intreg lo hi const x1 x2
2740            Vedi anche wtp.inp
2741
2742Stima un modello di regressione per intervallo. Questo modello è adatto al
2743caso in cui la variabile dipendente è osservata in modo imperfetto per
2744alcune osservazioni (o anche tutte). In altre parole, si ipotizza che il
2745processo generatore dei dati sia
2746
2747  y* = x b + u
2748
2749ma che solo m <= y* <= M sia osservato (l'intervallo può essere limitato a
2750destra o a sinistra). Si noti che per alcune osservazioni m può essere
2751uguale a M. Le variabili var-min e var-max devono contenere valori NA nel
2752caso di osservazioni non limitate a sinistra o a destra.
2753
2754Il modello è stimato per massima verosimiglianza, ipotizzando la normalità
2755del termine di disturbo.
2756
2757Per impostazione predefinita, gli errori standard sono calcolati usando
2758l'inversa dell'Hessiana. Se si usa l'opzione --robust, vengono calcolati
2759invece gli errori standard QML o Huber-White. In questo caso la matrice di
2760covarianza stimata è un "sandwich" dell'inversa dell'Hessiana stimata e del
2761prodotto esterno del gradiente. In alternativa, l'opzione --opg produce una
2762matrice varianze-covarianze basata sul prodotto esterno dei gradienti.
2763
2764Accesso dal menù:    /Modello/Modelli non lineari/Regressione per intervalli
2765
2766# johansen Tests
2767
2768Argomenti:  ordine lista-y [ ; lista-x ] [ ; lista-rx ]
2769Opzioni:    --nc (senza costante)
2770            --rc (costante vincolata)
2771            --uc (costante non vincolata)
2772            --crt (costante e trend vincolato)
2773            --ct (costante e trend non vincolato)
2774            --seasonals (include dummy stagionali centrate)
2775            --asy (registra i p-value asintotici)
2776            --silent (non mostra nulla)
2777            --quiet (mostra solo i test)
2778            --verbose (mostra i dettagli delle regressioni ausiliarie)
2779Esempi:     johansen 2 y x
2780            johansen 4 y x1 x2 --verbose
2781            johansen 3 y x1 x2 --rc
2782            Vedi anche hamilton.inp, denmark.inp
2783
2784Esegue il test di Johansen per la cointegrazione tra le variabili della
2785lista-y per l'ordine specificato di ritardi. Per dettagli, si veda la guida
2786all'uso di gretl (il capitolo 33) oppure Hamilton (1994), capitolo 20. I
2787valori critici sono calcolati con l'approssimazione gamma di J. Doornik
2788(Doornik, 1998). Per il test traccia, vengono formiti due set di valori
2789critici: asintotici e aggiustati per l'ampiezza campionaria. Di default,
2790l'accessore "$pvalue" riporta la variante aggiustata, ma i valori asintotici
2791possono essere ottenuti usando l'opzione --asy.
2792
2793L'inclusione di trend deterministici nel modello è controllata dalle
2794opzioni del comando. Se non si indica alcuna opzione, viene inclusa una
2795"costante non vincolata", che permette la presenza di un'intercetta diversa
2796da zero nelle relazioni di cointegrazione e di un trend nei livelli delle
2797variabili endogene. Nella letteratura originata dal lavoro di Johansen (si
2798veda ad esempio il suo libro del 1995), si fa riferimento a questo come al
2799"caso 3". Le prime quattro opzioni mostrate sopra, che sono mutualmente
2800esclusive, producono rispettivamente i casi 1, 2, 4 e 5. Il significato di
2801questi casi e i criteri per scegliere tra di essi sono spiegati nella guida
2802all'uso di gretl (il capitolo 33).
2803
2804Le liste opzionali lista-x e lista-rx permettono di controllare per
2805specifiche variabili esogene che entrano nel sistema in modo non vincolato
2806(lista-x) o vincolate allo spazio di cointegrazione (lista-rx). Queste liste
2807vanno separate tra di loro e dalla lista-y usando il carattere punto e
2808virgola.
2809
2810L'opzione --seasonals, che può accompagnare una qualsiasi delle altre
2811opzioni, specifica l'inclusione di un gruppo di variabili dummy stagionali
2812centrate. Questa opzione è disponibile solo per dati trimestrali o mensili.
2813
2814La tabella seguente fornisce un esempio di interpretazione dei risultati del
2815test nel caso di 3 variabili. H0 denota l'ipotesi nulla, H1 l'ipotesi
2816alternativa e c il numero delle relazioni di cointegrazione.
2817
2818      Rango    Test traccia       Test Lmax
2819      H0     H1          H0     H1
2820      ---------------------------------------
2821      0      c = 0  c = 3       c = 0  c = 1
2822      1      c = 1  c = 3       c = 1  c = 2
2823      2      c = 2  c = 3       c = 2  c = 3
2824      ---------------------------------------
2825
2826Si veda anche il comando "vecm".
2827
2828Accesso dal menù:    /Modello/Serie storiche/Test di cointegrazione/Johansen
2829
2830# join Dataset
2831
2832Argomenti:  filename varname
2833Opzioni:    --data=column-name (v. oltre)
2834            --filter=expression (v. oltre)
2835            --ikey=inner-key (v. oltre)
2836            --okey=outer-key (v. oltre)
2837            --aggr=method (v. oltre)
2838            --tkey=nome-colonna,stringa-formato (v. oltre)
2839            --verbose (visualizza dettagli sul comando)
2840
2841Questo comando importa una o più serie dal file di origine filename (che
2842deve essere un file di dati testuale delimitato o un file di dati nativo di
2843gretl) assegnandoli alla variabile varname. Per maggiori dettagli, si veda
2844la guida all'uso di gretl (il capitolo 7); in questa sede ci limitiamo a
2845ricordare brevemente le opzioni disponibili. Vedi anche "append" per alcune
2846semplici operazioni di unione di dataset.
2847
2848L'opzione --data può essere usata per specificare l'intestazione della
2849colonna nel file di origine se quest'ultima è diversa dal nome con il quale
2850dovrebbero essere chiamati i dati in gretl.
2851
2852L'opzione --filter può essere usata per specificare un criterio da seguire
2853per filtrare i dati di origine (in altre parole, per selezionare un
2854sottoinsieme di osservazioni).
2855
2856Le opzioni --ikey e --okey possono essere utilizzate per specificare una
2857relazione fra le osservazioni nel dataset corrente e quelle nel file di
2858origine (per esempio, gli individui possono essere assegnati alla famiglia
2859di appartenenza).
2860
2861L'opzione --aggr viene usata quando la relazione fra osservazioni nel
2862dataset corrente e nel file di origine non è biunivoca.
2863
2864L'opzione --tkey è applicabile solo quando il dataset corrente ha una
2865struttura di serie storiche. Viene usato per specificare il nome di una
2866colonna contenente le date da accoppiare al dataset e/o il formato in cui le
2867date sono rappresentate in quella colonna.
2868
2869Come importare più di una serie alla volta
2870
2871Il comando "join" può essere usato per importare più di una serie alla
2872volta. Questo si ha quando (a) l'argomento varname è una lista di nomi
2873separati da spazi, anziché una stringa semplice, oppure (b) quando è il
2874nome di un array di stringhe, gli elementi del quale saranno i nomi delle
2875serie da importare.
2876
2877Va detto che questo metodo ha alcune limitazioni: l'opzione --data non è
2878disponibile, e bisogna accettare i nomi delle variabili così come sono nel
2879dataset filename. Le altre opzioni verranno applicate uniformemente a tutte
2880le serie così importate.
2881
2882# kpss Tests
2883
2884Argomenti:  ordine lista-variabili
2885Opzioni:    --trend (include un trend)
2886            --seasonals (include dummy stagionali)
2887            --verbose (mostra i risultati della regressione)
2888            --quiet (non mostra i risultati)
2889            --difference (usa la differenza prima della variabile)
2890Esempi:     kpss 8 y
2891            kpss 4 x1 --trend
2892
2893Si veda il paragrafo in fondo per l'uso di questo test su dati panel.
2894
2895Calcola il test KPSS (Kwiatkowski et al, Journal of Econometrics, 1992) per
2896la stazionarietà di ognuna delle variabili specificate (o della loro
2897differenza prima, se si usa l'opzione --difference. L'ipotesi nulla è che
2898la variabile in questione sia stazionaria, attorno a un valore fisso o, se
2899è stata usata l'opzione --trend, attorno a un trend deterministico lineare.
2900
2901> L'argomento order determina l'ampiezza della finestra usata per il
2902livellamento di Bartlett. Se viene dato un valore negativo questo è
2903considerato come un segnale per l'utilizzo in automatico di una finestra di
2904riferimento di ampiezza 4(T/100)^0.25, dove T è l'ampiezza del campione.
2905
2906Se si sceglie l'opzione --verbose il risultato della regressione ausiliaria
2907verrà stampato insieme alla varianza stimata della componente di random
2908walk della variabile
2909
2910Il valori critici riportati per questa statistica test sono basati sulle
2911superfici di risposta stimate secondo il metodo descritto da Sephton
2912(Economics Letters, 1995), che per piccoli campioni sono più accurate di
2913quelle fornite nell'articolo originale di KPSS. Quando la statistica test si
2914trova fra i valori critici al 10 e all'1 per cento viene mostrato un p-value
2915ottenuto per interpolazione lineare, che non dovrebbe essere accettato in
2916maniera acritica. Vedi anche la funzione "kpsscrit" per ottenere questi
2917valori critici come codice.
2918
2919Dati panel
2920
2921Quando il comando kpss viene usato con dati panel per calcolare un test
2922panel di radice unitaria, le opzioni applicabili e i risultati mostrati sono
2923leggermente diversi. Mentre nel caso di serie storiche regolari potete
2924fornire una lista di variabili da testare, con dati panel il comando può
2925testare solo una variabile alla volta. L'opzione --verbose, inoltre, ha un
2926significato diverso: produce un breve resoconto del test per ciascuna
2927singola serie storica (di default viene mostrato solo il risultato
2928complessivo).
2929
2930Se possibile, viene calcolato il test complessivo (ipotesi nulla: la
2931variabile in questione è stazionaria per tutte le unità panel) usando il
2932metodo di Choi (Journal of International Money and Finance, 2001). Questo
2933calcolo non è sempre immediato perchè, mentre il test di Choi è basato
2934sui p-value dei test sulle singole serie, attualmente non esiste un modo per
2935calcolare i p-value della statistica test KPSS; dobbiamo perciò basarci su
2936qualche valore critico.
2937
2938Se per una data variabile la statistica test cade fra i valori critici al 10
2939e all'1 per cento siamo in grado di interpolare un p-value. Ma se il test
2940cade a sinistra del valore critico al 10 per cento, o supera quello all'1
2941per cento, non riusciamo a compiere l'interpolazione e tutto ciò che
2942possiamo al limite fare è apporre un limite al test globale di Choi. Se le
2943singole statistiche test si trovano a sinistra del valore critico al 10 per
2944cento per alcune unità, ma superano quello all'1 per cento per altre, non
2945è possibile neppure il calcolo del limite superiore del test globale.
2946
2947Accesso dal menù:    /Variabile/Test di radice unitaria/Test KPSS
2948
2949# labels Dataset
2950
2951Varianti:   labels [ varlist ]
2952            labels --to-file=filename
2953            labels --from-file=filename
2954            labels --delete
2955Esempi:     oprobit.inp
2956
2957Nella sua prima forma mostra le etichette informative (se presenti) per le
2958variabili in varlist, oppure per tutte le variabili nel dataset se varlist
2959non è specificata.
2960
2961Con l'opzione --to-file, scrive nel file indicato le etichette di tutte le
2962variabili nel dataset, una per linea. Se non sono presenti etichette viene
2963emesso un messaggio d'errore; se alcune variabili hanno etichette e altre
2964no, per le seconde viene mostrata una linea vuota. Il file di output verrà
2965scritto nella directory corrispondente al valore corrente di "workdir", a
2966meno che il nome di file contenga un percorso completo.
2967
2968Con l'opzione --from-file, legge il file specificato (che deve essere di
2969testo) e assegna le etichette alle variabili nel dataset, leggendo
2970un'etichetta per linea e interpretando linee vuote come etichette vuote.
2971
2972L'opzione --delete da quello che vi attendete: rimuove dal dataset tutte le
2973etichette di variabili.
2974
2975Accesso dal menù:    /Dati/Etichette delle variabili
2976
2977# lad Estimation
2978
2979Argomenti:  variabile-dipendente variabili-indipendenti
2980Opzioni:    --vcv (mostra la matrice di covarianza)
2981            --no-vcv (non calcolare la matrice di covarianza)
2982            --quiet (non stampa nulla)
2983
2984Calcola una regressione che minimizza la somma delle deviazioni assolute dei
2985valori stimati dai valori effettivi della variabile dipendente. Le stime dei
2986coefficienti sono derivate usando l'algoritmo del simplesso di
2987Barrodale-Roberts; viene mostrato un messaggio di avvertimento se la
2988soluzione non è unica.
2989
2990Gli errori standard sono derivati usando la procedura bootstrap con 500
2991estrazioni. La matrice di covarianza per le stime dei parametri, mostrata se
2992si usa l'opzione --vcv, si basa sulla stessa procedura. Questa è
2993un'operazione computazionalmente piuttosto onerosa, per cui se sono
2994richieste le sole stime puntuali, essa può essere omessa attraverso
2995l'opzione --no-vcv; in questo caso, gli errori standard non saranno
2996disponibili.
2997
2998Si noti che questo stimatore può richiedere molto tempo di calcolo per
2999campioni grandi o modelli con molte variabili esplicative; in questi casi,
3000consigliamo di usare il comando "quantreg". I due comandi sono di fatto
3001equivalenti, a parte il fatto che quantreg usa l'algoritmo di Frisch-Newton
3002(più efficiente) e fornisce errori standard analitici anziché via
3003bootstrap.
3004
3005  lad y const X
3006  quantreg 0.5 y const X
3007
3008Accesso dal menù:    /Modello/Stima robusta/LAD - Minime deviazioni assolute
3009
3010# lags Transformations
3011
3012Argomenti:  [ ordine ; ] lista-variabili
3013Opzione:    --bylag (ordina i termini per ritardo)
3014Esempi:     lags x y
3015            lags 12 ; x y
3016            lags 4 ; x1 x2 x3 --bylag
3017            Vedi anche sw_ch12.inp, sw_ch14.inp
3018
3019Crea delle nuove variabili le quali sono i valori ritardati di ognuna delle
3020variabili nella lista-variabili. Il numero dei ritardi può essere indicato
3021dal primo parametro opzionale, altrimenti sarà pari alla periodicità del
3022dataset. Ad esempio, se la periodicità è 4 (trimestrale), il comando "lags
3023x y" crea
3024
3025      x_1 = x(t-1)
3026      x_2 = x(t-2)
3027      x_3 = x(t-3)
3028      x_4 = x(t-4)
3029
3030Il numero dei ritardi creati può essere indicato come primo parametro
3031opzionale (se presente, deve essere seguito da un punto e virgola).
3032
3033L'opzione --bylag ha senso solo se la lista-variabili contiene più di una
3034serie di variabili con ordine massimo di ritardo maggiore di 1. Da
3035impostazione predefinita, i termini ritardati vengono aggiunti al dataset
3036come variabili: si inizia con tutti i ritardi della prima serie, poi si
3037passa quelli della seconda, poi della terza e così via. Tuttavia, se
3038l'opzione --bylag è data il riordino viene fatto per ritardi: si inizia con
3039il primo ritardo di tutte le variabili, poi si passa al secondo e così via.
3040
3041Accesso dal menù:    /Aggiungi/Ritardi delle variabili selezionate
3042
3043# ldiff Transformations
3044
3045Argomento:  lista-variabili
3046
3047Calcola la differenza prima del logaritmo naturale di ogni variabile della
3048lista-variabili e la salva in una nuova variabile con il prefisso ld_.
3049Così, "ldiff x y" crea le nuove variabili
3050
3051      ld_x = log(x) - log(x(-1))
3052      ld_y = log(y) - log(y(-1))
3053
3054Accesso dal menù:    /Aggiungi/Differenze logaritmiche
3055
3056# leverage Tests
3057
3058Opzioni:    --save (salva le variabili risultato)
3059            --quiet (non mostra i risultati)
3060            --plot=mode-or-filename (si veda oltre)
3061Esempi:     leverage.inp
3062
3063Deve seguire immediatamente un comando "ols". Calcola il "leverage" (h,
3064compreso tra 0 e 1) di ogni osservazione nel campione su cui è stato
3065stimato il precedente modello. Mostra il residuo (u) per ogni osservazione
3066assieme al leverage corrispondente e a una misura della sua influenza sulla
3067stima: u*h/(1-h). I "punti di leverage" per cui il valore di h supera 2k/n
3068(dove k è il numero dei parametri stimati e n è l'ampiezza del campione)
3069sono indicati con un asterisco. Per i dettagli sui concetti di leverage e
3070influenza, si veda Davidson e MacKinnon (1993), capitolo 2.
3071
3072Vengono mostrati anche i valori DFFITS: questi sono "residui studentizzati"
3073(ossia i residui previsti, divisi per i propri errori standard) moltiplicati
3074per sqrt[h/(1 - h)]. Per una discussione dei residui studentizzati e dei
3075valori DFFITS si veda Maddala,Introduction to Econometrics, cap. 12, oppure
3076Belsley, Kuh e Welsch (1980).
3077
3078In breve, i "residui previsti" sono la differenza tra il valore osservato e
3079il valore stimato della variabile dipendente all'osservazione t, ottenuti da
3080una regressione in cui quell'osservazione è stata omessa (oppure in cui è
3081stata aggiunta una variabile dummy che vale 1 solo per l'osservazione t); il
3082residuo studentizzato si ottiene dividendo il residuo previsto per il
3083proprio errore standard.
3084
3085Se si usa l'opzione --save, il leverage, il valore di influenza e il valore
3086DFFITS vengono aggiunti al dataset in uso. In questo contesto, l'opzione
3087--quiet evita che i risultati vengano stampati. I nomi di default delle
3088serie prodotte sono rispettivamente lever, influ e dffits. Se però serie
3089con questo nome già esistono, i nomi delle serie prodotte sarano ritoccati
3090per assicurarne l'unicità; se così avvenisse, occuperanno i tre numeri di
3091serie più alti nel dataset.
3092
3093Dopo l'esecuzione, l'accessore "$test" restituisce il criterio di
3094validazione incrociata, definito come la somma dei quadrati degli scarti fra
3095la variabile dipendente e il suo valore previsto, calcolato a partire da un
3096campione dal quale quell'osservazione è stata esclusa. (Questo stimatore è
3097chiamato leave-one-out). Per una discussione più approfondita del criterio
3098di validazione incrociata, v. Davidson e MacKinnon's Econometric Theory and
3099Methods, pag. 685-686, e i riferimenti bibliografici ivi citati.
3100
3101Per impostazione predefinita, se questo comando viene invocato verrà
3102mostrata una versione interattiva del grafico del leverage e dei valori
3103d'influenza. Questo può essere aggiustato tramite l'opzione --plot. I
3104parametri accettabili per quest'opzione sono none per sopprimere il grafico,
3105display per mostrare il grafico anche in modalità script, oppure il nome
3106del file. L'effetto di dare un nome di file al comando è descritto
3107all'interno dell'opzione --output del comando "gnuplot".
3108
3109Accesso dal menù:    Finestra del modello, /Test/LEVERAGE - Osservazioni influenti
3110
3111# levinlin Tests
3112
3113Argomenti:  order series
3114Opzioni:    --nc (test senza costante)
3115            --ct (con costante e trend)
3116            --quiet (non mostra i risultati)
3117            --verbose (stampa i risultati per unità)
3118Esempi:     levinlin 0 y
3119            levinlin 2 y --ct
3120            levinlin {2,2,3,3,4,4} y
3121
3122Calcola il test di radice unitaria per dati panel di Levin, Lin e Chu
3123(2002). L'ipotesi nulla che tutte le singole serie storiche contengano una
3124radica unitaria, mentre l'alternativa è che nessuna delle serie storiche ne
3125contenga una. (In altre parole, si assume un coefficiente AR(1) comune a
3126tutte le serie, anche se altre proprietà statistiche delle serie possono
3127variare da un'unità di osservazione all'altra.)
3128
3129Di default le regressioni dei test ADF contengono una costante; per
3130eliminarla usate l'opzione --nc; per aggiungere un trend lineare usate
3131l'opzione --ct. (Vedi il comando "adf" per una spiegazione delle regressioni
3132ADF.)
3133
3134Il valore (non negativo) order del numero di ritardi della variabile
3135dipendente da usare nel test può essere indicato in due modi diversi. Se si
3136fornisce uno scalare, questo viene applicato a tutte le serie nel panel. In
3137alternativa è possibile fornire una matrice che contiene un particolare
3138ordine di ritardo per ogni serie. La matrice deve essere un vettore con
3139numero di elementi pari a quello delle unità di osservazione nel
3140sottoinsieme corrente del campione, e può essere indicata per nome o
3141costruita usando parentesi graffe come illustrato nell'ultimo degli esempi
3142precedenti.
3143
3144Con l'opzione --verbose, vengono stampate per ogni unità nel panel le
3145seguenti statistiche: delta, il coefficiente sul livello ritardato in ognuna
3146delle regressioni ADF; s2e, la varianza stimata delle innovazioni; e s2y, la
3147varianza di lungo periodo stimata per la serie in differenze.
3148
3149Si noti che test di radice unitaria in panel pèossono anche essere
3150condiotti mediante i comandi "adf" e "kpss".
3151
3152Accesso dal menù:    /Variable/Unit root tests/Levin-Lin-Chu test
3153
3154# logistic Estimation
3155
3156Argomenti:  variabile-dipendente variabili-indipendenti
3157Opzioni:    --ymax=value (specifica il massimo della variabile dipendente)
3158            --robust (utilizza errori standard robusti)
3159            --cluster=clustvar (si veda "logit" per una ulteriore spiegazione)
3160            --vcv (mostra la matrice di varianza-covarianza)
3161            --fixed-effects (si veda oltre)
3162            --quiet (non mostra nulla)
3163Esempi:     logistic y const x
3164            logistic y const x --ymax=50
3165
3166Regressione logistica: esegue una regressione OLS usando la trasformazione
3167logistica sulla variabile dipendente:
3168
3169  log(y/(y* - y))
3170
3171La variabile dipendente dev'essere strettamente positiva. Se è una frazione
3172decimale, compresa tra 0 e 1, il valore predefinito per y^* (il massimo
3173asintotico della variabile dipendente) è 1. Se la variabile dipendente è
3174una percentuale, compresa tra 0 e 100, il valore predefinito di y^* è 100.
3175
3176È possibile indicare un valore diverso per il massimo, usando l'opzione
3177--ymax. Il valore fornito deve essere maggiore di tutti i valori osservati
3178della variabile dipendente.
3179
3180I valori stimati e i residui della regressione sono trasformati
3181automaticamente usando l'inversa della trasformazione logistica:
3182
3183  y = y* / (1 + exp(-x))
3184
3185dove x rappresenta un valore stimato oppure un residuo della regressione
3186OLS, usando la variabile dipendente trasformata. I valori riportati sono
3187dunque confrontabili con la variabile dipendente originale. Il bisogno
3188dell'approssimazione sorge dal fatto che la trasformazione inversa è una di
3189natura non-lineare e quindi quest'ultima non conserva un valore atteso.
3190
3191L'opzione --fixed-effects è utilizzabile solo se il dataset assume una
3192forma panel. In questo caso si sottrae la media del gruppo dalla
3193trasformazione logistica della variabile dipendente e si procede alla
3194classica stima ad effetti fissi.
3195
3196Si noti che se la variabile dipendente è binaria, occorre usare il comando
3197"logit" invece di questo comando.
3198
3199Accesso dal menù:    /Modello/Modelli non lineari/Logistico
3200
3201# logit Estimation
3202
3203Argomenti:  variabile-dipendente variabili-indipendenti
3204Opzioni:    --robust (errori standard robusti)
3205            --cluster=clustvar (errori standard clusterizzati)
3206            --multinomial (stima un logit multinomiale)
3207            --vcv (mostra la matrice di covarianza)
3208            --verbose (mostra i dettagli delle iterazioni)
3209            --quiet (non mostra i risultati)
3210            --p-values (mostra i p-value invece delle pendenze)
3211Esempi:     keane.inp, oprobit.inp
3212
3213Se la variabile dipendente è binaria (i suoi valori sono 0 o 1), esegue una
3214stima di massima verosimiglianza dei coefficienti per le
3215variabili-indipendenti con il metodo di Newton-Raphson. Visto che il modello
3216è nonlineare, le pendenze dipendono dai valori delle variabili
3217indipendenti: per impostazione predefinita, al posto dei p-value vengono
3218mostrate le pendenze rispetto ad ognuna delle variabili indipendenti,
3219calcolate in corrispondenza della media della variabile. Questo
3220comportamento può essere soppresso usando l'opzione --p-values. La
3221statistica chi-quadro testa l'ipotesi nulla che tutti i coefficienti tranne
3222la costante siano pari a zero.
3223
3224In modalità predefinita, gli errori standard sono calcolati con l'inversa
3225negativa dell'Hessiana. Se si usa l'opzione --robust, verranno calcolati gli
3226errori standard QML o quelli di Huber-White. In questo caso, la matrice di
3227covarianza stimata è un "sandwich" dell'inversa dell'Hessiana stimata e del
3228prodotto esterno del gradiente. Per i dettagli, si veda il cap. 10 di
3229Davidson e MacKinnon (2004). Ma se viene usata l'opzione --cluster, verranno
3230prodotti errori standard "cluster-robusti"; vedi la guida all'uso di gretl
3231(il capitolo 22) per maggiori dettagli.
3232
3233Se la variabile dipendente non è binaria, ma è discreta, si ottengono
3234stime Logit ordinate. Tuttavia, se viene fornita l'opzione --multinomial, la
3235variabile dipendente è interpretata come non ordinale, e vengono prodotte
3236stime Logit Multinomiali. (In ambo i casi, verrà dato un errore se la
3237dipendente non è discreta.) Nel caso multinomiale, l'accessore "$mnlprobs"
3238sarà disponibile dopo la stima; esso conterrà una matrice con le
3239probabilità stimate dei possibili valori della dipendente per ogni
3240osservazione (osservazioni per riga, valori per colonna).
3241
3242Per condurre un'analisi delle proporzioni (dove la variabile dipendente è
3243la proporzione dei casi che hanno una certa caratteristica in ogni
3244osservazione, invece che una variabile binaria che indica se la
3245caratteristica è presente o no), non bisogna usare il comando "logit", ma
3246occorre costruire la variabile logit come
3247
3248      genr lgt_p = log(p/(1 - p))
3249
3250e usare questa come variabile dipendente in una regressione OLS. Si veda
3251Ramanathan (2002), capitolo 12.
3252
3253Accesso dal menù:    /Modello/Modelli non lineari/Logit
3254
3255# logs Transformations
3256
3257Argomento:  lista-variabili
3258
3259Calcola il logaritmo naturale di ognuna delle variabili della
3260lista-variabili e lo salva in una nuova variabile col prefisso l_, ossia una
3261"elle" seguita da un trattino basso. Ad esempio "logs x y" crea le nuove
3262variabili l_x = ln(x) e l_y = ln(y).
3263
3264Accesso dal menù:    /Aggiungi/Logaritmi delle variabili selezionate
3265
3266# loop Programming
3267
3268Argomento:  controllo
3269Opzioni:    --progressive (abilita modalità speciali di alcuni comandi)
3270            --verbose (mostra i dettagli dei comandi genr)
3271Esempi:     loop 1000
3272            loop 1000 --progressive
3273            loop while essdiff > .00001
3274            loop i=1991..2000 --verbose
3275            loop for (r=-.99; r<=.99; r+=.01)
3276            loop foreach i xlist
3277            Vedi anche armaloop.inp, keane.inp
3278
3279Questo comando apre una modalità speciale, in cui il programma accetta
3280comandi da eseguire più volte. Si esce dalla modalità loop con
3281l'istruzione "endloop": solo a questo punto i comandi indicati vengono
3282eseguiti.
3283
3284Il parametro "controllo" deve assumere uno dei cinque valori mostrati negli
3285esempi: un numero di volte per cui ripetere i comandi all'interno del loop;
3286"while" seguito da una condizione booleana; un intervallo di valori interi
3287per una variabile indice; "for" seguito da tre espressioni tra parentesi,
3288separate da punti e virgola (in modo simile all'istruzione for nel
3289linguaggio di programmazione C); infine, "foreach" seguito da una variabile
3290indice e una lista.
3291
3292Si veda la guida all'uso di gretl (il capitolo 13) per altri dettagli ed
3293esempi, oltre che per la spiegazione dell'opzione --progressive (che è
3294destinata ad essere usata nelle simulazioni Monte Carlo) e per l'elenco dei
3295comandi di gretl che possono essere usati all'interno di un loop.
3296
3297Per impostazione predefinita, l'esecuzione dei comandi procede con un output
3298ridotto rispetto dentro un loop, rispetto ad altri contesti. Per avere più
3299informazioni su quel che succede dentro il loop, si può usare l'opzione
3300--verbose.
3301
3302# mahal Statistics
3303
3304Argomento:  lista-variabili
3305Opzioni:    --quiet (non mostra nulla)
3306            --save (salva le distanze nel dataset)
3307            --vcv (mostra la matrice di covarianza)
3308
3309La distanza di Mahalanobis è la distanza tra due punti in uno spazio
3310k-dimensionale, scalata rispetto alla variazione statistica in ogni
3311dimensione dello spazio. Ad esempio, se p e q sono due osservazioni su un
3312insieme di k variabili con matrice di covarianza C, la distanza di
3313Mahalanobis tra le due osservazioni è data da
3314
3315  sqrt((p - q)' * C-inversa * (p - q))
3316
3317dove (p - q) è un vettore a k dimensioni. Se la matrice di covarianza è la
3318matrice identità, la distanza di Mahalanobis corrisponde alla distanza
3319Euclidea.
3320
3321Lo spazio in cui vengono calcolate le distanze è definito dalle variabili
3322selezionate; per ogni osservazione nell'intervallo attuale viene calcolata
3323la distanza tra l'osservazione e il centroide delle variabili selezionate.
3324La distanza è la controparte multidimensionale di uno z-score standard e
3325può essere usata per giudicare se una certa osservazione "appartiene" a un
3326gruppo di altre osservazioni.
3327
3328Se si usa l'opzione --vcv, vengono mostrate la matrice di covarianza e la
3329sua inversa. Se si usa l'opzione --save, le distanze vengono salvate nel
3330dataset con il nome mdist (o mdist1, mdist2 e così via, se esiste già una
3331variabile con quel nome).
3332
3333Accesso dal menù:    /Visualizza/Distanze di Mahalanobis
3334
3335# makepkg Programming
3336
3337Argomento:  filename
3338Opzioni:    --index (crea un file ausiliario di indicizzazione)
3339            --translations (crea un file ausiliario di stringhe)
3340            --quiet (lavora silenziosamente)
3341
3342Permette la creazione di un "function package" da linea di comando. Il nome
3343di file indica il nome del pacchetto da creare e deve avere estensione .gfn.
3344Si veda la guida all'uso di gretl (il capitolo 14) per dettagli.
3345
3346Modalità gfn
3347
3348Crea un file gfn. Si assume che sia accessibile un file di specificazione
3349del pacchetto, con lo stesso nome di filename ma con estensione .spec;
3350devono anche esistere tutti gli eventuali file ausiliatri in esso
3351menzionati. Infine, si assume che tutte le funzioni da inserire nel
3352pacchetto siano presenti in memoria.
3353
3354Modalità zip
3355
3356Scrive un pacchetto di tipo zip (gfn più materiale extra). Se viene trovato
3357un file gfn con lo stesso nome di filename, gretl cercherà due file
3358corrispondenti con estensione inp e spec: se vengono trovati entrambi e
3359almeno uno di essi è più recente del file gfn, allora quest'ultimo viene
3360ricreato, altrimenti viene usato quello esistente. Se il file non esiste,
3361gretl creerà il file gfn come prima cosa.
3362
3363Opzioni gfn
3364
3365Le opzioni consentono la scrittura di file ausiliari per l'uso con gli
3366"addon" di gretl. Il file indice è un breve documento XML contenente alcune
3367informazioni base sul pacchetto; ha lo stesso nome del pacchetto stesso ed
3368estensione .xml. Il file di traduzione contiene le stringhe da tradurre del
3369pacchetto, in formato C; per il pacchetto pippo questo file in questione
3370dovrà chiamarsi pippo-i18n.c. Questi file non vengono prodotti se si opera
3371tramite la modalità zip con l'utilizzo di un file gfn pre-esistente.
3372
3373Per maggiori dettagli, consultare Guida ai pacchetti.
3374
3375Accesso dal menù:    /Strumenti/Pacchetti di funzioni/Nuovo pacchetto
3376
3377# markers Dataset
3378
3379Varianti:   markers --to-file=nomefile
3380            markers --from-file=nomefile
3381            markers --delete
3382
3383Con l'opzione --to-file, scrive nel file indicato le stringhe marcatrici
3384delle osservazioni presenti nel dataset corrente, una per ogni linea. Se il
3385dataset non contiene stringhe viene emesso un messaggio d'errore. Il file di
3386output verrà scritto nella directory corrispondente al valore corrente di
3387"workdir", a meno che il nome di file contenga un percorso completo.
3388
3389Con l'opzione --from-file, legge dal file specificato (che deve essere in
3390formato testo) e assegna alle righe del dataset i marcatori di osservazione,
3391leggendone uno per riga. In generale il file dovrebbe contenere tanti
3392marcatori quante sono le osservazioni nel dataset, ma se quest'ultimo è un
3393panel il numero di marcatori nel file potrebbe anche essere pari al numero
3394di unità in cross-section (nel qual caso i marcatori sono ripetuti a ogni
3395data).
3396
3397L'opzione --delete fa quello che vi aspettate: cancella le stringhe
3398marcatrici delle osservazioni dal dataset.
3399
3400# meantest Tests
3401
3402Argomenti:  var1 var2
3403Opzione:    --unequal-vars (assume varianze diverse)
3404
3405Calcola la statistica t per l'ipotesi nulla che le medie della popolazione
3406siano uguali per le variabili var1 e var2, mostrando il suo p-value.
3407
3408L'impostazione predefinita prevede di assumere che le varianze delle due
3409variabili siano uguali, mentre usando l'opzione --unequal-vars, si assume
3410che esse siano diverse; in questo caso i gradi di libertà per la statistica
3411test saranno approssimati per Satterthwaite (1946).
3412
3413Accesso dal menù:    /Modello/Modelli bivariati/Differenza delle medie
3414
3415# midasreg Estimation
3416
3417Argomenti:  depvar indepvars ; MIDAS-terms
3418Opzioni:    --vcv (stampa la matrice di covarianze)
3419            --robust (errori standard robusti)
3420            --quiet (non stampa i risultati)
3421            --levenberg (vedi sotto)
3422Esempi:     midasreg y 0 y(-1) ; mds(X, 1, 9, 1, theta)
3423            midasreg y 0 y(-1) ; mds(X, 1, 9, 0)
3424            midasreg y 0 y(-1) ; mdsl(XL, 2, theta)
3425            Vedi anche gdp_midas.inp
3426
3427Stima coi minimi quadrati (lineari o meno, a seconda della specificazione)
3428un modello MIDAS (Mixed Data Sampling), ossia un modello in cui una o più
3429delle variabili esplicative sono osservate a frequenza più alta della
3430dipendente; per una buona introduzione all'argomento si veda Armesto,
3431Engemann e Owyang (2010).
3432
3433Le variabili in indepvars devono essere alla stessa frequenza della
3434dipendente. Questa lista normalmente contiene anche const o 0 (intercetta)
3435e, di solito, uno o più ritardi della variabile dipendente. I termini ad
3436alta frequenza vengono forniti dopo un punto e virgola; ognuno di essi sotto
3437forma di numeri separati da virgole fra parentesi, col prefisso mds oppure
3438mdsl.
3439
3440mds: questa variante richiede 5 argomenti, come segue: il nome di una "MIDAS
3441list", due interi col minimo e massimo ritardo ad alta frequenza, un intero
3442fra 0 e 4, che specifica il tipo di parametrizzazione da usare, e il nome di
3443un vettore contenente i valori iniziali dei parametri. L'esempio qui sotto
3444usa i ritardi da 3 a 11 della serie ad alta frequenza contenuta nella lista
3445X, usando la parametrizzazione di tipo 1 (Almon esponenziale, vedi sotto)
3446con inizializzazione theta.
3447
3448	  mds(X, 3, 11, 1, theta)
3449
3450mdsl: in gnere richiede 3 argomenti: il nome di una lista di ritardi MIDAS,
3451un intero per il tipo di parametrizzazione e il nome di un vettore di valori
3452iniziali. In questo caso i ritardi minimo e massimo sono impliciti
3453nell'argomento lista iniziale. Nell'esempio seguente Xlags deve essere una
3454lista che contiene già i ritardi necessari; essa può essere costruita
3455tramite la funzione "hflags" function.
3456
3457	  mdsl(XLags, 1, theta)
3458
3459I tipi di parametrizzazione sono disponibili come segue; nel contesto mds e
3460mdsl le specificazioni in questione dovrebbero essere date in forma di
3461codice numerio o di stringhe virgolettate esposte dopo i numeri.
3462
34630 o "umidas": "MIDAS non vincolato" o U-MIDAS (un coefficiente per ritardo)
3464
34651 o "nealmon": Almon esponenziale normalizzato; necessita di almeno un
3466parametro, di solito due
3467
34682 o "beta0": beta normalizzato con zero finale; richiede due parametri
3469
34703 o "betan": beta normalizzato senza zero finale; richiede tre parametri
3471
34724 o "almonp": polinomio di Almon non normalizzato; richiede almeno un
3473parametro
3474
3475Quando la parametrizzazione è U-MIDAS, l'argomento di inzializzazione non
3476è necessario con mds or mdsl. In altri casi, si può richiedere
3477un'inizializzazione automatica sostituendo una di queste due forme col nome
3478di un vettore di parametri iniziali:
3479
3480  La parola chiave null: accettabile solo se la parameterizzazione scelta ha
3481  un numero fisso di termini (i casi beta, 2 o 3). È accettata anche nel
3482  caso di Almon esponenziale, implicando come valori predifiniti 2
3483  parametri.
3484
3485  Un intero col numero di parametri richiesto.
3486
3487Il metodo di stima usato da questo comando dipende dalla specificazione dei
3488termini ad alta frequenza. Nel caso U-MIDAS il metodo è l'OLS; in tutti gli
3489altri casi si usano i minimi quadrati non lineari (NLS). Quando si
3490specificano le parametrizzazioni Almon esponenziale normalizzata oppure beta
3491normalizzata, il metodo NLS di default è una combinazione di BFGS vincolato
3492e OLS, ma per forzare l'uso dell'algoritmo di Levenberg-Marquardt si può
3493usare l'opzione --levenberg.
3494
3495Accesso dal menù:    /Model/Time series/MIDAS
3496
3497# mle Estimation
3498
3499Argomenti:  funzione di log-verosimiglianza [ derivate ]
3500Opzioni:    --quiet (non stampa il modello stimato)
3501            --vcv (mostra la matrice di covarianza)
3502            --hessian (calcola la matrice di covarianza a partire dall'Hessiana)
3503            --robust (matrice di covarianza QML)
3504            --cluster=clustvar (errori standard clusterizzati)
3505            --verbose (stampa i dettagli delle iterazioni)
3506            --no-gradient-check (vedi sotto)
3507            --auxiliary (vedi sotto)
3508            --lbfgs (usa L-BFGS-B anziché il BFGS standard)
3509Esempi:     weibull.inp, biprobit_via_ghk.inp, frontier.inp, keane.inp
3510
3511Esegue la stima di massima verosimiglianza (ML, Maximum Likelihood) usando a
3512scelta o l'algoritmo BFGS (Broyden, Fletcher, Goldfarb, Shanno) o quello di
3513Newton. Occorre specificare la funzione di log-verosimiglianza e dichiarare
3514i valori iniziali per i parametri della funzione Se possibile è
3515consigliabile indicare anche le espressioni per le derivate di questa
3516funzione, rispetto ad ognuno dei parametri; se non si indicano le derivate
3517analitiche, verrà calcolata un'approssimazione numerica.
3518
3519Questo messaggio di aiuto presuppone l'utilizzo dell'algoritmo di
3520massimizzazione BFGS, per maggiori informazioni circa l'uso dell'algoritmo
3521di Newton si consulti la guida all'uso di gretl (il capitolo 26).
3522
3523Esempio: si supponga di avere una serie X con valori 0 o 1 e di voler
3524ottenere la stima di massima verosimiglianza della probabilità p che X
3525valga 1 (è semplice intuire che la stima ML di p corrisponderà alla
3526proporzione dei valori 1 nel campione).
3527
3528Occorre per prima cosa aggiungere p al dataset e assegnargli un valore
3529iniziale; ad esempio,
3530
3531	scalar p = 0.5
3532
3533Quindi costruiamo il blocco di comandi per la stima di massima
3534verosimiglianza:
3535
3536	mle loglik = X*log(p) + (1-X)*log(1-p)
3537	deriv p = X/p - (1-X)/(1-p)
3538	end mle
3539
3540La prima riga specifica la funzione di log-verosimiglianza: inizia con la
3541parola chiave mle, quindi contiene la variabile dipendente e una
3542specificazione per la log-verosimiglianza usando la stessa sintassi del
3543comando "genr". La riga seguente (che è opzionale), inizia con la parola
3544chiave deriv e fornisce la derivata della funzione di log-verosimiglianza
3545rispetto al parametro p. Se non vengono indicate derivate, occorre includere
3546una dichiarazione che identifica i parametri liberi (separati da spazi)
3547utilizzando la parola chiave params; questi parametri liberi possono essere
3548sia scalari, che vettori, che una qualsiasi combinazione dei due. Ad esempio
3549si sarebbe potuto scrivere:
3550
3551	mle loglik = X*log(p) + (1-X)*log(1-p)
3552	params p
3553	end mle
3554
3555e in questo caso la derivata verrebbe calcolata numericamente.
3556
3557Si noti che eventuali opzioni vanno indicate nella riga finale del blocco
3558MLE. Ad esempio:
3559
3560	mle loglik = X*log(p) + (1-X)*log(1-p)
3561	  params p
3562	end mle --quiet
3563
3564Matrice di covarianza ed errori standard
3565
3566Se la funzione di log-verosimiglianza restituisce una variabile o un vettore
3567per ogni valore delle osservazioni allora gli errori standard sono, per
3568impostazione predefinita, basati sul prodotto esterno del gradiente (OPG),
3569mentre se l'opzione --hessian è fornita allora quest'ultimi saranno
3570ottenuti sulla base dell'inversa negativa della matrice hessiana, la quale
3571verrà approssimata numericamente. Se l'opzione --robust è data allora
3572verrà utilizzato uno stimatore di quasi-massima verosimiglianza (QML),
3573ossia uno stimatore ottenuto dal sandwich dell'inversa negativa della
3574matrice hessiana e del prodotto esterno del gradiente (OPG). In ogni caso,
3575se la funzione di log-verosimiglianza restituisce semplicemente un valore
3576scalare il metodo OPG non risulta disponibile (come anche lo stimatore QML),
3577e gli errori standard sono necessariamente calcolati usando l'hessiana
3578numerica.
3579
3580Nel caso in cui si volesse solo il parametro primario delle stime è
3581possibile dare l'opzione --auxiliary, la quale sopprime il calcolo della
3582matrice di covarianza e degli errori standard; questo permetterà di
3583risparmiare alcuni cicli della CPU, salvando anche un po' di memoria.
3584
3585Controllo delle derivate analitiche
3586
3587Se si forniscono le derivate analitiche della funzione di
3588log-verosimiglianza, di default gretl esegue un controllo numerico circa la
3589loro attendibilità. Occasionalmente, questo controllo potrebbe produrre dei
3590falsi positivi, ovvero casi in cui derivate calcolate correttamente vengono
3591segnalate come errate e di cui la stima viene quindi negata. Per impedire
3592che ciò accada, o per aggiungere un poco di velocità in più al processo,
3593è possibile dare l'opzione --no-gradient-check. Ovviamente questo andrebbe
3594fatto solo nel caso in cui si è assolutamente sicuri che il gradiente dato
3595in specifica è corretto.
3596
3597Nomi dei parametri
3598
3599Quando si stima un modello non lineare spesso risulta conveniente nominare i
3600parametri in maniera concisa. Nella stampa dei risultati, comunque, risulta
3601desiderabile che le etichette data siano le più informative e sintetiche
3602possibili. Questo risultato pyò venire ottenuto aggiungendo la parola
3603chiave param_names all'interno del blocco di comando. Per un modello con k
3604parametri l'argomento successivo a questa parola chiave può essere sia una
3605stringa di testo, messa tra virgolette, contenente k nomi separati da uno
3606spazio, sia il nome di una stringa di variabili avente al suo interno tutti
3607i k nomi.
3608
3609Per maggiori informazioni circa la massima verosimiglianza ("mle")
3610raccomandiamo di consultare la guida all'uso di gretl (il capitolo 26).
3611
3612Accesso dal menù:    /Modello/Massima verosimiglianza
3613
3614# modeltab Utilities
3615
3616Varianti:   modeltab add
3617            modeltab show
3618            modeltab free
3619            modeltab --output=nomefile
3620
3621Manipola la "tabella modelli" di gretl. Si veda la guida all'uso di gretl
3622(il capitolo 3) per i dettagli. Le opzioni hanno i seguenti effetti: "add"
3623aggiunge l'ultimo modello stimato alla tabella modelli, se possibile; "show"
3624mostra la tabella modelli in una finestra; "free" pulisce la tabella.
3625
3626Per stampare la tabella del modello, si usi l'opzione --output= seguita dal
3627nome di un file. Se quest'ultimo ha il suffisso ".tex", l'output sarà in
3628formato TeX; se il suffisso è ".rtf" l'output sarà RTF; in caso contrario
3629sarà in formato di testo. Nel caso di output in formato TeX per default
3630verrà prodotto un "frammento" pronto per essere inserito in un documento;
3631se invece si preferisce ottenere un documento completo, usate l'opzione
3632--complete; per esempio,
3633
3634	modeltab --output="myfile.tex" --complete
3635
3636Accesso dal menù:    Finestra delle icone, Icona Tabella Modelli
3637
3638# modprint Printing
3639
3640Argomenti:  matcoeff nomi [ stat ]
3641Opzione:    --output=filename (invia l'output al file specificato)
3642
3643Stampa la tabella dei coefficienti e le statistiche aggiuntive opzionali per
3644un modello stimato "a mano". Utile principalmente per le funzioni definite
3645dall'utente.
3646
3647L'argomento matcoeff deve essere una matrice k per 2 che contiene i k
3648coefficienti stimati nella prima colonna ed i k relativi errori standard
3649associati nella seconda. L'argomento nomi deve fornire almeno k etichette
3650per i coefficienti. Può avere la forma di una stringa fissa (fra virgolette
3651doppie) o di una variabile di tipo stringa, nel qual caso le etichette vanno
3652separate con spazi oppure virgole. Alternativamente, si può usare allo
3653scopo un array di stringhe.
3654
3655L'argomento opzionale stat è un vettore che contiene p statistiche
3656aggiuntive da stampare sotto la tabella dei coefficienti. Se si usa questo
3657argomento, nomi deve contenere k + p stringhe di cui le ultime p sono
3658relative alle statistiche aggiuntive.
3659
3660Per inviare l'output ad un file, usate l'opzione --output= seguita dal nome
3661di un file. Se quest'ultimo ha il suffisso ".tex", l'output sarà in formato
3662TeX; se il suffisso è ".rtf" l'output sarà RTF; in caso contrario sarà in
3663formato di testo. Nel caso di output in formato TeX per default verrà
3664prodotto un "frammento" pronto per essere inserito in un documento; se
3665invece si preferisce ottenere un documento completo, usate l'opzione
3666--complete.
3667
3668Il file di output verrà scritto nella directory corrispondente al valore
3669corrente di "workdir", a meno che il nome di file contenga un percorso
3670completo.
3671
3672# modtest Tests
3673
3674Argomento:  [ ordine ]
3675Opzioni:    --normality (normalità dei residui)
3676            --logs (non linearità, logaritmi)
3677            --squares (non linearità, quadrati)
3678            --autocorr (autocorrelazione)
3679            --arch (ARCH)
3680            --white (test di White per l'eteroschedasticità)
3681            --white-nocross (test di White per l'eteroschedasticità cono solo i quadrati)
3682            --breusch-pagan (test per l'eteroschedasticità di Breusch-Pagan)
3683            --robust (stima robusta della varianza per Breusch-Pagan)
3684            --panel (eteroschedasticità, a gruppi)
3685            --comfac (restrizione a fattor comune, solo per modelli AR1)
3686            --xdepend (dipendenza cross-section, solo per dati panel)
3687            --quiet (non mostra i dettagli)
3688            --silent (non mostra i risultati)
3689Esempi:     credscore.inp
3690
3691Deve seguire immediatamente un comando di stima. La discussione che segue è
3692relativa all'esecuzione del comando dopo la stima di un modello ad equazione
3693singola; si veda la guida all'uso di gretl (il capitolo 32) per una
3694descrizione di come funziona "modtest" dopo la stima di un VAR
3695
3696A seconda dell'opzione usata, il comando esegue uno dei test seguenti: test
3697di Doornik-Hansen per la normalità del termine di errore; test dei
3698moltiplicatori di Lagrange per la non-linearità (logaritmi o quadrati);
3699test di White (con o senza i prodotti incrociati) o test di Breusch-Pagan
3700per l'eteroschedasticità (Breusch e Pagan, 1979), test LMF per la
3701correlazione seriale (si veda (Kiviet, 1986)); test per il modello ARCH
3702(Autoregressive Conditional Heteroskedasticity, si veda anche il comando
3703"arch"); o restrizione a fattore comune, (solo modelli AR1); o un test per
3704la dipendenza tra unità cross-sectio in caso di modelli con dati panel. Ad
3705eccezione dei test sulla normalità, a fattor comune e sulla dipendenza
3706cross-section, la maggior parte dei test risultano disponibili solo in caso
3707di stima OLS; per ulteriori dettagli circa lo stimatore TSLS (two-stage
3708least squares) si veda oltre.
3709
3710L'argomento opzionale ordine è rilevante solo nel caso si scelga l'opzione
3711--autocorr o l'opzione --arch. Per impostazione predefinita, questi test
3712sono eseguiti usando un ordine di ritardo pari alla periodicità dei dati,
3713ma è possibile anche impostare un ordine di ritardo specifico.
3714
3715L'opzione --robust ha effetto solo se viene scelto il test di Breusch-Pagan;
3716l'effetto è quello di usare lo stimatore robusto per la varianza proposto
3717da Koenker (1981), rendendo il test meno sensibile all'ipotesi di
3718normalità.
3719
3720L'opzione --panel è disponibile solo se il modello viene stimato su dati
3721panel: in questo caso viene eseguito un test per eteroschedasticità a
3722gruppi (ossia per una varianza dell'errore diversa fra le unità cross
3723section).
3724
3725L'opzione --comfac è disponibile solo quando il modello è stimato usando
3726un metodo AR(1), come quello di Hildreth-Lu. La regressione ausiliaria ha la
3727struttura di un modello dinamico relativamente poco vincolato ed è usata
3728per verificare il vincolo di fattori comuni implicito nella specificazione
3729AR(1).
3730
3731L'opzione --xdepend è disponibile solo se il modello viene stimato su dati
3732panel. La statistica test è sviluppata secondo il metodo di Pesaran (2004).
3733L'ipotesi nulla riguarda il termine di errore assunto come indipendentemente
3734distribuito per tutte le osservazioni cross-section o gli individui.
3735
3736Per impostazione predefinita il programma mostra la regressione ausiliaria
3737sulla quale la statistica test è basata, laddove possibile. Questa funzione
3738può venir soppressa utilizzando o l'opzione --quiet (che mostra le
3739informazioni strettamente necessarie) oppure con l'opzione --silent (che non
3740mostra alcuna informazione). La statistica test ed il relativo p-value
3741possono essere richiamati utilizzando gli accessori "$test" e "$pvalue".
3742
3743Nel caso di modelli stimati col metodo dei minimi quadrati a due stadi (si
3744veda "tsls"), non è possibile usare il test LM, quindi gretl offre alcuni
3745test equivalenti; in questo caso, l'opzione --autocorr calcola il test di
3746Godfrey per l'autocorrelazione (si veda Godfrey, 1994), mentre l'opzione
3747--white produce il test HET1 per l'eteroschedasticità (si veda Pesaran e
3748Taylor, 1999.
3749
3750Per ulteriori test diagnostici sui modelli si vedano anche le voci "chow",
3751"cusum", "reset" e "qlrtest".
3752
3753Accesso dal menù:    Finestra del modello, /Test
3754
3755# mpols Estimation
3756
3757Argomenti:  variabile-dipendente variabili-indipendenti
3758Opzioni:    --vcv (mostra la matrice di covarianza)
3759            --simple-print (non mostra le statistiche ausiliarie)
3760            --quiet (non mostra i risultati)
3761
3762Calcola le stime OLS per il modello indicato usando aritmetica in virgola
3763mobile a precisione multipla. Questo comando è disponibile solo se gretl è
3764compilato con il supporto per la libreria Gnu Multiple Precision (GMP). Per
3765impostazione predefinita, vengono usati 256 bit di precisione nei calcoli,
3766ma è possibile aumentare questo valore usando la variabile d'ambiente
3767GRETL_MP_BITS. Ad esempio, usando l'interprete dei comandi bash, è
3768possibile aumentare la precisione a 1024 bit eseguendo il comando seguente
3769prima di avviare gretl
3770
3771	export GRETL_MP_BITS=1024
3772
3773Per questo comando è disponibile un'opzione abbastanza speciale (utile
3774soprattutto a scopo di test): se la lista variabili-indipendenti è seguita
3775da un punto e virgola, e da un'ulteriore lista di numeri, questi numeri
3776vengono interpretati come potenze di x da aggiungere alla regressione, dove
3777x è l'ultima variabile della lista variabili-indipendeti. Questi termini
3778addizionali vengono calcolati e memorizzati in precisione multipla.
3779Nell'esempio seguente, y è regredita su x e sulla seconda, terza e quarta
3780potenza di x:
3781
3782	mpols y 0 x ; 2 3 4
3783
3784Accesso dal menù:    /Modello/Altri modelli lineari/MPOLS - Minimi quadrati in alta precisione
3785
3786# negbin Estimation
3787
3788Argomenti:  depvar indepvars [ ; offset ]
3789Opzioni:    --model1 (usa il modello NegBin 1)
3790            --robust (matrice di covarianza QML)
3791            --cluster=clustvar (vedi "logit" per una spegazione)
3792            --opg (vedi sotto)
3793            --vcv (stampa la matrice di covarianze)
3794            --verbose (mostra i dettagli delle iterazioni)
3795            --quiet (non mostra i risultati)
3796Esempi:     camtriv.inp
3797
3798Stima un modello Binomiale Negativo. Il comando assume che la variabile
3799dipendente rappresenti un conteggio del numero di volte in cui si è
3800verificato un certo evento e deve assumere solo valori interi non negativi.
3801Di default, viene usata la distribuzione NegBin 2, in cui la varianza
3802condizionale è data da mu(1 + αmu), dove mu denota la media condizionale.
3803Tuttavia, se vien data l'opzione --model1 allora la varianza condizionale
3804sarà data da mu(1 + α).
3805
3806L'argomento opzionale offset funziona come per il comando "poisson". In
3807effetti, il modello di Poisson è un caso particolare del binomiale negativo
3808con α = 0.
3809
3810Di default, gli errori standard vengono calcolati unsando un'approssimazione
3811numerica dell'Hessiana sul punto di massimo. Con l'opzione --opg la matrice
3812di covarianze verrà invece calcolata tramite il prodotto esterno dei
3813gradienti (OPG), o via QML con l'opzione --robust usando un "sandwich"
3814dell'hessiana inversa e dell'OPG.
3815
3816Accesso dal menù:    /Modelli/Modelli non lineari/Dati di conto
3817
3818# nls Estimation
3819
3820Argomenti:  funzione [ derivate ]
3821Opzioni:    --quiet (non stampa il modello stimato)
3822            --robust (errori standard robusti)
3823            --vcv (mostra la matrice di covarianza)
3824            --verbose (mostra i dettagli delle iterazioni)
3825            --no-gradient-check (si veda oltre)
3826Esempi:     wg_nls.inp, ects_nls.inp
3827
3828Esegue una stima con minimi quadrati non-lineari (NLS: Nonlinear Least
3829Squares) usando una versione modificata dell'algoritmo di
3830Levenberg-Marquardt. Occorre fornire una specificazione di funzione e
3831dichiarare i parametri di interesse della funzione ed i relativi valori
3832iniziali prima che la stima venga eseguita. Opzionalmente, è anche
3833possibile specificare le espressioni per le derivate della funzione rispetto
3834a ognuno dei parametri. Se non si indicano le derivate, occorre fornire una
3835lista dei parametri da stimare (separati da spazi o virgole), preceduta
3836dalla parola chiave params. In quest'ultimo caso, viene calcolata
3837un'approssimazione numerica del Jacobiano.
3838
3839È più semplice mostrare il funzionamento con un esempio. Quello che segue
3840è uno script completo per stimare la funzione di consumo non-lineare
3841presentata in Econometric Analysis di William Greene (capitolo 11 della
3842quarta edizione, o capitolo 9 della quinta). I numeri alla sinistra delle
3843righe sono dei punti di riferimento e non fanno parte dei comandi. Si noti
3844che le opzioni, come ad esempio --vcv per mostrare la matrice di covarianza
3845delle stime dei parametri, vanno aggiunte al comando finale end nls.
3846
3847	1   open greene11_3.gdt
3848	2   ols C 0 Y
3849	3   genr a = $coeff(0)
3850	4   genr b = $coeff(Y)
3851	5   genr g = 1.0
3852	6   nls C = a + b * Y^g
3853	7   deriv a = 1
3854	8   deriv b = Y^g
3855	9   deriv g = b * Y^g * log(Y)
3856	10  end nls --vcv
3857
3858Spesso è comodo inizializzare i parametri con riferimento a un modello
3859lineare collegato, come è mostrato nelle righe da 2 a 5. I parametri alfa,
3860beta e gamma possono essere impostati a qualunque valore iniziale (non
3861necessariamente sulla base di un modello stimato con OLS), ma la convergenza
3862della procedura NLS non è garantita per qualunque punto di partenza.
3863
3864I veri comandi NLS occupano le righe da 6 a 10. Sulla riga 6 viene dato il
3865comando "nls": viene specificata una variabile dipendente, seguita dal segno
3866uguale, seguito da una specificazione di funzione. La sintassi per
3867l'espressione a destra è la stessa usata per il comando "genr". Le tre
3868righe successive specificano le derivate della funzione di regressione
3869rispetto a ognuno dei parametri. Ogni riga inizia con il comando "deriv",
3870che indica il nome di un parametro, il segno di uguale e un'espressione che
3871indica come calcolare la derivata (anche qui la sintassi è la stessa di
3872"genr"). In alternativa, invece di fornire le derivate, è possibile
3873sostituire le righe dalla 7 alla 9 con la seguente:
3874
3875	params a b g
3876
3877La riga 10, "end nls", completa il comando ed esegue la stima.
3878
3879Se si forniscono le derivate in forma analitica, di default gretl
3880effettuerà una verifica numerica sulla correttezza dell'espressione data.
3881Occasionalmente, questa procedura potrebbe produrre "falsi positivi", ad
3882esempio indicando come errate delle derivate che invece sono correte,
3883facendo si che la stima di quest'ultime venga negata. Per evitare che ciò
3884accada, e/o per compilare leggermente più velocemente il codice, è
3885possibile utilizzare l'opzione --no-gradient-check. Ovviamente questo
3886andrebbe fatto solo in caso di assoluta certezza circa la correttezza delle
3887derivate analitiche.
3888
3889Nomi dei parametri
3890
3891Quando si stima un modello non lineare spesso risulta conveniente rinominare
3892i parametri in maniera sintetica. Durante la stampa del risultato, comunque,
3893è desiderabile che le etichette date, per quanto sintetiche, risultino le
3894più informative possibili. Questo risultato può essere ottenuto
3895aggiungendo al comando la parola chiave param_names. Per un modello con k
3896parametri l'argomento che segue a questa parola chiave dovrebbe essere o una
3897stringa letterale, posta tra virgolette, contenente k nomi diversi separati
3898da spazi o virgole, oppure il nome di un vettore contente un lista di nomi k
3899di variabile al suo interno.
3900
3901Per ulteriori dettagli sulla stima NLS si veda la guida all'uso di gretl (il
3902capitolo 25).
3903
3904Accesso dal menù:    /Modello/Modelli non lineari/NLS - Minimi quadrati non lineari
3905
3906# normtest Tests
3907
3908Argomento:  series
3909Opzioni:    --dhansen (test di Doornik-Hansen, utilizzato di default)
3910            --swilk (test di Shapiro-Wilk)
3911            --lillie (test di Lilliefors)
3912            --jbera (test di Jarque-Bera)
3913            --all (esegue tutti i test)
3914            --quiet (non mostra i dettagli dei risultati)
3915
3916Conduce un test di normalità per la serie specificata. Il tipo di test
3917eseguito è determinato dalle opzioni del comando (se non ne viene usata
3918alcuna, viene eseguito il test di Doornik-Hansen). Nota: si raccomanda
3919l'utilizzo dei test di Doornik-Hansen e Shapiro-Wilk rispetto agli altri
3920test per via delle loro migliori proprietà in campioni relativamente
3921piccoli.
3922
3923La statistica test e il suo p-value possono essere recuperati usando gli
3924accessori "$test" e "$pvalue". Se si usa l'opzione --all, i risultati
3925richiamati saranno quelli del test di Doornik-Hansen.
3926
3927# nulldata Dataset
3928
3929Argomento:  lunghezza_serie
3930Opzione:    --preserve (preserva le matrici)
3931Esempio:    nulldata 500
3932
3933Crea un dataset "vuoto", che contiene solo una costante e una variabile
3934indice, con periodicità 1 e il numero indicato di osservazioni. Ad esempio,
3935è possibile creare un dataset a scopo di simulazione usando alcuni comandi
3936come "uniform()" e "normal()") i quali genereranno serie di dati ex nihilo
3937che dovranno poi venir riempiti con dati. Questo comando può risultare
3938particolarmente comodo se utilizzato assieme a "loop". Si veda anche
3939l'opzione "seed" del comando "set".
3940
3941Per impostazione predefinita, questo comando cancella tutti i dati presenti
3942nell'ambiente di lavoro di gretl. Usando l'opzione --preserve, verranno
3943mantenute tutte le matrici attualmente definite.
3944
3945Accesso dal menù:    /File/Nuovo dataset
3946
3947# ols Estimation
3948
3949Argomenti:  variabile-dipendente variabili-indipendenti
3950Opzioni:    --vcv (mostra la matrice di covarianza)
3951            --robust (errori standard robusti)
3952            --cluster=clustvar (errori standard clusterizzati)
3953            --jackknife (vedi sotto)
3954            --simple-print (non mostra le statistiche ausiliarie)
3955            --quiet (non mostra i risultati)
3956            --anova (stampa una tabella ANOVA)
3957            --no-df-corr (sopprime la correzione per i gradi di libertà)
3958            --print-final (si veda sotto)
3959Esempi:     ols 1 0 2 4 6 7
3960            ols y 0 x1 x2 x3 --vcv
3961            ols y 0 x1 x2 x3 --quiet
3962
3963Calcola le stime minimi quadrati ordinari (OLS: Ordinary Least Squares)
3964usando la variabile-dipendente e la lista di variabili-indipendenti, che
3965possono essere specificate per nome o numero. Il termine costante può
3966essere indicato usando il numero 0.
3967
3968Oltre alle stime dei coefficienti e agli errori standard, il programma
3969mostra i p-value per le statistiche t (a due code) e F. Un p-value inferiore
3970a 0.01 indica significatività al livello dell'1 per cento ed è denotato
3971con ***. ** indica invece la significatività tra l'1 e il 5 per cento,
3972mentre * indica un livello di significatività tra il 5 e il 10 per cento.
3973Vengono mostrate anche le statistiche di selezione del modello (il criterio
3974di informazione di Akaike, AIC, e il criterio di informazione bayesiana di
3975Schwarz, BIC). La formula usata per AIC è descritta in Akaike (1974), ossia
3976meno due volte la log-verosimiglianza massimizzata più il doppio del numero
3977di parametri stimati.
3978
3979Usando l'opzione --no-df-corr la correzione per i gradi di libertà non
3980viene applicata nel calcolo della varianza stimata dell'errore (e quindi
3981anche dell'errore standard delle stime dei parametri).
3982
3983L'opzione --print-final è utilizzabile solo nel contesto di un "loop".
3984L'effetto è quello di eseguire la regressione in modo silenzioso per tutte
3985le iterazioni del loop tranne l'ultima. Si veda la guida all'uso di gretl
3986(il capitolo 13) per i dettagli.
3987
3988Varie variabili interne possono essere recuperate per futuri scopi di stima.
3989Ad esempio:
3990
3991      series uh = $uhat
3992
3993dove così facendo si salvano i residui stimati dal modello sotto il nome
3994uh. Per ulteriori riferimenti si guardi anche alla sezione "accessori" di
3995gretl function.
3996
3997La formula utilizzata nella versione --HC per generare errori standard
3998robusti con l'opzione --robust può essere calibrata attraverso il comando
3999"set". L'opzione --jackknife ha l'effetto di selezionare la versione 3a
4000della matrice HC. L'opzione --cluster annulla la procedura di selezione
4001della versione della matrice HC in quanto produce errori standard robusti in
4002seguito all'operazione di raggruppamento delle singole osservazioni di
4003clustvar. Si veda anche la guida all'uso di gretl (il capitolo 22) per
4004maggiori dettagli.
4005
4006Accesso dal menù:    /Modello/OLS - Minimi quadrati ordinari
4007Accesso alternativo: Pulsante Beta-hat sulla barra degli strumenti
4008
4009# omit Tests
4010
4011Argomento:  lista-variabili
4012Opzioni:    --test-only (non rimpiazza il modello corrente)
4013            --chi-square (restituisce un test chi-quadro di Wald)
4014            --quiet (stampa solo i risultati del test)
4015            --silent (non stampa nulla)
4016            --vcv (stampa la matrice di varianze-covarianze del modello
4017	ridotto)
4018            --auto=alpha (eliminazione sequenziale, si veda oltre)
4019            --inst (omette come strumento, solo per TSLS)
4020            --both (omette come regressore e come strumento, solo per TSLS)
4021Esempi:     omit 5 7 9
4022            omit seasonals --quiet
4023            omit --auto
4024            omit --auto=0.05
4025            Vedi anche restrict.inp, sw_ch12.inp, sw_ch14.inp
4026
4027Questo comando deve seguire un comando di stima. Nella sua forma principale,
4028questo comando calcola un test di Wald per la significatività congiunta
4029delle variabili presenti nella lista variabili, che deve essere un
4030sottoinsieme delle variabili indipendenti presenti nell'ultimo modello
4031stimato. I risultati possono poi venire richiamati attraverso l'uso degli
4032accessori "$test" e "$pvalue".
4033
4034A meno che non vengano rimossi tutti i regressori, il modello ristretto che
4035viene stimato va a rimpiazzare il modello originale come "modello corrente"
4036con lo scopo, ad esempio, di richiamare i residui come $uhat o di eseguire
4037dei test. Questo comportamento può essere soppresso attraverso l'uso
4038dell'opzione --test-only.
4039
4040Per default, viene usata la forma F del test di Wald; se invece si vuole un
4041test chi-quadro, si usi l'opzione --chi-square.
4042
4043Se il modello ristretto viene sia stimato che stampato l'utilizzo
4044dell'opzione --vcv ha l'effetto di stampare anche la matrice di covarianze,
4045altrimenti se non usata l'opzione viene ignorata.
4046
4047Alternativamente, se l'opzione --auto è abilitata, l'eliminazione
4048sequenziale viene eseguita in questo modo: ad ogni step le variabili con
4049p-value più alto vengono omesse sicchè tutte quelle con p-value maggiore
4050di un certo cutoff vengono eliminate. Il cutoff di default è impostato al
405110 per cento (considerando sia la coda destra che sinistra); esso, tuttavia,
4052può venire modificato utilizzando l'argomento "=" ed un valore compreso tra
40530 e 1 (senza spazio in mezzo), come nel quarto esempio descritto sopra. Se
4054viene data una lista-variabili questo processo sarà limitato alle sole
4055variabili presenti nella lista, altrimenti tutte le variabili saranno
4056coinvolte e considerate come possibili candidate all'omissione. Si noti che
4057le opzioni --auto e --test-only sono incompatibili.
4058
4059Accesso dal menù:    Finestra del modello, /Test/OMIT - Ometti variabili
4060
4061# open Dataset
4062
4063Argomento:  file-dati
4064Opzioni:    --quiet (non stampare la lista di serie)
4065            --preserve (mantieni in memoria le variabili non-serie)
4066            --select=selezione (leggi solo le serie specificate, vedi sotto)
4067            --frompkg=pkgname (vedi sotto)
4068            --all-cols (vedi sotto)
4069            --www (usa un database sul server di gretl)
4070            Si veda oltre per le opzioni specifiche per i fogli elettronici
4071Esempi:     open data4-1
4072            open voter.dta
4073            open fedbog --www
4074
4075Apre un file di dati o un database (vedi la guida all'uso di gretl (il
4076capitolo 4) per una spiegazione sulla differenza fra le due possibilità).
4077L'effetto del comando è abbastanza diverso nei due casi: quando si apre un
4078file di dati, il suo contenuto viene letto in memoria, sostituendo i dati
4079eventualmente già presenti. Per aggiungere dati al dataset aperto, vedi
4080"append" o, per maggiore flessibilità, "join". Se invece viene aperto un
4081database, nessun dato viene letto immediatamente. Il comando si limita a
4082impostare la fonte per i susseguenti comandi "data", usati per effettuare
4083l'importazione vera e propria. Si veda "Apertura di un database" più sotto.
4084
4085Se non si specifica un percorso completo, il programma cercherà
4086automaticamente il file in alcuni percorsi predefiniti, a partire dal valore
4087attuale di "workdir". Se non si specifica un'estensione per il file, come
4088nel primo degli esempi, gretl assume che si tratti di un file di dati
4089standard, con estensione .gdt. A seconda del nome del file e di alcune sue
4090caratteristiche, gretl cerca di indovinare il formato dei dati (standard,
4091testo semplice, CSV, MS Excel, Stata, SPSS, ecc.).
4092
4093Usando l'opzione --frompkg, gretl cercherà il file di dati specificato
4094nella sottodirectory associata al pacchetto pkgname.
4095
4096Se l'argomento nome-file è un URI che inizia con http:// o https://, allora
4097gretl cercherà di scaricare il file dalla rete prima di aprirlo.
4098
4099Come impostazione predefinita, l'apertura di un nuovo file di dati annulla
4100la sessione corrente, il che implica la perdita di tutte le variabili di
4101tipo matrice, scalare e stringa. Se si vuole preservare tali variabili (con
4102l'eccezione delle serie, che sono necessariamente eliminate), va usata
4103l'opzione --preserve.
4104
4105Fogli elettronici
4106
4107Quando si apre un file di un foglio elettronico (Gnumeric, Open Document o
4108XLS), è possibile fornire fino a tre parametri aggiuntivi, oltre al nome
4109del file. Per prima cosa, è possibile selezionare un particolare foglio di
4110lavoro all'interno del file, indicando il suo numero con la sintassi
4111--sheet=2, oppure indicando il suo nome tra virgolette doppie, usando la
4112sintassi --sheet="MacroData". L'impostazione predefinita consiste nel
4113leggere il primo foglio di lavoro del file. È anche possibile specificare
4114la riga/colonna da cui iniziare a leggere, usando la sintassi
4115
4116      --coloffset=3 --rowoffset=2
4117
4118che indica a gretl di ignorare le prime 3 colonne e le prime 2 righe.
4119L'impostazione predefinita consiste nel leggere tutte le celle del foglio, a
4120partire dalla prima in alto a sinistra.
4121
4122File di testo con delimitatori
4123
4124Con file di testo, gretl in genere si aspetta di trovare le colonne di dati
4125separate da un qualche carattere standard; in genere, la virgola, il tab, lo
4126spazio o il punto e virgola (copyright Totò e Peppino). Come impostazione
4127base, gretl cerca di trovare nella prima colonna etichette identificative o
4128date, se l'intestazione è vuota o contiene qualcosa che verosimilmente va
4129interpretato in tal modo, come "year", "date" o "obs". Questa euristica
4130sulla prima colonna può essere disattivata attraverso l'opzione --all-cols
4131option.
4132
4133File di testo in formato fisso
4134
4135Tuttavia, c'è anche modo di leggere dati in "formato fisso", dove non ci
4136sono delimitatori ma esiste una specifica del formato; ad esempio, "la
4137variabile k occupa 8 caratteri a partire dal 24esimo". Per leggere file
4138siffatti, va aggiunta la stringa --fixed-cols=colspec, dove colspec si
4139compone di interi separati da virgole. Essi vengono interpretati a coppie,
4140in cui il primo elemento denota la colonna di partenza, misurata in byte
4141dall'inizio della riga (dove 1 indica il primo byte); il secondo elemento
4142indica quanti byte vanno letti per quel dato campo. Facciamo un esempio: il
4143comando
4144
4145      open fixed.txt --fixed-cols=1,6,20,3
4146
4147farà sì che vengano letti 6 byte a partire dalla colonna 1 per la prima
4148variabile; per la seconda, 3 byte a partire dalla colonna 20. Linee vuote, o
4149che iniziano con #, vengono ignorate; per tutte le altre si applica la
4150regola del formato, e se viene trovato qualcosa non interpretabile come
4151numero, viene segnalato un errore. Se i dati sono letti senza problemi, le
4152variabili avranno per nome v1, v2, ecc. Sta all'utente dare alle variabili
4153nomi e descrizioni informative tramite i comandi "rename" e/o "setinfo".
4154
4155Di default, quando si importa un file contenente delle stringhe di valori
4156una casella di testo si aprirà mostrando i contenuti del file
4157string_table.txt, il quale contiene una legenda sull'associazione fra le
4158stringhe ed i valori numerici corrispondenti. Per far sì che ciò non
4159accada, si usi l'opzione --quiet.
4160
4161Apertura di una selezione
4162
4163In generale, l'uso di open con un file di dati (al contrario di ciò che
4164accade con un database) implica la lettura di tutte le serie che esso
4165contiene. Tuttavia, per dati in formato gretl nativo (gdt e gdtb) è
4166possibile indicare un sottinsieme delle serie da leggere. L'opzione da usare
4167a questo scopo è --select, che richiede un argomento. Quest'ultimo può
4168prendere tre forme: il nome di una serie singola, una lista di nomi,
4169comppresa fra virgolette doppie e separati da spazi, o un array di stringhe
4170preesistente. Ad esempio:
4171
4172      # serie singola
4173      open somefile.gdt --select=x1
4174      # più serie
4175      open somefile.gdt --select="x1 x5 x27"
4176      # metodo alternativo
4177      strings Sel = defarray("x1", "x5", "x27")
4178      open somefile.gdt --select=Sel
4179
4180Apertura di un database
4181
4182Come si diceva sopra, questo comando può essere usato anche per aprire un
4183database (gretl, RATS 4.0 o PcGive) per la lettura. In questo caso,
4184dev'essere seguito dal comando "data" per estrarre una particolare serie dal
4185database.
4186
4187Sono ammessi anche altri casi: in primo luogo, se si usa l'opzione www, il
4188programma cercherà di accedere al database specificato sul server di gretl
4189-- ad esempio il database "Federal Reserve interest rates" nel terzo degli
4190esempi visti sopra. Un altra possibilità è quella di usare il comando
4191nella forma "open dbnomics", che userà DB.NOMICS come fonte dei dati; su
4192questo argomento, vedi dbnomics per gretl. Infine, se viene date l'opzione
4193--odbc gretl prenderà i dati da un database ODBC. Per spiegazioni
4194dettagliate, si veda la guida all'uso di gretl (il capitolo 42).
4195
4196Accesso dal menù:    /File/Apri dati
4197Accesso alternativo: Trascinare un file di dati in gretl (MS Windows o Gnome)
4198
4199# orthdev Transformations
4200
4201Argomento:  lista-variabili
4202
4203Utilizzabile solo con dati panel. Per ognuna delle variabili nella
4204lista-variabili viene generata una serie di deviazioni ortogonali in avanti,
4205salvata col nome della variabile prefissata da o_. Quindi, "orthdev x y"
4206crea le nuove variabili o_x e o_y.
4207
4208I valori sono salvati con un periodo di ritardo rispetto alla loro
4209collocazione temporale (ossia, o_x all'osservazione t contiene la deviazione
4210che, in senso stretto, corrisponde al periodo t - 1). Questo comportamento
4211è coerente con quello delle differenze prime: viene persa la prima
4212osservazione di ogni serie, non l'ultima.
4213
4214# outfile Printing
4215
4216Varianti:   outfile nomefile
4217            outfile --buffer=varstr
4218            outfile --tempfile=varstr
4219Opzioni:    --append (aggiunge al file)
4220            --quiet (vedi sotto)
4221            --buffer (vedi sotto)
4222            --tempfile (vedi sotto)
4223Esempi:     outfile regress.txt
4224            end outfile
4225
4226Il comando outfile inizia un blocco in cui tutto l'output stampato viene
4227deviato a un file o a un buffer (o, volendo, semplicemnte buttato via). Tale
4228blocco è chiuso dal comando "end outfile", dopodiché l'output viene
4229mandato di nuovo allo stream predefinito.
4230
4231Reindirizzamento a un file
4232
4233La prima variante manda l'output a un file il cui nome è dato come
4234argomento nomefile. Di default, viene creato un file nuovo (sovrascrivendo
4235il file dello stesso nome, se esiste). L'output verrà scritto nella
4236corrente "workdir", a meno che il nomefile non contenga un percorso
4237completo. Se invece di sovrascrivere si vuole aggiungere in coda, va usata
4238l'opzione --append.
4239
4240Tre varianti speciali del comando sono disponibili. Se si utilizza la parola
4241chiave null al posto del vero nome del file l'effetto prodotto sarà quello
4242di sopprimere tutti gli output fino alla istruzione successiva. Se una delle
4243due parole chiave, tra stdout o stderr, è data al posto dello standard nome
4244di file l'effetto che si produrrà sarà quello di reindirizzare l'output
4245sull'output standard o sullo standard errors.
4246
4247Quello che segue è un semplice esempio, in cui l'ouput di una regressione
4248viene scritto su un file.
4249
4250    open data4-10
4251    outfile regress.txt
4252    ols ENROLL 0 CATHOL INCOME COLLEGE
4253    end outfile
4254
4255Reindirizzamento a un buffer
4256
4257L'opzione --buffer serve a mandare l'ouput a una variabile stringa. Il
4258parametro per questa opzione dev'essere il nome di una variabile stringa
4259preesistente, il cuni contenuto sarà sovrascritto. Quello che segue è lo
4260stesso esempio fatto appena sopra, a parte che l'output va ad una stringa.
4261In questo caso stampando model_out si vedrà l'output reindirizzato.
4262
4263    open data4-10
4264    string model_out = ""
4265    outfile --buffer=model_out
4266    ols ENROLL 0 CATHOL INCOME COLLEGE
4267    end outfile
4268    print model_out
4269
4270Reindirizzamento a un file temporaneo
4271
4272L'opzione --tempfile serve a mandare l'output a un file temporaneo, con un
4273nome costruito automaticamente per assicurarne l'unicità, nella directory
4274"di servizio". Così come nel caso del buffer, il parametro dell'opzione
4275dev'essere il nome di una variabile stringa, che viene riempita col nome del
4276file temporaneo. Nota bene: i file scritti sulla directory di servizio
4277vengono cancellati quando si esce dal programma: non usate questa forma se
4278volete che il file sia conservato.
4279
4280Ripetiamo l'esempio fatto sopra, con un paio di linee in più per illustrare
4281il punto che varstr dice dove l'output è andato, e volendo lo si può
4282leggere usando la funzione "readfile".
4283
4284    open data4-10
4285    string mytemp
4286    outfile --tempfile=mytemp
4287    ols ENROLL 0 CATHOL INCOME COLLEGE
4288    end outfile
4289    printf "Output went to %s\n", mytemp
4290    printf "The output was:\n%s\n", readfile(mytemp)
4291
4292L'opzione quiet
4293
4294L'effetto dell'opzione --quiet è quello di disattivare la stampa dei
4295comandi e dei messaggi ausiliari nel frattempo che l'output viene
4296reindirizzato. È l'equivalente di fare:
4297
4298    set echo off
4299    set messages off
4300
4301se non per il fatto che al termine della ridirezione i valori originali di
4302echo e messages vengono ripristinati. Quest'opzione è disponibile in tutti
4303i casi.
4304
4305Livelli di ridirezione
4306
4307In un dato punto del codice, ci può essere solo un file aperto con questa
4308tecnica; quindi, le chiamate a questo comando non possono essere annidate.
4309Ciononostante, questo comando è consentito nelle funzioni scritte
4310dall'utente (purché il file di output venga chiuso nella stessa funzione),
4311cosicché l'output può essere ridiretto temporaneamente e poi riassegnato
4312al file di output originale. Ad esempio, il codice
4313
4314    function void f (string s)
4315        outfile inner.txt
4316	    print s
4317        end outfile
4318    end function
4319
4320    outfile outer.txt --quiet
4321    print "Fuori"
4322    f("Dentro")
4323    print "Ancora fuori"
4324    end outfile
4325
4326produrrà un file di nome "outer.txt" contenente le due linee
4327
4328    Fuori
4329    Ancora fuori
4330
4331e un file di nome "inner.txt" contenente la linea
4332
4333    Dentro
4334
4335# panel Estimation
4336
4337Argomenti:  variabile dipendente variabili indipendenti
4338Opzioni:    --vcv (mostra la matrice di covarianza)
4339            --fixed-effects (stima con effetti di gruppo fissi)
4340            --random-effects (effetti casuali o modello GLS)
4341            --nerlove (usa la transformazione di Nerlove)
4342            --pooled (stima un modello OLS pooled)
4343            --between (stima il modello tra i gruppi)
4344            --robust (errori standard robusti, si veda oltre)
4345            --time-dummies (include variabili dummy temporali)
4346            --unit-weights (minimi quadrati ponderati)
4347            --iterate (stima iterativa)
4348            --matrix-diff (esegue un test di Hausman con differenza fra
4349	matrici)
4350            --unbalanced=metodo (solamente per random effects, si veda oltre)
4351            --quiet (mostra meno risultati)
4352            --verbose (mostra più risultati)
4353Esempi:     penngrow.inp
4354
4355Stima un modello panel, per impostazione predefinita usando lo stimatore a
4356effetti fissi; la stima è implementata sottraendo le medie di gruppo o
4357delle unità dai dati originali.
4358
4359Se l'opzione --random-effects è data allora verrano eseguite le stime del
4360modello ad effetti random, utilizzando di default il metodo descritto da
4361Swamy e Arora (1972). In questo caso solamente l'opzione --matrix-diff
4362consente l'utilizzo forzato del metodo della differenza fra matrici
4363(anziché il metodo della regressione), in modo tale da consentire
4364l'utilizzo del test di Hausman per la consistenza dei stimatori ad effetti
4365random. Altra specifica allo stimatore ad effetti random è data
4366dall'utilizzo del comando --nerlove, il quale utilizza il metodo di Nerlove
4367(1971) invece del metodo di Swamy e Arora.
4368
4369In alternativa, con l'opzione --unit-weights, il modello viene stimato con i
4370minimi quadrati ponderati, con i pesi costruiti a partire dalla varianza
4371residua per le rispettive unità cross section nel campione. Solo in questo
4372caso, è possibile usare l'opzione --iterate per produrre stime iterative:
4373nel caso di convergenza, le stime sono di massima verosimiglianza.
4374
4375Come ulteriore alternativa, se si usa l'opzione --between, viene stimato il
4376modello tra i gruppi, ossia una regressione OLS usando le medie dei gruppi.
4377
4378Il metodo predefinito per calcolare errori standard robusti in modelli con
4379dati panel è descritto dallo stimatore HAC di Arellano, ma può essere
4380utilizzato anche lo stimatore di Beck-Katz per "panel standard errors
4381corretti" attraverso il comando set pcse on. Quando è specificata l'opzione
4382--robust il test F viene eseguito sullo stimatore ad effetti fissi
4383utilizzando il metodo robusto di Welch (1951).
4384
4385L'opzione --unbalanced è disponibile solo per modelli random effects: può
4386essere utilizzato per scegliere un metodo ANOVA da usare con panel non
4387bilanciati. Per default, gretl utilizza il metodo di Swamy-Arora come per i
4388panel bilanciati, eccezion fatta per l'utilizzo di una media armonica delle
4389singole lunghezze temporali al posto di una T comune. Con quest'opzione è
4390possibile specificare sia bc, per usare il metodo di Baltagi e Chang (1994),
4391o stata, per emulare l'opzione sa per il comando xtreg in Stata.
4392
4393Per maggiori dettagli sulla stima panel, si veda la guida all'uso di gretl
4394(il capitolo 23).
4395
4396Accesso dal menù:    /Modello/Panel
4397
4398# panplot Graphs
4399
4400Argomento:  variabile
4401Opzioni:    --means (medie per gruppo attraverso il tempo)
4402            --overlay (unità mescolate, N <= 130)
4403            --sequence (unità in sequenza, N <= 130)
4404            --grid (unità su griglia, N <= 16)
4405            --stack (unità sovrapposte verticalmente, N <= 6)
4406            --boxplots (boxplot per unità, in sequenza, N <= 150)
4407            --boxplot (boxplot per tutte le unità)
4408            --output=nomefile (ridireziona l'output)
4409Esempi:     panplot x --overlay
4410            panplot x --means --output=display
4411
4412Comando grafico specifico per dati panel: la serie variabile viene graficata
4413a seconda delle opzioni specificate.
4414
4415A parte le opzioni --means e --boxplot quel che viene graficato è la
4416variazione della serie sia sotto il profilo longitudinale che quello
4417temporale. Questo tipo di grafici è limitato dal numero di unità nel
4418dataset in uso. Ad esempio, l'opzione --overlay, che mostra una serie
4419storica per ciascuna unità, è disponibile soltanto se il numero di unità
4420N è minore o uguale a 130. (In caso contrario, il grafico diventa troppo
4421denso per essere informativo.) Se un dataset è troppo grande da permettere
4422l'applicazione del comando, va selezionato preventivamente un sottocampione
4423di unità, come ad esempio
4424
4425      smpl 1 100 --unit
4426      panplot x --overlay
4427      smpl full
4428
4429L'opzione --output=filename è usata per controllare forma e destinazione
4430dell'output; per dettagli, vedi il comando "gnuplot".
4431
4432Accesso alternativo: Main window pop-up menu (single selection)
4433
4434# panspec Tests
4435
4436Opzioni:    --nerlove (usa il metodo di Nervole per effetti casuali)
4437            --matrix_diff (usa il metodo di differenze tra matrici per il test di Hausman)
4438
4439Questo test è disponibile solo dopo aver stimato un modello OLS su dati
4440panel (si veda anche "setobs"). Testa il semplice modello "pooled" (con
4441tutte le osservazioni mescolate indistintamente) contro le principali
4442alternative: il modello a effetti fissi e quello a effetti casuali.
4443
4444Il modello a effetti fissi permette all'intercetta della regressione di
4445variare per ogni unità cross section. Viene eseguito un test F per
4446l'ipotesi nulla che le intercette non differiscano tra loro. Il modello a
4447effetti casuali scompone la varianza dei residui in due parti: una specifica
4448alle unità cross section e una specifica all'osservazione particolare (la
4449stima può essere eseguita solo se il numero delle unità cross section nel
4450dataset è maggiore del numero dei parametri da stimare). La statistica LM
4451di Breusch-Pagan testa l'ipotesi nulla che il modello pooled OLS sia
4452adeguato contro l'alternativo modello a effetti casuali.
4453
4454Può accadere che il modello pooled OLS sia rifiutato nei confronti di
4455entrambe le alternative, a effetti fissi o casuali. A patto che gli errori
4456specifici di unità o di gruppo siano non correlati con le variabili
4457indipendenti, lo stimatore a effetti casuali è più efficiente dello
4458stimatore a effetti fissi; nel caso contrario lo stimatore a effetti casuali
4459non è consistente e deve essergli preferito lo stimatore a effetti fissi.
4460L'ipotesi nulla per il test di Hausman è che l'errore specifico di gruppo
4461non sia correlato con le variabili indipendenti (e quindi che il modello a
4462effetti casuali sia preferibile). Un basso p-value per questo test
4463suggerisce di rifiutare il modello a effetti casuali in favore del modello a
4464effetti fissi.
4465
4466Le due opzioni per questo comando riguardano il modello ad effetti casuali.
4467Di default viene utilizzato il metodo di Swamy e Arora ed il test di Hausman
4468viene calcolato usando il metodo di regressione. Le opzioni di cui sopra
4469consentono di abilitare, in alternativa, il metodo di Nerlove per effetti
4470casuali e/o l'approccio di differenza tra matrici per il calcolo del test di
4471Hausman.
4472
4473Accesso dal menù:    Finestra del modello, /Test/HAUSMAN - Diagnosi panel
4474
4475# pca Statistics
4476
4477Argomento:  lista-variabili
4478Opzioni:    --covariance (usa la matrice di covarianza)
4479            --save[=n] (salva le componenti principali)
4480            --save-all (salva tutte le componenti)
4481            --quiet (non stampa i risultati)
4482
4483Analisi delle Componenti Principali. A meno che l'opzione --quiet non sia
4484presente, stampa gli autovalori associati alla matrice di correlazione (o
4485matrice di covarianze se è specificata l'opzione --covariance) per le
4486variabili inserite nella lista-variabili, con allegate proporzioni della
4487varianza totale spiegata dalle singole compenenti. Stampa anche i
4488corrispondenti autovettori, o "pesi delle componenti".
4489
4490Se si dà l'opzione --save-all allora tutte le componenti verranno salvate
4491nel dataset come variabili denominate PC1, PC2 e così via. Queste variabili
4492artificiali sono definite come la la combinazione lineare delle X_i
4493standardizzate (dove X_i è l'i-esima variabile della lista-variabili) con i
4494pesi.
4495
4496Se si dà l'opzione --save senza un parametro specificato le componenti con
4497autovalori maggiori della media (il che significa maggiori di 1.0 se
4498l'analisi è basata sulla matrice di correlazione) sono salvati nel dataset
4499come nuove variabili, come descritto sopra. Se invece si dà un valore per
4500n, con quest'opzione allora le n più importanti componenti vengono salvate.
4501
4502Si veda anche la function "princomp".
4503
4504Accesso dal menù:    /Visualizza/Componenti principali
4505Accesso alternativo: Pop-up nella finestra principale (selezione multipla)
4506
4507# pergm Statistics
4508
4509Argomenti:  nome-variabile [ banda ]
4510Opzioni:    --bartlett (usa la finestra di Bartlett)
4511            --log (usa una scala logaritmica)
4512            --radians (mostra la frequenza in radianti)
4513            --degrees (mostra la frequenza in gradi)
4514            --plot=modalità o nome del file (si veda oltre)
4515
4516Calcola e mostra (graficamente se non si è in modalità batch) lo spettro
4517della variabile specificata. Per impostazione predefinita viene mostrato il
4518periodogramma nel campione, mentre usando l'opzione --bartlett, lo spettro
4519viene stimato usando una finestra di Bartlett per i ritardi (si veda ad
4520esempio Econometric Analysis di Greene per una discussione su questo
4521argomento). L'ampiezza predefinita della finestra di Bartlett è pari a due
4522volte la radice quadrata dell'ampiezza campionaria, ma questo valore può
4523essere impostato manualmente usando il parametro banda, fino a un massimo
4524pari a metà dell'ampiezza campionaria.
4525
4526Usando l'opzione --log, lo spettro viene rappresentato su una scala
4527logaritmica.
4528
4529Le due opzioni (mutualmente escludibili) --radians e --degrees condizionano
4530la tipologia dell'asse di frequenza quando il periodogramma viene
4531rappresentato. Da impostazione predefinita, la frequenza è scalata per il
4532numero di osservazioni nel campione; tuttavia, queste opzioni comportano che
4533l'asse di frequenza possa venire ridenominato da 0 a pi radianti o da 0 a
4534180degrees, rispettivamente.
4535
4536Di default, se il programma non è in modalità batch, viene mostrato il
4537periodogramma a video. Questo comportamento è modificabile attraverso
4538l'opzione --plot. I parametri accettabili nel caso sono none (sopprime il
4539grafico); display (per mostrare a video il grafico anche se il programma è
4540in batch mode); oppure un nome di file. L'effetto di dare un nome di file è
4541quello descritto per l'opzione --output del comando "gnuplot".
4542
4543Quando viene mostrato il periodogramma del campione, vengono mostrati anche
4544due test per l'integrazione frazionale ("memoria lunga") della serie, ossia
4545il test di Geweke e Porter-Hudak (GPH), e lo stimatore locale di Whittle.
4546L'ipotesi nulla in entrambi i casi è che l'ordine di integrazione sia zero.
4547Per impostazione predefinita, l'ordine per questi test è il valore minore
4548tra T/2 e T^0.6; anche questo valore può essere modificato con il parametro
4549di banda.
4550
4551Accesso dal menù:    /Variabile/Spettro
4552Accesso alternativo: Menù pop-up nella finestra principale (selezione singola)
4553
4554# pkg Utilities
4555
4556Argomenti:  azione nomepacchetto
4557Opzioni:    --local (installa da file in locale)
4558            --quiet (vedi sotto)
4559            --verbose (vedi sotto)
4560Esempi:     pkg install armax
4561            pkg install /path/to/myfile.gfn --local
4562            pkg query ghosts
4563            pkg unload armax
4564
4565Comando per installare, rimuovere dalla memoria e disinstallare pacchetti di
4566funzioni (file gfn o zip). Il parametro azione deve essere uno fra install,
4567query, unload, remove o index.
4568
4569install: Nella sua forma più semplice, senza opzioni e con l'argomento
4570pkgname che corrisponde al nome "semplice" di un pacchetto (come nel primo
4571esempio), il pacchetto stesso verrà scaricato dal server di gretl (a meno
4572che nomepacchetto non cominci con http://) e installato in locale. In questo
4573caso, indicare l'estensione è superfluo. Se viene data l'opzione --local,
4574l'argomento nomepacchetto deve essere il percorso completo di un file di
4575pacchetto sulla macchina locale, completo di estensione (.gfn o .zip).
4576L'azione conseguente al comando è di copiarlo (se gfn), o espanderlo (se
4577zip) nel posto giusto, ossia dove il comando "include" sia in grado poi di
4578trovarlo.
4579
4580query: L'effetto di default effect è di stampare alcune informazioni di
4581base sul pacchetto (autore, versione, ecc.). Selezionando l'opzione --quiet
4582però non viene stampato nulla; le informazioni, invece, vengono salvate in
4583un bundle, accessibile via "$result".
4584
4585unload: l'argomento pkgname deve essere dato in forma semplice, senza
4586percorso o suffisso (come nell'ultimo esempio). L'effetto è scaricare il
4587pacchetto dalla memoria e rimuoverlo, anche dal menu GUI a cui sia
4588eventualmente attaccato.
4589
4590remove: come unload, ma in aggiunta cancella anche dal disco i file di
4591pacchetto.
4592
4593index: è un caso particolare, in cui il nome del pacchetto deve essere
4594sostituito dalla stringa "addons": l'effetto è quello di aggiornare
4595l'indice dei pacchetti standard, anche noti come "addons". Quest'operazione
4596viene svolta in automatico di tanto in tanto, ma in certi casi la si
4597potrebbe voler fare a mano. in tal caso, l'opzione --verbose produce un
4598report di ciò che viene cercato e trovato. Ad esempio:
4599
4600      pkg index addons --verbose
4601
4602Accesso dal menù:    /Strumenti/Pacchetti/Sul server
4603
4604# plot Graphs
4605
4606Argomento:  data
4607Opzioni:    --with-lines[=varspec] (usa linee, non punto)
4608            --with-lp[=varspec] (usa linee e punti)
4609            --with-impulses[=varspec] (usa linee verticali)
4610            --with-steps[=varspec] (usa linee verticali ed orizzontali)
4611            --time-series (mostra il grafico rispetto al tempo)
4612            --single-yaxis (forza all'uso di un solo asse delle ordinate)
4613            --dummy (si veda oltre)
4614            --fit=fitspec (si veda oltre)
4615            --band=bandspec (si veda oltre)
4616            --band-style=stile (si veda oltre)
4617            --output=nomefile (reindirizza l'output ad un file specifico)
4618Esempi:     nile.inp
4619
4620Il blocco plot offre un'alternativa al comando "gnuplot", che potrebbe
4621essere più efficace per produrre grafici particolarmente elaborati (con
4622diverse opzioni e/o comandi gnuplot inseriti). Oltre alla spiegazione
4623seguente, si possono trovare altri esempi consultando la guida all'uso di
4624gretl (il capitolo 6).
4625
4626Un blocco plot comincia col comando plot seguito dall'argomento data, che
4627indica i dati da usare: quest'ultimo dev'essere il nome di una lista, una
4628matrice, o una serie singola. Se l'argomento data non viene specificato
4629allora il blocco deve obbligatoriamente contere almeno una funzione
4630analitica da graficare; queste funzioni posso essere scritte tramite righe
4631literal o printf (si veda oltre).
4632
4633Se viene fornita una lista o una matrice, l'ultimo elemento (se lista) o
4634l'ultima colonna (se matrice) è preso come asse delle ascisse e le altre
4635come ordinata, a meno che non venga usata l'opzione --time-series, nel qual
4636caso tutte le variabili vanno in ordinata.
4637
4638L'opzione di fornire il nome di una singola serie è ristretta solo ai dati
4639temporali, nel qual caso si assume che si voglia ricevere un grafico
4640time-series; altrimenti verrà riportato un errore.
4641
4642La linea iniziale può essere dotata del prefisso "nome <-" per salvare il
4643grafico come icona nel programma GUI. Il blocco si chiude con end plot.
4644
4645All'interno del blocco si possono avere zero o più linee di questo tipo,
4646identificate da una delle seguenti parole chiave:
4647
4648  option: specifica una singola opzione.
4649
4650  options: specifica più di una opzione per una singola riga, sono separate
4651  da spazi.
4652
4653  literal: un comando da passare a gnuplot senza modifiche.
4654
4655  printf: una comando printf il cui risultato verrà passato a gnuplot senza
4656  modifiche.
4657
4658Si noti che, quando si specifica un'opzione attraverso i comandi option o
4659options, il solito -- va omesso. Per ulteriori dettagli sugli effetti delle
4660varie opzioni si veda "gnuplot" (ma vedi anche sotto su alcune specificità
4661dell'opzione --band nel contesto plot).
4662
4663L'uso del blocco plot è illustrato al meglio tramite un esempio:
4664
4665      string title = "My title"
4666      string xname = "My x-variable"
4667      plot plotmat
4668      options with-lines fit=none
4669      literal set linetype 3 lc rgb "#0000ff"
4670      literal set nokey
4671      printf "set title \"%s\"", title
4672      printf "set xlabel \"%s\"", xname
4673      end plot --output=display
4674
4675Questo esempio ipotizza che plotmat sia un nome di una matrice avente almeno
46762 colonne (o di una lista avente almeno 2 membri). Si noti che è
4677considerata buona pratica quella di utilizzare l'opzione --output
4678(solamente) nell'ultima linea del blocco.
4679
4680Disegnare una banda usando una matrice
4681
4682Le opzioni --band e --band-style funzionano principalmente come descritto
4683nell'help del comando gnuplot, con le seguenti eccezioni: quando i dati sono
4684passati in forma di matrice, il primo parametro per --band deve essere dato
4685come il nome di una matrice con 2 colonne (contenenti, rispettivamente, il
4686centro e l'ampiezza della banda). Questo parametro prende il posto dei due
4687valori richiesti dalla versione gnuplot di questa opzione (nome della serie
4688o ID numerico o colonne della matrice). Per esempio:
4689
4690      scalar n = 100
4691      matrix x = seq(1,n)'
4692      matrix y = x + filter(mnormal(n,1), 1, {1.8, -0.9})
4693      matrix B = y ~ muniform(n,1)
4694      plot y
4695      options time-series with-lines
4696      options band=B,10 band-style=fill
4697      end plot --output=display
4698
4699Disegnare senza dati
4700
4701Il seguente esempio mostra un semplice caso di come si specifica un grafico
4702senza l'utilizzo di una sorgente dati.
4703
4704      plot
4705      literal set title 'CRRA utility'
4706      literal set xlabel 'c'
4707      literal set ylabel 'u(c)'
4708      literal set xrange[1:3]
4709      literal set key top left
4710      literal crra(x,s) = (x**(1-s) - 1)/(1-s)
4711      printf "plot crra(x, 0) t 'sigma=0', \\"
4712      printf " log(x) t 'sigma=1', \\"
4713      printf " crra(x,3) t 'sigma=3"
4714      end plot --output=display
4715
4716# poisson Estimation
4717
4718Argomenti:  variabile-dipendente variabili-indipendenti [ ; offset ]
4719Opzioni:    --robust (errori standard robusti)
4720            --cluster=clustvar (vedi "logit" per una spiegazione)
4721            --vcv (stampa la matrice di covarianze)
4722            --verbose (stampa i dettagli delle iterazioni)
4723            --quiet (non stampa i risultati)
4724Esempi:     poisson y 0 x1 x2
4725            poisson y 0 x1 x2 ; S
4726            Vedi anche camtriv.inp
4727
4728Stima una regressione di Poisson, in cui la variabile dipendente rappresenta
4729le occorrenze di un qualche tipo di evento e può assumere solo valori
4730interi non negativi.
4731
4732Se una variabile casuale discreta Y segue la distribuzione di Poisson,
4733
4734  Pr(Y = y) = exp(-v) * v^y / y!
4735
4736per y = 0, 1, 2,.... La media e la varianza della distribuzione sono
4737entrambe uguali a v. Nel modello di regressione di Poisson, il parametro v
4738è rappresentato da una funzione di una o più varabili indipendenti. La
4739versione più comune del modello (e l'unica supportata da gretl) ha
4740
4741  v = exp(b0 + b1*x1 + b2*x2 + ...)
4742
4743ossia il logaritmo di v è una funzione lineare delle variabili
4744indipendenti.
4745
4746Opzionalmente è possibile aggiungere una variabile "offset" alla
4747specificazione, ossia una variabile di scala, il cui logaritmo viene
4748aggiunto alla funzione di regressione lineare (con un coefficiente implicito
4749di 1.0). Ciò ha senso se si ipotizza che il numero di occorrenze
4750dell'evento in questione sia proporzionale a qualche fattore noto, a parità
4751di altre condizioni. Ad esempio, il numero di incidenti stradali può essere
4752ipotizzato proporzionale al volume del traffico, che potrebbe essere
4753specificato come una variabile di "offset" in un modello di Poisson per il
4754tasso di incidenti. La variabile di offset dev'essere strettamente positiva.
4755
4756Da impostazione predefinita gli errori standard sono calcolati usando la
4757matrice Hessiana. Se viene data l'opzione --robust allora gli errori
4758standard vengono calcolati secondo il metodo o di Huber-White o QML. In
4759questo particolare caso la matrice di covarianze stimata è il prodotto del
4760"sandwich" tra l'Hessiana inversa (negativa) ed il prodotto esterno del
4761gradiente.
4762
4763Si veda anche la voce "negbin".
4764
4765Accesso dal menù:    /Modello/Modelli non lineari/Poisson
4766
4767# print Printing
4768
4769Varianti:   print lista-variabili
4770            print
4771            print nomi-oggetto
4772            print stringa
4773Opzioni:    --byobs (per osservazione)
4774            --no-dates (usa i numeri delle osservazioni)
4775            --range=inizio:fine (vedi sotto)
4776            --midas (vedi sotto)
4777            --tree (specifico per bundle; vedi sotto)
4778Esempi:     print x1 x2 --byobs
4779            print my_matrix
4780            print "Questa è una stringa"
4781            print my_array --range=3:6
4782            print hflist --midas
4783
4784Si noti che print è un comando relativamente "rozzo" (principalmente
4785rivolto alla stampa di serie); per alternative più avanzate e meno
4786restrittive, si vedano i comandi "printf" e "eval".
4787
4788Nella prima variante mostrata sopra (vedia anche il primo esempio), lista
4789dev'essere una lista di serie (sia come variabile predefinita che come lista
4790di nomi o numeri ID separati da spazi). In tal caso, il comando stampa i
4791valori delle variabili specificate. Per default, la stampa avviene "per
4792variabile", ma con l'opzione --byobs i dati vengono stampati per
4793osservazione. Nel secondo caso, il comportamento predefinito è quello di
4794mostrare la data (per serie storiche) o il marcatore (se esiste) all'inizio
4795di ogni riga. L'opzione --no-dates sopprime la visualizzazione delle date o
4796dei marcatori: viene mostrato solo un semplice numero di osservazione. Si
4797veda l'ultimo paragrafo di questa voce per l'effetto in questo contesto
4798dell'opzione --midas (che si applica solo a liste predefinite).
4799
4800Se al comando non vengono forniti argomenti (la seconda variante mostrata
4801all'inizio), l'azione è simile a quella appena descritta, con tanto di
4802opzioni aggiuntive. La sola differenza è che vengono stampate tutte le
4803serie nel dataset aperto.
4804
4805La terza variante (con l'argomento nomi-oggetto; vedi il secondo esempio)
4806funziona con una lista di nomi (separati da spazi) di variabili diversi da
4807serie: scalari, matrici, stringhe, bundle, array. Di questi oggetti, vengono
4808mostrati i valori. Nel caso dei bundle, gli elementi vengono ordinati per
4809tipo e alfabeticamente.
4810
4811Nella quarta forma (terzo esempio), stringa dev'essere una stringa racchiusa
4812da virgolette doppie (senza che vi sia nient'altro dopo). La stringa viene
4813stampata, seguita da un "a capo".
4814
4815L'opzione --range è usata per controllare la quantità di informazione
4816stampata. I valori (interi) inizio e fine fanno riferimento alle
4817osservazioni per serie e liste, alle rghe per le matrici, agli elementi per
4818gli array, e alle linee di testo per le stringhe. In tutti i casi, il valore
4819minimo per inizio è 1 e il massimo stop è la dimensione "per riga"
4820dell'oggetto in questione. Valori negativi per questi indici sono
4821interpretati come valori a partire dal fondo. Gli indici possono avere la
4822forma di numeri o di variabili scalari predefinite. Se inizio viene omesso,
4823si intende 1 e se viene omesso fine si intende "fino in fondo". Si noti che
4824nel caso di serie e liste, gli indici sono relativi al sottocampione in uso.
4825
4826L'opzione --tree è specifica alla stampa di un bundle: essa fa sì che
4827venga stampato anche il contenuto degli eventuali altri bundle contenuti in
4828quello specificato (anche come array di bundle). Altrimenti, vengono
4829elencati solo gli elementi di livello più alto.
4830
4831L'opzione --midas è specifica alla stampa di una lista di serie; in
4832particolare, è usata per quei dataset che contengono una o più serie ad
4833alta frequenza, ognuna rappresentata da una "MIDAS list". Se viene passata
4834come argomento una lista di questo tipo, verrà stampata (per osservazione)
4835la serie alla sua frequenza "nativa".
4836
4837Accesso dal menù:    /Dati/Mostra valori
4838
4839# printf Printing
4840
4841Argomenti:  formato , argomenti
4842
4843Stampa valori scalari, serie, matrici o stringhe formattandoli secondo le
4844indicazioni di una stringa di formato (che supporta un piccolo sottoinsieme
4845del comando printf() del linguaggio di programmazione C). I formati numerici
4846riconosciuti sono %e, %E, %f, %g, %G, %d, e %x, con i vari modificatori
4847disponibili in C. Esempi: la stringa di formato %.10g stampa un valore con
484810 cifre significative; %12.6f stampa un valore con 6 cifre decimali e una
4849larghezza di 12 caratteri. Si noti comunque che in gretl il formato %g è
4850una buona scelta di default per tutti i valori numerici; non c'è bisogno di
4851andare troppo sul complicato. Il formato %s è consigliato qualora si lavori
4852con le stringhe.
4853
4854La stringa di formato deve essere racchiusa tra virgolette doppie, i valori
4855da stampare devono seguire la stringa di formato, separati da virgole. I
4856valori possono avere tre forme: a) nomi di variabili; b) espressioni valide
4857per il comando "genr"; c) le funzioni speciali varname() o date(). L'esempio
4858seguente stampa i valori di due variabili e quello di un'espressione
4859calcolata:
4860
4861  ols 1 0 2 3
4862  genr b = $coeff(2)
4863  genr se_b = $stderr(2)
4864  printf "b = %.8g, standard error %.8g, t = %.4f\n", b, se_b, b/se_b
4865
4866Le prossime righe mostrano l'uso delle funzioni varname e date, che mostrano
4867rispettivamente il nome di una variabile dato il suo numero identificativo,
4868e una stringa data, dato un numero di osservazione.
4869
4870  printf "Il nome della variabile %d è %s\n", i, varname(i)
4871  printf "La data dell'osservazione %d è %s\n", j, date(j)
4872
4873Se si usa un argomento matrice insieme a un formato numerico, l'intera
4874matrice verrà stampata usando per ogni elemento il formato numerico
4875indicato. La stessa cosa vale per le serie, tranne per il fatto che
4876l'intervallo di valori stampato è controllato dall'impostazione del
4877campione corrente.
4878
4879La lunghezza massima di una stringa di formato è di 127 caratteri. Vengono
4880riconosciute le sequenze di escape \n (newline), \t (tab), \v (tab
4881verticale) e \\ (barra inversa). Per stampare un segno di percentuale, si
4882usi %%.
4883
4884Come in C, i valori numerici che fanno parte del formato (larghezza e
4885precisione) possono essere dati direttamente come numeri, come in %10.4f, o
4886come variabili. Nell'ultimo caso, si inseriscono asterischi nella stringa di
4887formato e si forniscono nell'ordine gli argomenti corrispondenti. Ad
4888esempio:
4889
4890  scalar larghezza = 12
4891  scalar precisione = 6
4892  printf "x = %*.*f\n", larghezza, precisione, x
4893
4894# probit Estimation
4895
4896Argomenti:  variabile-dipendente variabili-indipendenti
4897Opzioni:    --robust (errori standard robusti)
4898            --cluster=clustvar (si veda "logit" per una spiegazione)
4899            --vcv (mostra la matrice di covarianza)
4900            --verbose (mostra i dettagli delle iterazioni)
4901            --quiet (non stampa i risultati)
4902            --p-values (mostra i p-value invece degli effetti
4903	marginali)
4904            --random-effects (stima un modello panel a effetti casuali (RE))
4905            --quadpoints=k (numero di punti di quadratura per la stima RE)
4906Esempi:     ooballot.inp, oprobit.inp, reprobit.inp
4907
4908Se la variabile dipendente è binaria (tutti i suoi valori sono 0 o 1),
4909esegue una stima di massima verosimiglianza dei coefficienti delle
4910variabili-indipendenti con il metodo Newton-Raphson. Visto che il modello è
4911nonlineare, gli effetti marginali (pendenze) dipendono dai valori delle
4912variabili indipendenti: per impostazione predefinita, al posto dei p-value
4913vengono mostrate le pendenze rispetto ad ognuna delle variabili
4914indipendenti, calcolate in corrispondenza della media della variabile.
4915Questo comportamento può essere soppresso usando l'opzione --p-values. La
4916statistica chi-quadro testa l'ipotesi nulla che tutti i coefficienti tranne
4917la costante siano pari a zero.
4918
4919In modalità predefinita, gli errori standard sono calcolati tramite
4920l'inversa negativa della matrice Hessiana. Se si usa l'opzione --robust,
4921verranno calcolati gli errori standard con il metodo QML o con quello di
4922Huber-White. In questo caso, la matrice di covarianza stimata è un
4923"sandwich" dell'inversa dell'Hessiana stimata e del prodotto esterno del
4924gradiente. Per i dettagli, si veda Davidson e MacKinnon 2004, cap. 10.
4925
4926Se la variabile dipendente non è binaria ma è discreta allora si
4927otterranno delle stime Ordered Probit. (Se la variabile selezionata come
4928dipendente non è nemmeno discreta allora viene segnalato un errore.)
4929
4930Probit per dati panel
4931
4932Con l'opzione --random-effects, il termine di errore è composto per ipotesi
4933da due componenti gaussiane: una specifica per l'unità cross-sezionale e
4934invariante nel tempo (nota come "effetto individuale") e l'altra specifica
4935per quella particolare osservazione.
4936
4937Il calcolo della log-verosimiglianza per questo modello viene effettuato
4938tramite la quadratura di Gauss-Hermite per approssimare il valore di valori
4939attesi di funzioni di variabili casuali normali. Il numero di punti di
4940quadratura usati si può scegliere tramite l'opzione --quadpoints (il
4941default è 32). Un numero elevato di questi aumenta l'accuratezza dei
4942risultati, ma al costo di tempi di calcolo più lunghi; in questo caso la
4943stima può richiedere molto tempo con dataset grandi.
4944
4945Oltre ai parametri standard (e statistiche associate) relativi alle
4946variabili esplicative, dopo la stima di questo tipo di modello vengono
4947presentati alcuni risultati aggiuntivi:
4948
4949  lnsigma2: la stima ML del logaritmo della varianza dell'effetto
4950  individuale;
4951
4952  sigma_u: la stima dell'errore quadratico medio dell'effetto individuale;
4953
4954  rho: la quota stima dell'effetto individuale sulla varianza totale del
4955  termine di errore composito (anche nota come correlazione intra-classe).
4956
4957Il test LR per l'ipotesi nulla rho=0 consente di stabilire se la
4958specificazione a effetti random è davvero necessaria. Sotto la nulla, una
4959semplice specificazione probit è del tutto adeguata. Se la nulla non viene
4960rigettata allora questo suggerirà che una semplice specificazione pooled
4961per il modello probit risulta più che adeguata.
4962
4963Il probit per l'analisi delle proporzioni non è ancora stato implementato
4964in gretl.
4965
4966Accesso dal menù:    /Modello/Modelli non lineari/Probit
4967
4968# pvalue Utilities
4969
4970Argomenti:  distribuzione [ parametri ] valore-x
4971Esempi:     pvalue z zscore
4972            pvalue t 25 3.0
4973            pvalue X 3 5.6
4974            pvalue F 4 58 fval
4975            pvalue G shape scale x
4976            pvalue B bprob 10 6
4977            pvalue P lambda x
4978            pvalue W shape scale x
4979            Vedi anche mrw.inp, restrict.inp
4980
4981Calcola l'area alla destra del valore-x nella distribuzione indicata (z per
4982la Gaussiana, t per la t di Student, X per la chi-quadro, F per la F, G per
4983la gamma, B per la binomiale, P per la Poisson, exp per l'esponenziale
4984negativa e W per la Weibull).
4985
4986A seconda della distribuzione, occorre fornire le seguenti informazioni,
4987prima del valore-x: per le distribuzioni t e chi-quadro occorre indicare i
4988gradi di libertà; per la F sono richiesti i gradi di libertà al numeratore
4989e al denominatore; per la gamma sono richiesti il parametro di forma e
4990quello di scala; per la binomiale sono richieste la probabilità di
4991"successo" e il numero di prove; per la distribuzione di Poisson va indicato
4992il parametro lambda (che rappresenta sia la media che la varianza); per
4993l'esponenziale, il parametro di scala; per la distribuzione Weibull, i
4994parametri di forma e scala. Come si vede dagli esempi precedenti, gli
4995argomenti numerici possono essere indicati sotto forma di numero o come nomi
4996di variabili.
4997
4998Si noti che talvolta la distribuzione gamma viene caratterizzata dai
4999parametri di media e varianza, invece che da quelli di forma e scala. La
5000media è il prodotto di forma e scala, mentre la varianza è il prodotto tra
5001la forma e il quadrato della scala. Quindi la scala si può ottenere come la
5002varianza divisa per la media, mentre la forma come la media divisa per la
5003scala.
5004
5005Accesso dal menù:    /Strumenti/Calcola p-value
5006
5007# qlrtest Tests
5008
5009Opzioni:    --limit-to=lista (limita il test a una parte delle variabili esplicative)
5010            --plot=mode-or-filename (si veda sotto)
5011            --quiet (non mostra l'output)
5012
5013Per un modello stimato con OLS su serie storiche, esegue il test del
5014rapporto di verosimiglianza di Quandt (QLR) per un break strutturale in un
5015punto incognito del campione, escludendo il 15% delle osservazioni
5016all'inizio e ella fine del campione.
5017
5018Per ogni possibile punto di rottura compreso nel 70% centrale delle
5019osservazioni, viene eseguito un test di Chow (si veda "chow"); come per il
5020test di Chow vero e proprio, questo è un test di Wald robusto se il modello
5021originale è stato stimato con l'opzione --robust. La statistica del test
5022QLR è il massimo dei valori F di questi test e segue una distribuzione non
5023standard.
5024
5025Il p-value asintotico è ottenuto usando il metodo di Bruce Hansen (1997).
5026
5027Oltre agli accessori standard "$test" e "$pvalue", questo comando genera
5028anche "$qlrbreak", che restituisce l'indice dell'ossservazione alla quale la
5029statistica test è massima.
5030
5031L'opzione --limit-to serve a limitare le interazioni con la dummy di
5032divisione del campione nei test di Chow a un sottoinsieme dei regressori
5033originali. Il parametro dev'essere una lista predefinita che non può
5034contenere la costante; gli elementi della lista devono essere tutti scelti
5035fra i regressori originali.
5036
5037Quando questo comando viene eseguito interattivamente, di default verrà
5038mostrato un grafico delle statistiche del test di Chow. Questo comportamento
5039si può modificare con l'opzione --plot. I parametri consentiti sono none
5040(per fare a meno del grafico); display (per mostrare il grafico anche quando
5041non si è in modo interattivo), oppure un nome di file. Per la descrizione
5042dell'effetto di quest'ultima scelta, si veda l'opzione --output del comando
5043"gnuplot".
5044
5045Accesso dal menù:    Finestra del modello, /Test/QLR
5046
5047# qqplot Graphs
5048
5049Varianti:   qqplot y
5050            qqplot y x
5051Opzioni:    --z-scores (v. oltre)
5052            --raw (v. oltre)
5053            --output=nomefile (manda il grafico ad un file specificato)
5054
5055Con una sola serie come argomento, mostra un grafico della distribuzione
5056empirica della serie stessa (indicata col nome o con il suo numero ID)
5057contro i quantili della normale. La serie deve includere almeno 20 valori
5058validi nel campione selezionato al momento. Per impostazione predefinita, i
5059quantili empirici vengono disegnati contro quelli della normale avente media
5060e varianza uguali a quelli campionari della serie, ma sono disponibili due
5061alternative: con l'opzione --z-scores, i dati vengono standardizzati prima,
5062oppure, con l'opzione --raw, i quantili empirici possono essere disegnati
5063contro quelli della normale standardizzata.
5064
5065Tramite l'opzione --output si invia il grafico al file desiderato; usare
5066"display" per forzare l'output allo schermo, ad esempio nel contesto di un
5067loop. si veda il comando "gnuplot" per maggiori dettagli in merito a
5068quest'opzione.
5069
5070Con due argomenti, y and x, mostra un grafico dei quantili empirici di y
5071contro quelli di x. I dati non vengono standardizzati.
5072
5073Accesso dal menù:    /Variabile/Q-Q normale
5074Accesso dal menù:    /Visualizza/Grafico/Q-Q
5075
5076# quantreg Estimation
5077
5078Argomenti:  tau variabile-dipendente variabili-indipendenti
5079Opzioni:    --robust (errori standard robusti)
5080            --intervals[=level] (calcola gli intervalli di confidenza)
5081            --vcv (mostra la matrice di covarianza)
5082            --quiet (sopprime la stampa dei risultati)
5083Esempi:     quantreg 0.25 y 0 xlist
5084            quantreg 0.5 y 0 xlist --intervals
5085            quantreg 0.5 y 0 xlist --intervals=.95
5086            quantreg tauvec y 0 xlist --robust
5087            Vedi anche mrw_qr.inp
5088
5089Regressione quantile. Il primo argomento, tau, è il quantile condizionale
5090per cui si desiderano le stime. Può essere un valore numerico o il nome di
5091una variabile scalare predefinita; il valore deve essere compreso
5092nell'intervallo da 0.01 a 0.99 (in alternativa, può essere indicato un
5093vettore di valori, si veda sotto per i dettagli). Gli argomenti dal secondo
5094in poi compongono un elenco di regressori sul modello di quello usato in
5095"ols".
5096
5097Senza l'opzione --intervals, vengono mostrati gli errori standard per le
5098stime quantili; per impostazione predefinita questi sono calcolati con la
5099formula asintotica di Koenker e Bassett (1978), ma se si usa l'opzione
5100--robust, verrà usata la variante robusta per l'eteroschedasticità
5101utilizzando il metodo di Koenker e Zhao (1994).
5102
5103Se si usa l'opzione --intervals, gretl calcolerà gli intervalli di
5104confidenza invece degli errori standard. Questi intervalli sono calcolati
5105col metodo dell'inversione del rango e in generale sono asimmetrici rispetto
5106alle stime puntuali dei parametri. Se non si usa l'opzione "--robust", gli
5107intervalli sono calcolati nell'ipotesi di errori IID (Koenker, 1994), mentre
5108se viene indicata sono calcolati con lo stimatore robusto sviluppato Koenker
5109e Machado (1999).
5110
5111Per impostazione predefinita vengono prodotti intervalli di confidenza al
511290%. È possibile specificare un altro livello di confidenza (sotto forma di
5113frazione decimale), aggiungendolo all'opzione, come in --intervals=0.95.
5114
5115Invece di indicare tau come uno scalare, è possibile usare un vettore,
5116indicando il nome di una matrice predefinita. In questo caso le stime
5117vengono eseguite per tutti i valori di tau, e i risultati mostrano la
5118sequenza delle stime quantili per ognuno dei regressori.
5119
5120Accesso dal menù:    /Modello/Stima robusta/Regressione quantile
5121
5122# quit Utilities
5123
5124Esce dalla modalità corrente di gretl.
5125
5126  Quando il comando è in uno script, l'esecuzione dello script viene
5127  interrotta. Se il contesto è gretlcli (il client testuale) in modalità
5128  batch, terminerà gretlcli stesso; altrimenti, il programma tornerà in
5129  modalità interattiva.
5130
5131  Quando il comando viene eseguito nel terminale GUI, il terminale si
5132  chiuderà.
5133
5134  Quando il comando viene eseguito in modo interattivo, il programma esce.
5135
5136Si noti che questo comando non può essere eseguito all'interno di funzioni
5137o di loop.
5138
5139In comando quit non provoca l'uscita dal programma GUI in alcun caso. Per
5140uscire, si può usare la voce Esci del menu File, o Ctrl+Q, o cliccando sul
5141pulsante di chiusura della barra della finestra.
5142
5143# rename Dataset
5144
5145Argomenti:  serie nuovo-nome
5146Opzione:    --quiet (sopprime la stampa dell'output)
5147
5148Cambia il nome di una serie (identificata da un nome o da un numero
5149identificativo) con un nuovo-nome. Il nuovo nome deve essere di massimo 31
5150caratteri, deve iniziare con una lettera e deve essere composto da una
5151combinazione di sole lettere, cifre e trattini. In aggiunta il nuovo nome
5152non deve essere già ad appartenente a nessun oggetto di nessun tipo del
5153dataset.
5154
5155Accesso dal menù:    /Variabile/Modifica attributi
5156Accesso alternativo: Menù pop-up nella finestra principale (selezione
5157    singola)
5158
5159# reset Tests
5160
5161Opzioni:    --quiet (non mostra la regressione ausiliaria)
5162            --silent (non mostra nulla)
5163            --squares-only (calcola il test coi soli quadrati)
5164            --cubes-only (calcola il test coi soli cubi)
5165
5166Deve seguire la stima di un modello OLS. Esegue il test RESET di Ramsey per
5167la specificazione del modello (non-linearità) aggiungendo alla regressione
5168i quadrati e/o cubi dei valori stimati, e calcola la statistica F per
5169l'ipotesi nulla sotto la quale i coefficienti beta delle variabili aggiunte
5170siano uguali a zero.
5171
5172Sia i quadrati che i cubi vengono aggiunti al modello in maniera predefinita
5173a meno che non vengano specificate le opzioni --squares-only o --cubes-only.
5174
5175L'opzione --silent può essere usata se si intendono utilizzare solo gli
5176accessori "$test" o "$pvalue" per disporre direttamente dei risultati del
5177test.
5178
5179Accesso dal menù:    Finestra del modello, /Test/RESET - Ramsey
5180
5181# restrict Tests
5182
5183Opzioni:    --quiet (non stampare le stime vincolate)
5184            --silent (non stampare niente)
5185            --wald (solo per stimatori di sistema - vedi sotto)
5186            --bootstrap (se possibile, effettuare il bootstrap del test)
5187            --full (solo OLS e VECM, vedi sotto)
5188Esempi:     hamilton.inp, restrict.inp
5189
5190Impone un insieme di vincoli (solitamente lineari) su (a) l'ultimo modello
5191stimato o (b) su un sistema di equazioni definito in precedenza. In entrambi
5192i casi, l'insieme di vincoli deve essere racchiuso tra i comandi "restrict"
5193e "end restrict".
5194
5195Nel caso di una equazione singola, i vincoli sono applicati implicitamente
5196all'ultimo modello e vengono valutati appena viene terminato il comando
5197"restrict".
5198
5199Nel caso di un sistema (definito attraverso il comando "system"), il comando
5200iniziale "restrict" può essere seguito dal nome di un sistema di equazioni
5201definito in precedenza; altrimenti, le restrizioni si applicheranno
5202all'ultimo modello stimato. I vincoli vengono valutati nella successiva
5203stima del sistema effettuata con il comando "estimate". Tuttavia, se viene
5204usata l'opzione --wald, il vincolo viene testato immediatamente per mezzo di
5205un test chi quadro di Wald usando la matrice di covarianze stimata. Si noti
5206che questa opzione produrrà un errore se il sistema è stato definito, ma
5207non ancora stimato.
5208
5209A seconda del contesto, i vincoli possono essere espressi in diversi modi.
5210Quello più semplice è di esprimere ogni vincolo come equazione, con una
5211combinazione lineare dei parametri a sinistra e uno scalare a destra del
5212segno di uguale (una costante o, volendo, il nome di una variabile scalare).
5213
5214Nel caso della singola equazione, i parametri sono indicati con la sintassi
5215b[i], dove i rappresenta la posizione nella lista dei regressori, a partire
5216da uno, oppure con b[variabile], dove variabile è il nome del regressore in
5217questione. Nel caso di sistemi, i parametri vengono indicati con la sintassi
5218b seguita da due numeri tra parentesi quadre. Il primo numero rappresenta la
5219posizione dell'equazione all'interno del sistema, mentre il secondo indica
5220la posizione nella lista dei regressori. Ad esempio b[2,1] indica il primo
5221parametro della seconda equazione, mentre b[3,2] il secondo parametro della
5222terza equazione. I termini b nell'equazione che rappresenta un vincolo
5223possono essere prefissati da un moltiplicatore numerico, usando il segno *
5224per indicare la moltiplicazione, ad esempio 3.5*b[4].
5225
5226Ecco un esempio di un insieme di vincoli per un modello stimato in
5227precedenza:
5228
5229	  restrict
5230	  b[1] = 0
5231	  b[2] - b[3] = 0
5232	  b[4] + 2*b[5] = 1
5233	  end restrict
5234
5235Ed ecco un esempio di un insieme di vincoli da applicare a un sistema (se il
5236nome del sistema non contiene spazi, è possibile tralasciare le
5237virgolette).
5238
5239	  restrict "Sistema 1"
5240	  b[1,1] = 0
5241	  b[1,2] - b[2,2] = 0
5242	  b[3,4] + 2*b[3,5] = 1
5243	  end restrict
5244
5245Nel caso di una equazione singola le restrizioni sono valutate, per default,
5246tramite un test di Wald, che utilizza la matrice di covarianze del modello
5247in questione. Se il modello originale è stato stimato via OLS allora
5248vengono mostrati i coefficienti vincolati stimati, a meno che non si
5249utilizzi l'opzione --quiet all'inizio del comando restrict. Come alternativa
5250al test di Wald è possibile dare usare l'opzione --bootstrap affinchè
5251venga eseguito un test sulla restrizione attraverso tale metodo; ciò è
5252consentito solamente per modelli stimati attraverso OLS o WLS.
5253
5254Nel caso di un sistema, la statistica test dipende dallo stimatore scelto:
5255un test del rapporto di verosimiglianza nel caso di un sistema stimato con
5256un metodo di massima verosimiglianza, o un test F asintotico negli altri
5257casi.
5258
5259Esistono due alternative alla rappresentazione dei vincoli discussa sopra.
5260Una sfrutta la possibilità di esprimere g restrizioni lineari su un vettore
5261di kparametri, beta, atraverso l'espressione Rbeta - q = 0, dove R è una
5262matrice g x k e q è un vettore a g elementi. Le restrizioni possono essere
5263date usando i nomi di matrici predefinite e conformabili da usare come R e
5264q, come ad esempio in
5265
5266	  restrict
5267	  R = Rmat
5268	  q = qvec
5269	  end restrict
5270
5271Se si deve testare un vincolo non lineare (possibilità al momento prevista
5272solo per i modelli ad equazione singola) bisogna dare al vincolo in nome di
5273una funzione, preceduto da "rfunc = ", come ad esempio in
5274
5275	  restrict
5276	  rfunc = myfunction
5277	  end restrict
5278
5279La funzione vincolo deve avere, come unico argomento, una const matrix, che
5280verrà automaticamente riempita col vettore dei parametri. La funzione deve
5281ritornare un vettore zero sotto lipotesi nulla e non-zero altrimenti. La
5282lunghezza del vettore è il numero di vincoli. Questa funzione è usata come
5283"callback" dalla routine interna di calcolo dello jacobiano, che calcola un
5284test di Wald per mezzo del "delta method".
5285
5286Quello che segue è un semplice esempio di funzione atta allo scopo di
5287testare una restrizione non-lineare, cioè che due coppie di parametri
5288stiano nello stesso rapporto fra loro.
5289
5290	  function matrix restr (const matrix b)
5291	  matrix v = b[1]/b[2] - b[4]/b[5]
5292	  return v
5293	  end function
5294
5295Se il comando restrict va a buon fine, gli accessori "$test" e "$pvalue"
5296restituiscono la statistica test ed il suo relativo p-value.
5297
5298Quando si testano delle restrizioni su un modello ad equazione singola
5299stimato via OLS, o su una VECM, l'opzione --full può essere usata per
5300impostare le stime vincolate come "ultimo modello" di riferimento, allo
5301scopo di compiere ulteriori test o di utilizzare eventuali accessori del
5302tipo $coeff e vcv. Si noti che alcune considerazioni particolari
5303sopraggiungono nel caso in cui si testino delle restrizioni su modelli VECM.
5304Per maggiori dettagli si consiglia la lettura della guida all'uso di gretl
5305(il capitolo 33).
5306
5307Accesso dal menù:    Modello, /Test/Vincoli lineari
5308
5309# rmplot Graphs
5310
5311Argomento:  nome-variabile
5312Opzioni:    --trim (si veda oltre)
5313            --quiet (non mostra l'output)
5314            --output=nomefile (si veda oltre)
5315
5316Grafici range-mean: questo comando crea un semplice grafico che aiuta a
5317capire se una serie storica y(t) ha varianza costante o no. L'intero
5318campione t=1,...,T viene diviso in piccoli sotto-campioni di dimensione
5319arbitraria k. Il primo sotto-campione è formato da y(1), ... ,y(k), il
5320secondo da y(k+1), ... , y(2k), e così via. Per ogni sotto-campione,
5321vengono calcolati la media e il campo di variazione (range: il valore
5322massimo meno quello minimo) e viene costruito un grafico con le medie
5323sull'asse orizzontale e i campi di variazione su quello verticale, in modo
5324che ogni sotto-campione sia rappresentato da un punto sul piano. Se la
5325varianza della serie è costante, ci si aspetta che il campo di variazione
5326del sotto-campione sia indipendente dalla media del sotto-campione; se i
5327punti si dispongono su una linea crescente, la varianza della serie cresce
5328al crescere della media, viceversa se i punti si dispongono su una linea
5329decrescente.
5330
5331Oltre al grafico, gretl mostra anche le medie e i campi di variazione per
5332ogni sotto-campione, insieme al coefficiente di pendenza della regressione
5333OLS del campo di variazione sulla media e il p-value per l'ipotesi nulla che
5334la pendenza sia zero. Se il coefficiente di pendenza è significativo al
5335livello del 10 per cento, viene mostrata sul grafico la linea stimata della
5336regressione del campo di variazione sulla media. La statistica t per
5337l'ipotesi nulla, e il corrispondente p-value, vengono registrati e possono
5338venire richiamati attraverso gli accessori "$test" e "$pvalue".
5339
5340Se l'opzione --trim è presente il valore minimo ed il valore massimo di
5341ogni sotto-campione vengono scartati prima che la media ed il campo di
5342variazione siano calcolati. Questo rende ancor più marginale la presenza di
5343eventuali outlier che potrebbero distorcere i risultati dell'analisi.
5344
5345Se l'opzione --quiet è data nessun grafico viene mostrato e nessun output
5346viene stampato; solamente la statistica t ed il corrispondente p-value
5347vengono registrati. Altrimenti il formato del grafico può venire
5348controllato attraverso l'opzione --output; quest'ultima funziona esattamente
5349come descritto nel comando "gnuplot".
5350
5351Accesso dal menù:    /Variabile/Grafico range-mean
5352
5353# run Programming
5354
5355Argomento:  file-input
5356
5357Esegue i comandi nel file-input e restituisce il controllo al prompt
5358interattivo. Questo comando si intende usato con il programma a riga di
5359comando gretlcli, o con il "terminale di gretl" nel programma con
5360interfaccia grafica.
5361
5362Si veda anche "include".
5363
5364Accesso dal menù:    Icona Esegui nella finestra comandi
5365
5366# runs Tests
5367
5368Argomento:  nome-variabile
5369Opzioni:    --difference (usa la differenza prima della variabile)
5370            --equal (i valori positivi e negativi sono equiprobabili)
5371
5372Esegue il test non parametrico "delle successioni" per la casualità della
5373variabile specificata, dove le successioni sono definite come sequenze di
5374valori consecutivi positivi o negativi. Ad esempio, per testare la
5375casualità delle deviazioni dalla mediana per una variabile chiamata x1, con
5376una mediana diversa da zero, eseguire i comandi seguenti:
5377
5378	  genr signx1 = x1 - median(x1)
5379	  runs signx1
5380
5381Se si usa l'opzione --difference, la variabile viene differenziata prima
5382dell'analisi, quindi le successioni sono interpretabili come sequenze di
5383incrementi o decrementi consecutivi nel valore della variabile.
5384
5385Se si usa l'opzione --equal, l'ipotesi nulla incorpora l'assunzione che i
5386valori positivi e negativi siano equiprobabili, altrimenti la statistica
5387test è invariante rispetto all'"equilibrio" del processo che genera la
5388sequenza, focalizzandosi solo sull'indipendenza.
5389
5390Accesso dal menù:    /Strumenti/Test non parametrici
5391
5392# scatters Graphs
5393
5394Argomenti:  variabile-y ; lista-variabili-x  o lista-variabili-y ; variabile-x
5395Opzioni:    --with-lines (crea grafici lineari)
5396            --matrix=nome (mostra le colonne della matrice)
5397            --output=noemfile (manda l'output al file specificato)
5398Esempi:     scatters 1 ; 2 3 4 5
5399            scatters 1 2 3 4 5 6 ; 7
5400            scatters y1 y2 y3 ; x --with-lines
5401
5402Produce grafici della variabile-y rispetto ad ognuna delle variabili nella
5403lista-variabili-x, oppure di tutte le variabili nella lista-variabili-y
5404rispetto alla variabile-x. Il primo esempio visto sopra assegna la variabile
54051 all'asse y e produce quattro grafici, il primo con la variabile 2
5406sull'asse x, il secondo con la variabile 3 sull'asse x, e così via. Il
5407secondo esempio rappresenta ognuna delle variabili da 1 a 6 rispetto alla
5408variabile 7 sull'asse x. Questi gruppi di grafici sono utili nell'analisi
5409esplorativa dei dati. È possibile creare fino a sei grafici alla volta,
5410eventuali variabili in sovrappiù saranno ignorate.
5411
5412Per impostazione predefinita vengono prodotti dei classici grafici a
5413dispersione, ma se si usa l'opzione --with-lines vengono mostrate anche le
5414linee di collegamento tra i punti del grafico.
5415
5416Per una spiegazione dell'opzione --output, si veda il comando "gnuplot"
5417command.
5418
5419Se la fonte dei dati è una matrice, le liste x e y devono contenere in
5420numeri di colonna; se non vengono dati, tuttle le colonne sono graficate
5421rispetto al tempo o ad una variabile indice.
5422
5423Se il dataset è temporale, la seconda sotto-lista può essere omessa, nel
5424qual caso si intende che le serie saranno graficate rispetto al tempo in
5425sotto-grafici separati.
5426
5427Accesso dal menù:    /Visualizza/Grafici multipli
5428
5429# sdiff Transformations
5430
5431Argomento:  lista-variabili
5432
5433Calcola la differenza stagionale di ogni variabile della lista-variabili e
5434salva il risultato in una nuova variabile con il prefisso sd_. Il comando è
5435disponibile solo per serie storiche stagionali.
5436
5437Accesso dal menù:    /Aggiungi/Differenze stagionali
5438
5439# set Programming
5440
5441Varianti:   set variabile valore
5442            set --to-file=filename
5443            set --from-file=filename
5444            set stopwatch
5445            set
5446Esempi:     set svd on
5447            set csv_delim tab
5448            set horizon 10
5449            set --to-file=mysettings.inp
5450
5451L'uso più comune di questo comando è quello mostrato nella prima variante
5452qui sopra, dove viene fissato il valore di un certo parametro. Più avanti,
5453questo aspetto sarà analizzato in dettaglio. Gli altri usi sono: con
5454--from-file per leggere un file di script contenente certe impostazioni e
5455applicarle alla sessione corrente; con --stopwatch, per azzerare il
5456"cronometro" della CPU di gretl (si veda lo help per l'accessore
5457"$stopwatch"). Se il comando "set" è usato senza parametri, vengono
5458mostrate le impostazioni attuali per tutti i parametri rilevanti.
5459
5460Il valore impostato rimane in vigore per la durata della sessione di gretl,
5461a meno di non essere modificato da un ulteriore esecuzione del comando
5462"set". I parametri che possono essere impostati in questo modo sono elencati
5463di seguito. Si noti che le impostazioni di hac_lag, hc_version e hac_kernel
5464sono usate quando viene data l'opzione --robust a un comando di stima.
5465
5466Le impostazioni disponibili sono raggruppate in categorie: interazione col
5467programma, metodi numerici, generazione di numeri casuali, stima robusta,
5468filtri, stima di modelli per serie storiche e interazione con R.
5469
5470Interazione con il programma
5471
5472Queste impostazioni servono per controllare vari aspetti del modo in cui
5473gretl interagisce con l'utente.
5474
5475  workdir: path. Stabilisce la directory di default per la lettura/scrittura
5476  dei file, ogni qual volta non si specifichino percorsi completi.
5477
5478  use_cwd: on oppure off (il default). Regola l'inizializzazione automatica
5479  di workdir: se on, essa viene ereditata dalla shell, altrimenti viene
5480  fissata al valore che aveva nella sessione gretl precedente.
5481
5482  echo: off o on (valore predefinito). Sopprime o ripristina l'indicazione
5483  dei comandi eseguiti nell'output dei risultati.
5484
5485  messages: off o on (valore predefinito). Sopprime o ripristina
5486  l'indicazione dei messaggi informativi associati a vari comandi, ad
5487  esempio quando viene generata una nuova variabile o viene modificato
5488  l'intervallo del campione.
5489
5490  verbose: off oppure on (valore predefinito). Funziona come "interruttore
5491  doppio" per echo e messages (vedi sopra), ponendoli ambedue accesi o
5492  spenti.
5493
5494  warnings: off oppure on (valore predefinito). Sopprime o ripristina i
5495  messaggi cautelativi, emessi quando certe operazioni aritmetiche producono
5496  valori non finiti.
5497
5498  csv_delim: comma (virgola, valore predefinito), space (spazio), o tab.
5499  Imposta il delimitatore di colonna usato nel salvataggio di dati su file
5500  in formato CSV.
5501
5502  csv_write_na: la stringa usata per rappresentare i valori mancanti quando
5503  si esportano dati in formato CSV. Massimo 7 caratteri; il default è NA.
5504
5505  csv_read_na: la stringa usata per rappresentare i valori mancanti quando
5506  si esportano dati in formato CSV. Massimo 7 caratteri; il default dipende
5507  se una colonna di dati contiene dati numerici (o per lo più tali) o
5508  stringa. Per dati numerici, i valori seguenti sono tutti sinomimi di "dato
5509  mancant": una cella vuota, or una qualunque delle stringhe NA, N.A., na,
5510  n.a., N/A, #N/A, NaN, .NaN, ., .., -999, and -9999. Per valori stringa, si
5511  conta come mancante una cella vuota o una contenente una stringa vuota.
5512  Questi valori di default possono essere reimpostati dando default come
5513  valore per csv_read_na. Per specificare che siano considerate mancanti
5514  solo celle vuote, va dato un valore di "". Si noti comunque che celle
5515  vuote vengono lette come valori mancanti indipendentemente da questo
5516  settaggio.
5517
5518  csv_digits: un intero positivo contenente il numero di cifre significative
5519  da usare quando si salva in formato CSV. Di default, si usano fino a 15
5520  cifre (a seconda della precisione dei dati originali). Si noti che
5521  l'output in CSV usa la funzione fprintf della libreria C con la
5522  conversione "%g", il che implica che gli zeri in fondi non vengono
5523  stampati.
5524
5525  display_digits: un intero da 3 a 6, specificante il numero di cifre
5526  significative da usare nell'output di coefficienti di regressione e
5527  corrispondenti errori standard (il default è 6). Questo settaggio è
5528  anche attivo sul numero di cifre usato dal comando "summary"; in questo
5529  caso, il default (che è anche il massimo) è 5, o 4 con l'opzione
5530  --simple.
5531
5532  mwrite_g: on or off (the default). When writing a matrix to file as text,
5533  gretl by default uses scientific notation with 18-digit precision, hence
5534  ensuring that the stored values are a faithful representation of the
5535  numbers in memory. When writing primary data with no more than 6 digits of
5536  precision it may be preferable to use %g format for a more compact and
5537  human-readable file; you can make this switch via set mwrite_g on.
5538
5539  force_decpoint: on o off (valore predefinito). Forza gretl a usare il
5540  carattere punto come separatore decimale, in un ambiente in cui il
5541  separatore standard è un altro carattere (tipicamente la virgola).
5542
5543  loop_maxiter: un valore intero non negativo. Imposta il numero massimo di
5544  iterazioni consentite prima che un loop di tipo while si fermi (si veda
5545  "loop"). Si noti che questa impostazione riguarda solo la variante while,
5546  visto che lo scopo è quello di interrompere possibili cicli infiniti. Il
5547  valore speciale 0 viene usato per rendere tali cicli potenzialmente
5548  infiniti, visto che non viene fatto alcun controllo sul numero di
5549  iterazioni. Usare con cautela.
5550
5551  max_verbose: on o off (valore predefinito). Attiva l'output aggiuntivo per
5552  la funzione BFGSmax (si veda la Guida all'uso per i dettagli).
5553
5554  debug: 1, 2 o 0 (valore predefinito). Da usare per le funzioni definite
5555  dall'utente. Impostare debug a 1 equivale a impostare messages in tutte
5556  queste funzioni; impostando la variabile a 2 ha l'effetto aggiuntivo di
5557  impostare max_verbose in tutte le funzioni.
5558
5559  shell_ok: on o off (valore predefinito). Abilita l'esecuzione di programmi
5560  esterni da gretl attraverso la shell di sistema. Per motivi di sicurezza,
5561  la funzione è disabilitata per impostazione predefinita; inoltre è
5562  possibile abilitarla solo tramite l'interfaccia grafica
5563  (Strumenti/Preferenze/Generali). Una volta abilitata, l'impostazione
5564  rimarrà attiva per le successive sessioni, fino a che non sarà
5565  disabilitata esplicitamente.
5566
5567  bfgs_verbskip: un intero. Questo parametro regola l'effetto dell'opzione
5568  --verbose per quei comandi che usano BFGS come algoritmo di
5569  ottimizzazione, e serve a rendere l'output più compatto. Se bfgs_verbskip
5570  è, ad esempio, 3, allora l'opzione --verbose farà si che vengano
5571  stampate solo le iterazioni 3, 6, 9 e così via.
5572
5573  skip_missing: on (il default) oppure off. Controlla ciò che gretl fa
5574  quando si costruisce una matrice da una o più serie: il default è di
5575  saltare le righe che contengono almeno un valore mancante, ma impostando
5576  questo parametro a off i valori mancanti vengono convertiti in NaNs.
5577
5578  matrix_mask: il nome di una serie, o la parola null. Questo parametro
5579  permette di costruire matrici da serie con maggiore flessibilità rispetto
5580  a skip_missing: le righe che andranno nella matrice sono quelle per cui la
5581  serie specificata presenta valori validi non-zero. Questo settaggio resta
5582  in vigore finché non viene specificata una serie diversa, o rimosso
5583  usando la parola null.
5584
5585  huge: un numero grande positivo (di default, 1.0E100). Questo settaggio
5586  controlla il valore ritornato dall'accessore "$huge".
5587
5588  assert: off (default), warn oppure stop. Controlla cosa succede se la
5589  funzione "assert" fallisce, ossia ritorna 0.
5590
5591  datacols: un intero da 1 a 15, con valore di default 5. Fissa il massimo
5592  numero di serie mostrate fianco a fianco quando i dati sono mostrati per
5593  osservazione.
5594
5595  plot_collection: on, auto o off. Questo parametro determina il modo in cui
5596  i grafici sono mostrati durante l'uso interattivo. Quando è on, grafici
5597  della stessa dimensione (in termini di pixel) sono raggruppati in una
5598  "collezione", ossia una finestra unica nella quale si può scorrere avanti
5599  e indietro per visualizzare i diversi grafici. Quando è off, invece,
5600  verrà generata una finestra per grafico, come nelle versioni precedenti
5601  di gretl. Infine, il valore auto fa sì che la collezione venga abilitata
5602  solo per grafici che sono generati con un intervallo inferiore agli 1.25
5603  secondi l'uno dall'altro (ad esempio, quando il comando di generazione
5604  grafico fa parte di un loop).
5605
5606Metodi numerici
5607
5608Queste impostazioni vengono usate per controllare gli algoritmi numerici
5609usati da gretl per la stima.
5610
5611  optimizer: auto (il default), BFGS oppure newton. Seleziona il metodo di
5612  ottimizzazione usato in vari stimatori ML, quando sono applicabili sia
5613  BFGS che Newton-Raphson. Il settaggio di default è di usare
5614  Newton-Raphson quando sia disponibile l'hessiana analitica, e se no BFGS.
5615
5616  bhhh_maxiter: un intero. Imposta il massimo numero di iterazioni per la
5617  routine BHHH, che è usata dal comando "arma". Se non viene raggiunta la
5618  convergenza dopo bhhh_maxiter, il programma segnala un errore. Il valore
5619  predefinito è 500.
5620
5621  bhhh_toler: un valore a virgola mobile, oppure la stringa default. Viene
5622  usato dalla routine BHHH di gretl per controllare se viene raggiunta la
5623  convergenza. L'algoritmo di calcolo ferma le iterazioni non appena
5624  l'incremento nella log-verosimiglianza tra le iterazioni è minore di
5625  bhhh_toler. Il valore predefinito è 1.0E-06; questo valore può essere
5626  reimpostato usando la stringa default invece di un valore numerico.
5627
5628  bfgs_maxiter: un valore intero. Rappresenta il massimo numero di
5629  iterazioni per la routine BFGS di gretl, usata da "mle", "gmm" e altri
5630  stimatori. Se non si raggiunge la convergenza nel numero specificato di
5631  iterazioni, il programma produce un messaggio di errore. Il valore
5632  predefinito dipende dal contesto, ma tipicamente è nell'ordine delle 500
5633  iterazioni.
5634
5635  bfgs_toler: un valore in virgola mobile, o la stringa default. Viene usato
5636  nella routine BFGS di gretl per controllare se si è raggiunta la
5637  convergenza. L'algoritmo si ferma appena l'incremento relativo nella
5638  funzione obiettivo tra un'iterazione e l'altra è minore di bfgs_toler. Il
5639  valore predefinito è pari alla precisione della macchina elevata alla
5640  potenza 3/4; questo valore può essere re-impostato usando la stringa
5641  default invece di un valore numerico.
5642
5643  bfgs_maxgrad: one floating point value. This is used in gretl's BFGS
5644  routine to check if the norm of the gradient is reasonably close to zero
5645  when the bfgs_toler criterion is met. A warning is printed if the norm of
5646  the gradient exceeds 1; an error is flagged if the norm exceeds
5647  bfgs_maxgrad. At present the default is the permissive value of 5.0.
5648
5649  bfgs_richardson: on or off (the default). Use Richardson extrapolation
5650  when computing numerical derivatives in the context of BFGS maximization.
5651
5652  initvals: una matrice pre-specificata. Permette di inizializzare il
5653  vettore dei parametri per certi comandi che usano algoritmi di
5654  ottimizzazione numerica (arma, garch, logit e probit, tobit e intreg,
5655  biprobit, duration), nonché quando vengono imposte certe restrizioni
5656  associate ai VECM. A differenza di altri settaggi, initvals non è
5657  persistente: dopo, l'uso, viene automaticamente resettato. Per i dettagli
5658  legati alla stima di modelli ARMA, si veda la guida all'uso di gretl (il
5659  capitolo 31).
5660
5661  lbfgs: on o off (valore predefinito). Usa la versione a memoria limitata
5662  di BFGS, al posto dell'algoritmo standard. Può essere vantaggioso quando
5663  la funzione da massimizzare non è globalmente concava.
5664
5665  lbfgs_mem: un intero da 3 a 20 (il default è 8). Determina il numero di
5666  correzioni usate nella matrice di memoria limitata quando si usa il metodo
5667  L-BFGS-B.
5668
5669  nls_toler: un valore in virgola mobile (il valore predefinito è pari alla
5670  precisione della macchina elevata alla potenza 3/4). Imposta la tolleranza
5671  usata per stabilire se è stata raggiunta la convergenza nelle procedure
5672  iterative di stima con i minimi quadrati non lineari usate dal comando
5673  "nls".
5674
5675  svd: on o off (valore predefinito). Usa la decomposizione SVD invece di
5676  quella di Cholesky o della QR nel calcolo delle stime OLS. Questa opzione
5677  si applica alla funzione mols e a vari altri calcoli eseguiti
5678  internamente, ma non al comando "ols".
5679
5680  force_qr: on or off (the default). This applies to the "ols" command. By
5681  default this command computes OLS estimates using Cholesky decomposition
5682  (the fastest method), with a fallback to QR if the data seem too
5683  ill-conditioned. You can use force_qr to skip the Cholesky step; in
5684  "doubtful" cases this may ensure greater accuracy.
5685
5686  fcp: on o off (valore predefinito). Usa l'algoritmo di Fiorentini,
5687  Calzolari e Panattoni al posto del codice interno di gretl per calcolare
5688  le stime GARCH.
5689
5690  gmm_maxiter: un intero, il numero massimo di iterazioni per il comando
5691  "gmm" con l'opzione --iterate. Il default è 250.
5692
5693  nadarwat_trim: un intero, il parametro di taglio usato dalla funzione
5694  "nadarwat".
5695
5696  fdjac_quality: un intero fra 0 e 2, corrsipondente all'algoritmo usato
5697  nella funzione "fdjac".
5698
5699  quantile_type: una stringa ("Q6", "Q7" o "Q8"), corrispondente al metodo
5700  usato per calcolare i quantili campionari secondo la classificazione di
5701  Hyndman e Fan (1996). Il default è "Q6".
5702
5703Generazione di numeri casuali
5704
5705  seed: un intero senza segno. Imposta il seme per il generatore di numeri
5706  pseudo-casuali. Di solito il seme viene impostato a partire dall'ora di
5707  sistema, ma se si intende generare sequenze ripetibili di numeri casuali
5708  occorre impostare il seme manualmente.
5709
5710Stima robusta
5711
5712  bootrep: un intero. Imposta il numero di replicazioni per il comando
5713  "restrict" con l'opzione --bootstrap.
5714
5715  garch_vcv: unset, hessian, im (matrice di informazione) , op (matrice dei
5716  prodotti esterni), qml (stimatore QML), bw (Bollerslev-Wooldridge).
5717  Specifica la variante da usare per stimare la matrice di covarianza dei
5718  coefficienti nei modelli GARCH. Se si usa unset (valore predefinito),
5719  viene usata l'Hessiana, a meno di usare l'opzione "robust" col comando
5720  garch, nel qual caso viene usato QML.
5721
5722  arma_vcv: hessian (predefinito) o op (prodotto esterno). Specifica la
5723  variante da usare per calcolare la matrice di covarianza per i modelli
5724  ARIMA.
5725
5726  force_hc: off (predefinito) o on. Lo stimatore HAC viene usato in modo
5727  predefinito con dati serie storiche e quando si usa l'opzione --robust di
5728  ols. Impostando invece force_hc a "on", si forza l'uso della matrice di
5729  covarianza coerente con l'eteroschedasticità (che non tiene conto
5730  dell'autocorrelazione). Si noti che i VAR costituiscono un caso
5731  particolare: con l'opzione --robust il metodo di default è lo HCCM, ma si
5732  può forzare l'uso di uno stimatore HAC con l'opzione --robust-hac.
5733
5734  robust_z: off (the default) or on. This controls the distribution used
5735  when calculating p-values based on robust standard errors in the context
5736  of least-squares estimators. By default gretl uses the Student t
5737  distribution but if robust_z is turned on the normal distribution is used.
5738
5739  hac_lag: nw1 (valore predefinito), nw2, nw3, o un intero. Imposta il
5740  massimo valore di ritardo, o la larghezza di banda, p, usato nel calcolo
5741  degli errori standard HAC (Heteroskedasticity and Autocorrelation
5742  Consistent) con l'approccio Newey-West, per le serie storiche. nw1 e nw2
5743  rappresentano due varianti di calcolo automatico basate sulla dimensione
5744  del campione, T: per nw1, p = 0.75 * T^(1/3), e per nw2, p = 4 *
5745  (T/100)^(2/9). nw3 permette di selezionare la larghezza di banda basandosi
5746  sui dati. Si veda anche qs_bandwidth e hac_prewhiten.
5747
5748  hac_kernel: bartlett (valore predefinito), parzen, o qs (Quadratic
5749  Spectral). Imposta il kernel, o struttura di pesi, usato nel calcolo degli
5750  errori standard HAC.
5751
5752  hac_prewhiten: on o off (valore predefinito). Usa le procedure di
5753  "prewhitening" e "re-coloring" di Andrews-Monahan nel calcolo degli errori
5754  standard HAC. Questo comporta anche la selezione della larghezza di banda
5755  basata sui dati.
5756
5757  hc_version: 0 (valore predefinito), 1, 2, 3 o 3a. Imposta la variante da
5758  usare nel calcolo degli errori standard HAC (Heteroskedasticity and
5759  Autocorrelation Consistent) con dati di tipo cross section. Le prime 4
5760  opzioni corrispondono alle HC0, HC1, HC2 e HC3 discusse da Davidson e
5761  MacKinnon nel capitolo 5 di Econometric Theory and Methods. HC0 produce
5762  quelli che di solito vengono chiamati "errori standard di White". La
5763  variante 3a è la procedura "jackknife" di MacKinnon-White.
5764
5765  pcse: off (impostazione predefinita) o on. Di solito, quando si stima un
5766  modello con pooled OLS su dati panel usando l'opzione --robust, viene
5767  usato lo stimatore di Arellano per la matrice di covarianza. Se si imposta
5768  pcse a "on", verranno usati i Panel Corrected Standard Errors (PCSE) di
5769  Beck e Katz, che non tengono conto dell'autocorrelazione.
5770
5771  qs_bandwidth: larghezza di banda per la stima HAC nel caso in cui si
5772  scelga il kernel "Quadratic Spectral" (a differenza dei kernel Bartlett e
5773  Parzen, la larghezza di banda QS non deve essere necessariamente un
5774  intero).
5775
5776Serie storiche
5777
5778  horizon: un intero (il valore predefinito dipende dalla frequenza dei
5779  dati). Imposta l'orizzonte per le funzioni impulso-risposta e per la
5780  decomposizione della varianza nel contesto delle autoregressioni
5781  vettoriali.
5782
5783  vecm_norm: phillips (valore predefinito), diag, first o none. Usato nel
5784  contesto della stima VECM, attraverso il comando "vecm" per identificare i
5785  vettori di cointegrazione. Si veda la Guida all'uso per i dettagli.
5786
5787Interazione con R
5788
5789  R_lib: on (the default) or off. When sending instructions to be executed
5790  by R, use the R shared library by preference to the R executable, if the
5791  library is available.
5792
5793  R_functions: off (il default) oppure on. Riconosce funzioni di Rcome se
5794  fossero funzioni gretl (premettendo il prefisso "R."). Si veda la guida
5795  all'uso di gretl (il capitolo 44) per dettagli su questo punto e sul
5796  precedente.
5797
5798Varie
5799
5800  mpi_use_smt: on oppure off (default). Questo settaggio influisce sul
5801  numero di processi eseguiti in un blocco mpi presente in uno script. Se è
5802  off, il numero di processi di default è uguale al numero di core fisici
5803  sulla macchina locale; se invece è on, il default sarà dato dal numero
5804  massimo di thread, ossia il doppio dei core fisici se essi supportano lo
5805  standard SMT (Simultaneous MultiThreading, anche noto come
5806  Hyper-Threading). Il settaggio si applica solo al caso in cui l'utente non
5807  ha specificato il numero di processi, n modo diretto o indiretto,
5808  attraverso il file hosts.
5809
5810  graph_theme: una stringa fra altpoints, classic, dark2 (il default
5811  attuale), ethan, iwanthue o sober. Imposta il "tema" ustao per i grafici
5812  prodotti da gretl. Con l'opzione classic si avrà il tema usato fino alla
5813  versione 2020b.
5814
5815# setinfo Dataset
5816
5817Argomento:  nome-variabile
5818Opzioni:    --description=stringa (imposta la descrizione)
5819            --graph-name=stringa (imposta il nome per i grafici)
5820            --discrete (marca la variabile come discreta)
5821            --continuous (marca la variabile come continua)
5822            --coded (mark come codifica)
5823            --numeric (marca come numerica)
5824            --midas (mark come componente di dati ad alta frequenza)
5825Esempi:     setinfo x1 --description "Descrizione di x1"
5826            setinfo y --graph-name="Nome nei grafici"
5827            setinfo z --discrete
5828
5829Se sono usate le opzioni --description o --graph-name l'argomento deve
5830essere una serie singola. Altrimenti, può essere una lista, nel qual caso
5831il comando opera su ognuna delle variabile. Questo comando imposta fino a
5832quattro attributi, come segue.
5833
5834Usando l'opzione --description seguita da una stringa tra virgolette doppie,
5835la stringa verrà usata come etichetta descrittiva per la variabile
5836indicata, che viene mostrata dal comando "labels" e anche nella finestra
5837principale del programma.
5838
5839Usando l'opzione --graph-name seguita da una stringa tra virgolette doppie,
5840la stringa verrà usata nei grafici al posto del nome della variabile.
5841
5842Usando una delle opzioni --discrete o --continuous, viene impostato il
5843carattere numerico della variabile. In modalità predefinita, tutte le
5844variabili sono considerate come continue; marcando una variabile come
5845discreta, essa viene trattata in modo speciale in certi comandi e funzioni,
5846come ad esempio "freq" o "dummify" .
5847
5848Se viene data una fra le opzioni --coded o --numeric,lo stato della serie è
5849impostato di conseguenza. L'impostazione di default è di trattare tutti i
5850valori numerici come tali, per lo meno in un senso ordinale; se una
5851variabile viene impostata come coded, i valori numerici sono considerati una
5852codifica arbitraria di qualche caratteristica qualitativa.
5853
5854L'opzione --midas imposta l'indicazione che una data serie contiene dati a
5855frequenza più alta di quella base del dataset; per esempio, il dataset è
5856trimestrale e la serie contiene valori per il mese 1, 2 o 3 del trimestre.
5857(MIDAS = Mixed Data Sampling.)
5858
5859Accesso dal menù:    /Variabile/Modifica attributi
5860Accesso alternativo: Menù pop-up nella finestra principale
5861
5862# setmiss Dataset
5863
5864Argomenti:  valore [ lista-variabili ]
5865Esempi:     setmiss -1
5866            setmiss 100 x2
5867
5868Imposta il programma in modo da interpretare un dato valore numerico (il
5869primo parametro indicato al comando) come codice per i "valori mancanti" nei
5870dati importati. Se questo valore è l'unico parametro fornito, come nel
5871primo degli esempi precedenti, l'interpretazione verrà applicata a tutte le
5872serie del dataset. Se "valore" è seguito da una lista di variabili,
5873indicate per nome o numero, l'interpretazione è limitata solo alle
5874variabili specificate. Così, nel secondo esempio, il valore 100 è
5875interpretato come codice per "mancante", ma solo per la variabile x2.
5876
5877Accesso dal menù:    /Campione/Imposta codice valori mancanti
5878
5879# setobs Dataset
5880
5881Varianti:   setobs periodicità oss-iniziale
5882            setobs variabile-unità variabile-periodi
5883Opzioni:    --cross-section (interpreta come cross section)
5884            --time-series (interpreta come serie storiche)
5885            --special-time-series (vedi sotto)
5886            --stacked-cross-section (interpreta come panel)
5887            --stacked-time-series (interpreta come panel)
5888            --panel-vars (usa variabili indice (si veda oltre))
5889Esempi:     setobs 4 1990:1 --time-series
5890            setobs 12 1978:03
5891            setobs 1 1 --cross-section
5892            setobs 20 1:1 --stacked-time-series
5893            setobs unita anno --panel-vars
5894
5895Forza il programma a interpretare il dataset in uso secondo la struttura
5896specificata.
5897
5898Nella prima forma del comando, la periodicità, che deve essere un valore
5899intero, nel caso delle serie storiche rappresenta la frequenza delle
5900osservazioni (1 = annuale; 4 = trimestrale; 12 = mensile; 52 = settimanale;
59015, 6, o 7 = giornaliera; 24 = oraria). Nel caso di dati panel, la
5902periodicità è il numero di righe per ogni blocco di dati, ossia il numero
5903di unità cross section se i dati sono organizzati come pila di dati cross
5904section, o il numero di periodi se i dati sono organizzati come pila di
5905serie storiche. Nel caso di semplici dati cross section, la periodicità
5906dev'essere impostata a 1.
5907
5908L'osservazione iniziale rappresenta la data iniziale nel caso delle serie
5909storiche. Gli anni possono essere indicati con due o quattro cifre, mentre i
5910sotto-periodi (ad esempio i trimestri o i mesi) devono essere separati dagli
5911anni con un carattere "due punti". Nel caso di dati panel, l'osservazione
5912iniziale va indicata come 1:1, mentre nel caso di dati cross section come 1.
5913L'osservazione iniziale per i dati giornalieri o settimanali va indicata
5914nella forma AA/MM/GG o AAAA/MM/GG (oppure semplicemente 1 per i dati non
5915datati).
5916
5917Alcune periodicità temporali hanno interpretazioni convenzionali; ad
5918esempio, 12 = mensile e 4 = trimestrale. Se questa interpretazione non si
5919applica alle vostre serie storiche,si può usare l'opzione
5920--special-time-series. In tal caso, gretl si asterrà dall'indicare come (ad
5921esempio) mensile una periodicità pari a 12.
5922
5923Se non viene data alcuna opzione esplicita per indicare la struttura dei
5924dati, il programma tenterà di desumerla dalle informazioni in suo possesso.
5925
5926La seconda forma del comando (che richiede l'uso dell'opzione --panel-vars)
5927può essere usata per imporre un'interpretazione panel dei dati, quando il
5928dataset contiene variabili che identificano in modo univoco le unità cross
5929section e i periodi. Il dataset verrà ordinato come pila di serie storiche,
5930per valori crescenti della variabile che rappresenta le unità,
5931variabile-unità.
5932
5933Opzioni specifiche per dati panel
5934
5935Le opzioni --panel-time e --panel-groups possono essere usate solo con
5936dataset già impostati come panel.
5937
5938La funzione di --panel-time è di stabilire informazioni extra sulla
5939dimesnione temporale del panel. Essa deve essere indicata sul modello della
5940proma forma di setobs (vedi sopra). Ad esempio, il compando seguente indica
5941che la dimensione temporale del panel è trimestrale, e comincia nel primo
5942trimestre 1990.
5943
5944  setobs 4 1990:1 --panel-time
5945
5946La funzione di --panel-groups è di creare una serie con valori stringa
5947contentent i nomi delle unità longitudinal inel panel. (Quest'informazione
5948verrà, eventualmente, usata nei grafici.) Con quest'opzione vanno indicati
5949uno o due argomenti, come segue.
5950
5951Caso uno: l'unico argomento è il nome di una serie a valori stringa. Se il
5952numero di stringhe diverse eguaglia il numero di unità nel panel, allora
5953questi vengono usati come nomi dei gruppi. Se necessario, il contenuto
5954numerico della serie sarà aggiustato per far sì che i valori siano tutti 1
5955per la prima unità, 2 per la seconda eccetera. Se il numero di valori
5956stringa non corrisponde a quello delle unità, il programma segnala un
5957errore.
5958
5959Caso due: il primo argomento è il nome di una serie e il secondo è una
5960stringa (o il nome di una variabile stringa) con etichette per ciascuna
5961unità. Se la serie non esiste, verrà creata al momento. Nel secondo
5962argomento, i nomi delle unità vanno separati da spazi; se il nome stesso
5963include degli spazi, allora va racchiuso fra virgolette doppie. Se no, il
5964secondo argomento può essere un array di stringhe.
5965
5966Ad esempio, il codice seguente creerò una serie di nome paese in cui i nomi
5967npaesi sono ripetuti ognuno T volte, dove T è l'ampiezza temporale del
5968panel.
5969
5970  string npaesi = sprintf("Francia Germania Italia \"Regno Unito\"")
5971  setobs paese npaesi --panel-groups
5972
5973Accesso dal menù:    Dati/Struttura dataset
5974
5975# setopt Programming
5976
5977Argomenti:  command [ action ] options
5978Esempi:     setopt mle --hessian
5979            setopt ols persist --quiet
5980            setopt ols clear
5981
5982Questo comando abilita la preselezione di opzioni per un dato comando. Di
5983solito questo non è necessario, ma potrebbe essere utile per chi scrive
5984funzioni in hansl, quando certe opzioni devono essere rese condizionali a un
5985argomento fornito dal livello chiamante.
5986
5987Ad esempio, se una funnzione prevede un argomento booleano "quiet", il cui
5988effetto è sopprimere la stampa dei risultati di una regressione eseguita
5989dentro la funzione, si può usare "setopt" come segue:
5990
5991      if quiet
5992      setopt ols --quiet
5993      endif
5994      ols ...
5995
5996L'opzione --quiet verrà applicata al comando ols seguente se e solo se la
5997variabile quiet è non-zero.
5998
5999Di default, le opzioni specificate in questo modo si applicano solo alla
6000prima invocazione del comando a cui si riferiscono; non sono persistenti.
6001Tuttavia, usando persist come valore per action, le opzioni scelte saranno
6002attive fino a nuovo ordine. L'antidoto a persist è clear, che ha l'effetto
6003di cancellare tutte le opzioni stabilite in precedenza.
6004
6005Si noti che le opzioni fissate con setopt si sommano a qualsiasi altra
6006opzione data al comando direttamente. Per esempio, si può dare l'opzione
6007--hessian a un comando mle incondizionatamente e allo stesso tempo usare
6008setopt per aggiungere --quiet condizionalmente.
6009
6010# shell Utilities
6011
6012Argomento:  comando-shell
6013Esempi:     ! ls -al
6014            ! notepad
6015            launch notepad
6016
6017Un "!", o la parola chiave "launch", all'inizio di una riga di comando è
6018interpretato come passaggio all'interprete di comandi (shell) usato
6019dall'utente nel sistema operativo. In questo modo è possibile eseguire
6020comandi shell arbitrari dall'interno di gretl. Quando si usa "!", il comando
6021esterno viene eseguito in modalità sincrona, ossia gretl aspetta il termine
6022della sua esecuzione prima di procedere. Se invece si vuole avviare un altro
6023programma da dentro gretl senza aspettare che abbia completato la sua
6024esecuzione (modalità asincrona), occorre usare "launch".
6025
6026Per motivi di sicurezza, questa funzionalità è disabilitata in modalità
6027predefinita. Per attivarla, occorre selezionare la casella "Abilita comandi
6028shell" nel menù File, Preferenze. In questo modo si renderanno disponibili
6029i comandi shell anche nella modalità a riga di comando di gretl (questo è
6030l'unico modo per farlo).
6031
6032# smpl Dataset
6033
6034Varianti:   smpl oss-iniziale oss-finale
6035            smpl +i -j
6036            smpl variabile-dummy --dummy
6037            smpl condizione --restrict
6038            smpl --no-missing [ lista-variabili ]
6039            smpl --no-all-missing [ lista-variabili ]
6040            smpl --contiguous [ lista-variabili ]
6041            smpl n --random
6042            smpl full
6043Opzioni:    --dummy (l'argomento è una variabile dummy)
6044            --restrict (applica una restrizione booleana)
6045            --replace (rimpiazza tutte le restrizioni booleane preesistenti)
6046            --no-missing (restringi il campione alle osservazioni valide)
6047            --no-all-missing (ometti le osservazioni vuote (vedi oltre))
6048            --contiguous (vedi oltre)
6049            --random (forma un sottocampione casuale)
6050            --permanent (vedi oltre)
6051            --balanced (dati panel: mantieni, ove possibile, un campione bilanciato)
6052Esempi:     smpl 3 10
6053            smpl 1960:2 1982:4
6054            smpl +1 -1
6055            smpl x > 3000 --restrict
6056            smpl y > 3000 --restrict --replace
6057            smpl 100 --random
6058
6059Reimposta l'intervallo del campione. Il nuovo intervallo può essere
6060definito in vari modi. Nel primo modo (corrispondente ai primi due esempi
6061precedenti) oss-iniziale e oss-finale devono essere coerenti con la
6062periodicità dei dati. Una delle due può essere sostituita da un punto e
6063virgola per lasciare intatto il valore attuale. Nel secondo modo, gli interi
6064i e j (che possono essere positivi o negativi e vanno indicati con il segno)
6065sono presi come spostamenti relativi ai punti iniziale e finale del campione
6066in uso. Nel terzo modo, variabile-dummy deve essere una variabile
6067indicatrice che assume solo valori 0 o 1 e il campione verrà ristretto alle
6068osservazioni per cui la variabile dummy vale 1. Il quarto modo, che usa
6069--restrict, limita il campione alle osservazioni che soddisfano la
6070condizione Booleana specificata secondo la sintassi del comando "genr".
6071
6072Le opzioni no-missing e no-all-missing possono essere usate per escludere
6073dal campione dati mancanti. La prima variante esclude le osservazioni in cui
6074almeno una variabile è mancante, mentre la seconda esclude solo le
6075osservazioni per cui tutte le variabili hanno valori validi (non mancanti).
6076In ambedue i casi, il test è limitato alle variabili in lista-variabili se
6077l'opzione ha un argomento; se no, viene applicato a tutte le serie nel
6078dataset; a parte che nel caso --no-all-missing senza un'esplicita
6079lista-variabili, le variaili generiche index e time vengono ignorate.
6080
6081La forma --contiguous viene usata nei dataset di serie storiche. L'effetto
6082è quello di tagliare il campione all'inizio e alla fine finché vengano
6083trovate osservazioni con valori mancanti (per la lista specificata, o per
6084tutte le serie se lista-variabili non è specificata). Dopodiché viene
6085effettuato un controllo per vedere se nel sottocampione risultante rimangono
6086valori mancanti, nel qual caso, viene segnalato un errore.
6087
6088Con la forma --random, viene estratto casualmente dal dataset il numero
6089indicato di osservazioni. Per essere in grado di replicare questa selezione,
6090occorre per prima cosa impostare il seme del generatore di numeri casuali
6091(si veda il comando "set").
6092
6093La forma finale, smpl full, ripristina l'intervallo completo del campione.
6094
6095Si noti che i vincoli sul campione di solito sono cumulativi: il valore di
6096riferimento di ogni comando smpl è il campione attuale, così che ogni
6097vincolo si aggiunge a quelli già impostati. Se si vuole che il comando
6098funzioni sostituendo i vincoli esistenti, occorre usare l'opzione --replace
6099alla fine del comando.
6100
6101La variabile interna obs può essere usata con la forma --restrict di smpl
6102per escludere particolari osservazioni dal campione. Ad esempio,
6103
6104	    smpl obs!=4 --restrict
6105
6106scarterà la quarta osservazione. Se le osservazioni sono identificate da
6107etichette,
6108
6109            smpl obs!="USA" --restrict
6110
6111scarterà l'osservazione a cui è associata l'etichetta "USA".
6112
6113Per le forme --dummy, --restrict e --no-missing di smpl, occore tenere
6114presente che tutte le informazioni "strutturali" contenute nel file dei dati
6115(a proposito della struttura di serie storiche o di panel dei dati) vengono
6116perse. È possibile reimpostare la struttura originale con il comando
6117"setobs". Un'opzione rilevante, per l'uso coi dati panel, è l'opzione
6118--balanced: quest'opzione serve a fare in modo che vengsa ricostituito un
6119campione bilanciato dopo il sottocampionamento, per mezzo dell'inserimento
6120di "righe mancanti" se necessario. Si noti, tuttavia, che non sempre è
6121possibile onorare questa richiesta.
6122
6123Di default, le restrizioni sul campione attivo sono reversibili: col comando
6124smpl full si ritorna al dataset completo. Tuttavia, con l'opzione
6125--permanent il dataset ridotto rimpiazza quello originale. Quest'opzione è
6126disponibile per le opzioni --restrict, --dummy, --no-missing,
6127--no-all-missing o --random.
6128
6129Si veda la guida all'uso di gretl (il capitolo 5) per ulteriori dettagli.
6130
6131Accesso dal menù:    /Campione
6132
6133# spearman Statistics
6134
6135Argomenti:  x y
6136Opzione:    --verbose (mostra i dati ordinati)
6137
6138Mostra il coefficiente di correlazione di rango di Spearman per le variabili
6139x e y. Le variabili non devono essere state ordinate manualmente in
6140precedenza, se ne occupa la funzione.
6141
6142L'ordinamento automatico è dal massimo al minimo (ossia il valore massimo
6143nei dati assume il rango 1). Se occorre invertire l'ordinamento, creare una
6144variabile che è il negativo della variabile originale, ad esempio:
6145
6146      genr altx = -x
6147      spearman altx y
6148
6149Accesso dal menù:    /Modello/Stima robusta/SPEARMAN - Correlazione di rango
6150
6151# sprintf Printing
6152
6153Questo comando è obsoleto: al suo posto, usare la funzione "sprintf".
6154
6155# square Transformations
6156
6157Argomento:  lista-variabili
6158Opzione:    --cross (genera anche i prodotti incrociati, oltre ai quadrati)
6159
6160Genera nuove variabili che sono i quadrati delle variabili nella
6161lista-variabili (con anche i prodotti incrociati, se si usa l'opzione
6162--cross). Ad esempio, "square x y" genera sq_x = x al quadrato, sq_y = y al
6163quadrato e (opzionalmente) x_y = x per y. Se una particolare variabile è
6164una dummy, non ne viene fatto il quadrato, visto che si otterrebbe la stessa
6165variabile.
6166
6167Accesso dal menù:    /Aggiungi/Quadrati delle variabili selezionate
6168
6169# stdize Transformations
6170
6171Argomento:  varlist
6172Opzioni:    --no-df-corr (non effettua correzioni per gradi di libertà)
6173            --center-only (non divide per lo sqm)
6174
6175Per impostazione predefinita, questo comando aggiunge al dataset come nuove
6176serie la versione standardizzata di quelle originali, col prefisso s_. Ad
6177esempio, "stdize x y" crea le nuove serie s_x e s_y, s_x ognuna delle quali
6178viene formata sottraendo la rispettiva media, dopodiché il risultato viene
6179diviso per il suo scarto quadratico medio (con una correzione per gradi di
6180libertà pari a 1).
6181
6182Con l'opzione --no-df-corr non si ha la correzione per gradi di libertà, e
6183si usa il cosiddetto stimatore ML. Con l'opzione --center-only verranno
6184prodotte serie che sono soltanto centrate (la media viene sottratta ma i
6185dati non vengono scalati). In questo caso, il prefisso sarà c_ anziché s_.
6186
6187La funzione "stdize" produce lo stesso risultato, ma la sua sintassi è un
6188po' più flessibile.
6189
6190Accesso dal menù:    /Aggiungi/Standardizza le variabili selezionate
6191
6192# store Dataset
6193
6194Argomenti:  file-dati [ lista-variabili ]
6195Opzioni:    --omit-obs (si veda oltre, a proposito del formato CSV)
6196            --no-header (si veda oltre, a proposito del formato CSV)
6197            --gnu-octave (usa il formato GNU Octave)
6198            --gnu-R (usa il formato GNU R)
6199            --gzipped[=livello] (comprime con gzip)
6200            --jmulti (usa il formato ASCII di JMulti)
6201            --dat (usa il formato ASCII di PcGive)
6202            --decimal-comma (usa la virgola come separatore decimale)
6203            --database (usa il formato database di gretl)
6204            --overwrite (cfr oltre, a proposito del formato dei database)
6205            --comment=string (vedi sotto)
6206            --matrix=nome-matrice (vedi sotto)
6207            --compat (compatibilità gdtb, vedi sotto)
6208
6209Salva i dati nel file filename. Per default, vengono salvate tutte le serie
6210attualmente definite, ma usando l'argomento opzionale varlist è possibile
6211salvarne solo una parte. Se il dataset è sottocampionato, verranno salvate
6212solo le osservazioni attualmente attive.
6213
6214Il file di output verrà scritto nella directory corrispondente al valore
6215corrente di "workdir", a meno che il nome di file contenga un percorso
6216completo.
6217
6218Il comando store funziona in modo speciale se è compreso in un "progressive
6219loop". Vedi la guida all'uso di gretl (il capitolo 13) per dettagli.
6220
6221Formati nativi
6222
6223Se file-dati ha estensione .gdt o .gtdb, il salvataggio avverrà in uno dei
6224formati nativi di gretl. Se non viene specificata alcuna estensione, si dà
6225.gdt come scelta implicita e il suffisso viene aggiunto automaticamente. Il
6226formato gdt è XML, con compressione gzip opzionale, mentre il formato gdtb
6227è binario. Il primo è la scelta tipica per dati di dimensione moderata
6228(fino a qualche centinaio di kilobyte); per dataset grandi, il formato
6229binario è molto più efficiente.
6230
6231A partire dalla versione 2021a, il formato gdtb è stato modificato in modo
6232da velocizzare la lettura e scrittura di file molto grandi. Per salvare col
6233vecchio formato, così che il file sia leggibile con versioni precedenti di
6234gretl, si deve usare l'opzione --compat.
6235
6236Quando si salva in formato nativo, l'opzione --gzipped abilita la
6237compressione, cosa che può essere utile per grandi dataset. Pewr questa
6238opzione, il parametro opzione controla il livello di compressione (da 0 a
62399): livelli più alti producono file più piccoli, ma in tempi più lunghi.
6240Il valore di default è 1; col livello 0 non c'è alcuna compressione.
6241
6242Altri formati
6243
6244Il formato in cui i dati vengono salvati è controllato, in primo luogo
6245dall'estensione di filename, come segue:
6246
6247  .csv: testo separato da virgole (CSV).
6248
6249  .txt o .asc: testo separato da spazi.
6250
6251  .m: formato GNU Octave.
6252
6253  .dta: formato Stata (version 113).
6254
6255Le opzioni di formato mostrate sopra possono essere usate per forzare un
6256certo formato indipendentemente dall'estensione data al file, o per generare
6257un file di formato PcGive o JMulTi
6258
6259Le opzioni --omit-obs e --no-header sono applicabile solo quando si salvano
6260dati in formato CSV. In modalità predefinita, se i dati sono serie storiche
6261o panel, o se il dataset include marcatori per osservazioni specifiche, il
6262file CSV comprende una prima colonna che identifica le osservazioni (ad
6263esempio per data). Se si usa --omit-obs, questa colonna verrà omessa e
6264verranno salvati solo i dati effettivi. L'opzione --no-header fa sì che
6265venga omessa la stampa dei nomi di variabile in cima al file.
6266
6267L'opzione --decimal-comma è anch'essa specifica al salvgataggio in formato
6268CSV, e fa sì che venga usata la virgola come separatore decimale e il punto
6269e virgola come separatore di campo.
6270
6271Salvataggio in formato database
6272
6273L'opzione di salvataggio in formato database di gretl è indicata se occorre
6274costruire dei grandi dataset di serie, magari con frequenze diverse e
6275diversi intervalli di osservazioni. Al momento questa opzione è disponibile
6276solo per dati annuali, trimestrali o mensili. Salvando su un file che esiste
6277già, il comportamento predefinito è quello di accodare le nuove serie al
6278contenuto del database preesistente. In questo contesto, se una o più delle
6279variabili da salvare hanno lo stesso nome di una delle variabili già
6280presenti nel database si otterrà un messaggio di errore. L'opzione
6281--overwrite permette invece di sovrascrivere eventuali variabili del dataset
6282che hanno lo stesso nome delle nuove variabili, in modo che queste ultime
6283rimpiazzino le variabili preesistenti.
6284
6285L'opzione --comment è disponibile quando si salva come database o come CSV.
6286Il parametro richiesto consta du una linea, racchiusa da virgolette doppie,
6287passata all'opzone dopo un segno di uguale. Tale stringa verrà inserita
6288come commento nel file indice del database o all'inizio del file CSV.
6289
6290Salvare una matrice come dataset
6291
6292L'opzione --matrix richiede, come parametro, il nome di una matrice non
6293vuota. L'effetto del comando store sarà quello di trasformare la matrice in
6294un dataset "dietro le quinte" e salvarlo su file come tale. Le colonne della
6295matrice diventano serie, e i loro nomi sono dati dai nomi di colonn, se
6296presenti; altrimenti, saranno dati da v1, v2 e così via. Se la matrice ha
6297nomi di riga, questi verranno convertiti in "etichette di osservazione".
6298
6299Si noti che la funzione "mwrite" permette di salvare su file matrici in
6300quanto tali, ma a volte può essere più utile salvarle come dataset.
6301
6302Accesso dal menù:    /File/Salva dati; /File/Esporta dati
6303
6304# summary Statistics
6305
6306Varianti:   summary [ lista ]
6307            summary --matrix=nomematrice
6308Opzioni:    --simple (solo statistiche di base)
6309            --weight=wvar (variabile peso)
6310            --by=byvar (vedi sotto)
6311Esempi:     frontier.inp
6312
6313Nella prima forma, mostra le statistiche descrittive per le variabili nella
6314lista-variabili, o per tutte le variabili nel dataset, se non si indica una
6315lista-variabili. L'output comprende media, scarto quadratico medio,
6316coefficiente di variazione (= scarto quadratico medio / media), mediana,
6317minimo, massimo, coefficiente di asimmetria, curtosi in eccesso. Dando
6318l'opzione --simple, si avranno soltanto media, minimo, massimo e scarto
6319quadratico medio.
6320
6321L'opzione --by (dove il parametro byvar dev'essere il nome di una variabile
6322discreta), provoca la stampa delle statistiche per sottocampioni definiti
6323dai diversi valori di byvar. Ad esempio, se byvar è una variabile binaria
6324(dummy), verranno riportate separatamente le statistiche relative ai
6325sottocampioni definitia dai due casi byvar = 0 e byvar = 1. Nota: al
6326momento, questa opzione è incompatibile con l'altra opzione --weight.
6327
6328Se si usa la forma alternativa in cui il parametro è una matrice, allora le
6329statistiche descrittive sono calcolate per le colonne della matrice.
6330L'opzione --by non è disponibile per questo caso.
6331
6332La tavola prodotta dal comando summary è disponibile sotto forma di matrice
6333con l'accessore "$result".
6334
6335Accesso dal menù:    /Visualizza/Statistiche descrittive
6336Accesso alternativo: Menù pop-up nella finestra principale
6337
6338# system Estimation
6339
6340Varianti:   system method=stimatore
6341            nome-sistema <- system
6342Esempi:     "Klein Model 1" <- system
6343            system method=sur
6344            system method=3sls
6345            Vedi anche klein.inp, kmenta.inp, greene14_2.inp
6346
6347Inizia un sistema di equazioni. Esistono due versioni del comando, a seconda
6348che si voglia salvare il sistema per poterlo stimare in più modi diversi,
6349oppure stimare il sistema una volta sola.
6350
6351Per salvare il sistema occorre dargli un nome, come nel primo esempio
6352proposto (se il nome contiene spazi, occorre racchiuderlo tra virgolette).
6353In questo caso, è possibile stimare il sistema con il comando "estimate".
6354Una volta che il sistema è stato salvato, è possibile imporre dei vincoli
6355su di esso (compresi vincoli incrociati tra equazioni) usando il comando
6356"restrict".
6357
6358In alternativa, è possibile indicare uno stimatore per il sistema usando
6359method= seguito da una stringa che identifica uno degli stimatori
6360supportati: "ols" (ordinary least squares - minimi quadrati ordinari),
6361"tsls" (two-stage least squares - minimi quadrati a due stadi), "sur"
6362(seemingly unrelated regressions - regressioni apparentemente non
6363collegate), "3sls" (three-stage least squares - minimi quadrati a tre
6364stadi), "fiml" (full information maximum likelihood - massima
6365verosimiglianza con informazione completa) o "liml" (limited information
6366maximum likelihood - massima verosimiglianza con informazione limitata). In
6367questo caso, il sistema viene stimato appena completata la sua definizione.
6368
6369Un sistema di equazioni termina con la riga "end system". All'interno del
6370sistema possono essere definiti i quattro tipi di istruzioni seguenti.
6371
6372  "equation": specifica un'equazione del sistema. Occorre indicarne almeno
6373  due.
6374
6375  "instr": per i sistemi da stimare con i minimi quadrati a tre stadi,
6376  indica la lista degli strumenti (indicati dal nome o dal numero della
6377  variabile). In alternativa, è possibile fornire questa informazione nella
6378  riga "equation" usando la stessa sintassi accettata dal comando "tsls".
6379
6380  "endog": per i sistemi di equazioni simultanee, indica la lista delle
6381  variabili endogene. È indicato principalmente per la stima FIML, ma può
6382  essere usato anche nella stima minimi quadrati a tre stadi al posto
6383  dell'istruzione "instr": in questo modo tutte le variabili non
6384  identificate come endogene verranno usate come strumenti.
6385
6386  "identity": per la stima FIML, un'identità che collega due o più
6387  variabili del sistema. Questo tipo di istruzione è ignorata se viene
6388  usato uno stimatore diverso da FIML.
6389
6390Dopo la stima eseguita con i comandi "system" o "estimate" è possibile
6391recuperare informazioni aggiuntive dalle seguenti variabili accessorie:
6392
6393  "$uhat": la matrice dei residui, una colonna per equazione.
6394
6395  "$yhat": la matrice dei valori stimati, una colonna per equazione.
6396
6397  "$coeff": il vettore colonna dei coefficienti (tutti i coefficienti della
6398  prima equazione, seguiti da quelli della seconda equazione, e così via).
6399
6400  "$vcv": la matrice di covarianza dei coefficienti. Se il vettore "$coeff"
6401  ha k elementi, questa matrice ha dimensione k per k.
6402
6403  "$sigma": la matrice di covarianza dei residui incrociata tra equazioni.
6404
6405  "$sysGamma", "$sysA" e "$sysB": matrici dei coefficienti in forma
6406  strutturale (si veda oltre).
6407
6408Se si vuole salvare i residui o i valori stimati per una specifica equazione
6409come serie di dati, basta selezionare la colonna dalla matrice "$uhat" o
6410"$yhat" e assegnarla a una serie, come in
6411
6412	series uh1 = $uhat[,1]
6413
6414Le matrici in forma strutturale corrispondono alla seguente rappresentazione
6415di un modello ad equazioni simultanee:
6416
6417  Gamma y(t) = A y(t-1) + B x(t) + e(t)
6418
6419Se ci sono n variabili endogene e k variabili esogene, Gamma è una matrice
6420n x n e B è n x k. Se il sistema non contiene ritardi delle variabili
6421endogene, la matrice A non è presente. Se il massimo ritardo di un
6422regressore endogeno è p, la matrice A è n x np.
6423
6424Accesso dal menù:    /Modello/Equazioni simultanee
6425
6426# tabprint Printing
6427
6428Opzioni:    --format="f1|f2|f3|f4" (Specifica un formato personalizzato)
6429            --output=filename (invia l'output al file specificato)
6430
6431Va eseguito dopo la stima di un modello. Stampa il modello stimato sotto
6432forma di tabella, in formato LaTeX o in formato RTF o CSV, se viene usata
6433l'opzione corrispondente. Se viene specificato un nome di file dopo
6434l'opzione --output, l'output viene scritto nel file, altrimenti viene
6435scritto in un file col nome model_N.tex (o model_N.rtf), dove N è il numero
6436dei modelli stimati finora nella sessione in corso.
6437
6438Il file di output verrà scritto nella directory corrispondente al valore
6439corrente di "workdir", a meno che il nome di file contenga un percorso
6440completo.
6441
6442Selezionando il formato CSV, i valori sono separati da virgole, a meno che
6443il delimitatore decimale non sia esso stesso la virgola, nel qual caso viene
6444usato il punto e virgola. Si noti che l'output in CSV potrebbe essere meno
6445completo degli altri formati.
6446
6447Le opzioni illustrate di seguito sono disponibili solo per il formato LaTeX.
6448
6449Usando l'opzione --complete, il file LaTeX è un documento completo, pronto
6450per essere processato; altrimenti il file va incluso in un documento.
6451
6452Se si intende modificare lo stile del formato tabulare, è possibile
6453specificare un formato personalizzato usando l'opzione --format, seguita da
6454una stringa di formato. La stringa di formato va inclusa tra virgolette
6455doppie e deve essere unita all'opzione con un segno di uguale. La
6456composizione della stringa di formato è la seguente: ci sono quattro campi,
6457che rappresentano il coefficiente, l'errore standard, il rapporto t e il
6458p-value. Questi campi vanno separati usando barre verticali e possono
6459contenere una specificazione di formato per valori numerici nello stile
6460della funzione printf, oppure possono essere lasciati in bianco, in modo da
6461sopprimere la visualizzazione del campo nella rispettiva colonna dela
6462tabella (con l'unico vincolo che non è possibile lasciare in bianco tutti i
6463campi). Ecco alcuni esempi:
6464
6465      --format="%.4f|%.4f|%.4f|%.4f"
6466      --format="%.4f|%.4f|%.3f|"
6467      --format="%.5f|%.4f||%.4f"
6468      --format="%.8g|%.8g||%.4f"
6469
6470La prima specificazione stampa i valori di tutte le colonne usando 4 cifre
6471decimali. La seconda sopprime il p-value e mostra il rapporto t con 3 cifre
6472decimali. La terza omette il rapporto t, mentre l'ultima omette il rapporto
6473t e mostra sia il coefficiente che l'errore standard con 8 cifre
6474significative.
6475
6476Una volta che si imposta un formato in questo modo, esso viene ricordato e
6477usato per tutta la sessione di lavoro. Per tornare ad usare il formato
6478predefinito, basta usare la parola chiave --format=default.
6479
6480Accesso dal menù:    Finestra del modello, /LaTeX
6481
6482# textplot Graphs
6483
6484Argomento:  lista-variabili
6485Opzioni:    --time-series (disegna per osservazione)
6486            --one-scale (forza l'uso di un'unica scala)
6487            --tall (usa 40 linee)
6488
6489Grafica ASCII nuda e cruda. Senza l'opzione --time-series, varlist deve
6490contenere almeno due serie, l'ultima delle quali va sull'asse delle ascisse,
6491e verrà prodotto un diagramma a dispersione. In questo caso, si può usare
6492l'opzione --tall per produrre un grafico in cui l'asse y è rappresentato da
649340 righe di caratteri (il default è 20 righe).
6494
6495Con l'opzione --time-series, viene prodotto un grafico per osservazione. In
6496questo caso, l'opzione --one-scale forza l'uso di una scala singola;
6497altrimenti, se varlist contiene più di una serie i dati potrebbero essere
6498riscalati. Ogni riga rappresenta un'osservazione, con i dati disegnati
6499orizzontalmente.
6500
6501Vedi anche "gnuplot".
6502
6503# tobit Estimation
6504
6505Argomenti:  variabile-dipendente variabili-indipendenti
6506Opzioni:    --llimit=lval (specifica il limite sinistro)
6507            --rlimit=rval (specifica il limite destro)
6508            --vcv (mostra la matrice di covarianza)
6509            --robust (standard error robusti)
6510            --opg (vedi sotto)
6511            --cluster=clustvar (vedi "logit" per una spiegazione)
6512            --verbose (mostra i dettagli delle iterazioni)
6513
6514Stima un modello Tobit. Il modello può essere appropriato quando la
6515variabile dipendente è "censurata". Ad esempio, vengono osservati valori
6516positivi o nulli della spesa dei consumatori per beni durevoli, ma non
6517valori negativi; tuttavia le decisioni di spesa possono essere pensate come
6518derivanti da una propensione al consumo, sottostante e non osservata, che
6519può anche essere negativa in alcuni casi.
6520
6521Si assume, di default, che la variabile dipendente si censurata a 0 sulla
6522sinistra e non censurata a destra. Tuttavia, usando le opzioni --llimit e
6523--rlimit si può specificare uno schema di censura diverso. Se si specifica
6524soltanto un limite destro, si assume che la variabile dipendente sia non
6525limitata a sinistra.
6526
6527Il modello Tobit è un caso particolare della regressione ad intervallo. Si
6528veda la documentazione del comando "intreg" per una descrizione delle
6529opzioni --robust e --opg.
6530
6531Accesso dal menù:    /Modello/Modelli non lineari/Tobit
6532
6533# tsls Estimation
6534
6535Argomenti:  variabile-dipendente variabili-indipendenti ; strumenti
6536Opzioni:    --no-tests (omette i test diagnostici)
6537            --vcv (mostra la matrice di covarianza)
6538            --quiet (non stampare i risultati)
6539            --no-df-corr (omette la correzione per gradi di libertà)
6540            --robust (errori standard robusti)
6541            --cluster=clustvar (standard error clusterizzati)
6542            --liml (usa massima verosimiglianza a informazione limitata)
6543            --gmm (usa il metodo generalizzato dei momenti)
6544Esempi:     tsls y1 0 y2 y3 x1 x2 ; 0 x1 x2 x3 x4 x5 x6
6545            Vedi anche penngrow.inp
6546
6547Calcola le stime con variabili strumentali, per impostazione predefinita
6548usando i minimi quadrati a due stadi (TSLS), ma è possibile scegliere altre
6549opzioni. Occorre specificare la variabile-dipendente, la lista di
6550variabili-indipendenti (che si intende includere alcuni regressori
6551endogeni), e infine gli strumenti, la lista completa delle variabili esogene
6552e predeterminate. Se la lista degli strumenti non è lunga almeno quanto
6553quella delle variabili-indipendenti, il modello non è identificato.
6554
6555Nell'esempio precedente, le y sono le variabili endogene e le x sono le
6556variabili esogene e predeterminate. Si noti che eventuali regressori esogeni
6557devono essere inclusi in entrambe le liste.
6558
6559L'output delle stime TSLS comprende il test di Hausman e, se il modello è
6560sovra-identificato, il test di Sargan per la sovra-identificazione. Nel test
6561di Hausman, l'ipotesi nulla è che le stime OLS siano consistenti, o in
6562altre parole che non sia richiesta la stima per mezzo di variabili
6563strumentali. Un modello di questo tipo è sovra-identificato se ci sono più
6564strumenti di quelli strettamente necessari. Il test di Sargan è basato su
6565una regressione ausiliaria dei residui del modello minimi quadrati a due
6566stadi sull'intera lista degli strumenti. L'ipotesi nulla è che tutti gli
6567strumenti siano validi, cosa di cui si dovrebbe dubitare se la regressione
6568ausiliaria ha un significativo potere esplicativo. Davidson e MacKinnon
6569(2004) al capitolo 8 forniscono un'eccellente spiegazione di entrambi i
6570test.
6571
6572Per gli stimatori TSLS e LIML, viene mostrata una statistica aggiuntiva se
6573il modello è stimato senza l'opzione --robust, che riguarda la presenza di
6574strumenti deboli. Con sttrumenti deboli, possono esserci seri problemi
6575inferenziali: stime distorte e/o livelli di significatività sbagliati per
6576le statistiche test basate sulla matrice di covarianze, con tassi di rifiuto
6577ben più grandi del livello di significatività nominale (Stock, Wright and
6578Yogo, 2002). La statistica è la F di primo stadio se il modello contiene un
6579solo regressore endogeno, o il più piccolo autovalore della matrice
6580corrispondente in caso contrario. Quando disponibili, sono mostrati i valori
6581critici derivati dall'analisi di Monte Carlo contenuta in Stock e Yogo
6582(2003).
6583
6584Il valore R-quadro mostrato i modelli stimati con i minimi quadrati a due
6585stadi è il quadrato della correlazione tra la variabile dipendente e i
6586valori stimati.
6587
6588Per dettagli sull'effetto delle opzioni --robust e --cluster si veda la
6589documentazione per il comando "ols".
6590
6591In alternativa al metodo TSLS, il modello può essere stimato usando la
6592massima verosimiglianza a informazione limitata (opzione --liml) o il metodo
6593generalizzato dei momenti (opzione --gmm). Si noti che se il modello è
6594esattamente identificato, questi metodi dovrebbero produrre gli stessi
6595risultati del metodo TSLS, ma se il modello è sovraidentificato, i
6596risultati saranno in genere diversi.
6597
6598Se si usa la stima GMM, è possibile usare le seguenti opzioni aggiuntive:
6599
6600  --two-step: esegue la stima GMM in due passi, invece che in un passo solo.
6601
6602  --iterate: itera il GMM fino alla convergenza.
6603
6604  --weights=Pesi: specifica una matrice quadrata di pesi da usare nel
6605  calcolo della funzione criterio del GMM. La dimensione di questa matrice
6606  deve essere pari al numero di strumenti. L'impostazione predefinita
6607  consiste nell'usare una matrice identità di dimensione opportuna.
6608
6609Accesso dal menù:    /Modello/TSLS - Minimi quadrati a due stadi
6610
6611# var Estimation
6612
6613Argomenti:  ordine lista-variabili [ ; lista-esogene ]
6614Opzioni:    --nc (non include una costante)
6615            --trend (include un trend)
6616            --seasonals (include variabili dummy stagionali)
6617            --robust (errori standard robusti)
6618            --robust-hac (errori standard HAC)
6619            --quiet (omette l'output delle singole equazioni)
6620            --silent (non stampa nulla)
6621            --impulse-responses (mostra le risposte di impulse)
6622            --variance-decomp (mostra scomposizioni della varianza)
6623            --lagselect (mostra i criteri di informazione per la selezione dei ritardi)
6624            --minlag=ritardo minimo (solo per la selezione dei ritardi, vedi sotto)
6625Esempi:     var 4 x1 x2 x3 ; time mydum
6626            var 4 x1 x2 x3 --seasonals
6627            var 12 x1 x2 x3 --lagselect
6628            Vedi anche sw_ch14.inp
6629
6630Imposta e stima (usando OLS) un'autoregressione vettoriale (VAR). Il primo
6631argomento specifica l'ordine di ritardo (o il massimo ordine di ritardi se
6632è stata usata l'opzione --lagselect). L'ordine può essere indicato
6633numericamente o con il nome di una variabile scalare preesistente. Quindi
6634segue l'impostazione della prima equazione. Non occorre includere i ritardi
6635tra gli elementi della lista-variabili: verranno aggiunti automaticamente.
6636Il punto e virgola separa le variabili stocastiche, per cui verrà incluso
6637un numero di ritardi pari a ordine, dai termini deterministici o esogeni
6638presenti nella lista-esogene. Si noti che viene inclusa automaticamente una
6639costante, a meno che non si usi l'opzione --nc; inoltre è possibile
6640aggiungere un trend con l'opzione --trend e variabili dummy stagionali con
6641l'opzione --seasonals.
6642
6643Benché normalmente un VAR comprenda tutti i ritardi da 1 a un dato ordine,
6644è possibile selezionare un set di ritardi specifico. Per farlo, occorre
6645sostituire l'argomento scalare order col nome di un vettore predefinito o
6646con una lista di ritardi separati da virgole, racchiusi da parentesi graffe.
6647Qui di seguito, mostriamo due modi per specificare un VAR contenente i
6648ritardi 1, 2 e 4 (ma non il 3):
6649
6650	var {1,2,4} ylist
6651	matrix p = {1,2,4}
6652	var p ylist
6653
6654Viene stampata una regressione separata per ognuna delle variabili nella
6655lista-variabili. Il risultato di ogni equazione include i test F per i
6656vincoli di uguaglianza a zero su tutti i ritardi delle variabili, un test F
6657per la significatività del ritardo massimo e, se è stata usata l'opzione
6658--impulse-responses, la scomposizione della varianza della previsione e le
6659funzioni di impulso-risposta.
6660
6661Le scomposizioni della varianza della previsione e le funzioni di risposta
6662di impulso sono basate sulla decomposizione di Cholesky della matrice di
6663covarianza contemporanea, e in questo contesto l'ordine in cui vengono date
6664le variabili stocastiche conta. La prima variabile nella lista viene
6665considerata come la "più esogena" all'interno del periodo. L'orizzonte per
6666le decomposizioni della varianza e le funzioni di impulso-risposta può
6667essere impostato usando il comando "set". Per salvare una specifica risposta
6668di impulso sotto forma di matrice, si veda la funzione "irf".
6669
6670Con l'opzione --robust gli errori standard sono corretti per
6671l'eteroschedsasticità. In alternativa, l'opzione --robust-hac produce
6672errori standard HAC, cioè robusti tanto all'eteroschedasticità che
6673all'autocorrelazione. In generale, la seconda opzione non dovrebbe essere
6674necessaria se il modello include abbastanza ritardi.
6675
6676Se si usa l'opzione --lagselect, il primo parametro del comando var viene
6677interpretato come il massimo ordine di ritardo. In questo caso, il comando
6678produce una tabella che mostra i valori dei criteri di informazione di
6679Akaike (AIC), Schwartz (BIC) e Hannan-Quinn (HQC) calcolati per VAR
6680dall'ordine 1 fino all'ordine massimo indicato. Questa opzione viene usata
6681per scegliere l'ordine del VAR più appropriato, e l'output consueto del VAR
6682non viene mostrato. La tavola coi criteri di informazione è recuperabile
6683sotto forma di matrice tramite l'accessore "$test". In questo contesto,
6684l'opzione --minlag serve a stabilire l'ordine minimo. Usando il valore 0 si
6685ammette la possibilità che il ritardo ottimale sia nullo, e che in realtà
6686il modello non sia affatto un VAR. Al contrario, se si dà per scontato che
6687l'ordine minimo sia 4, con --minlag=4 si risparmia qualche millisecondo.
6688
6689Accesso dal menù:    /Modello/Serie storiche/VAR - Autoregressione vettoriale
6690
6691# varlist Dataset
6692
6693Opzione:    --type=nometipo (tipo di oggetto mostrato)
6694
6695Di default, mostra un elenco delle variabili disponibili nel dataset. "list"
6696e "ls" sono sinonimi.
6697
6698L'opzione --type deve essere seguita dal segno di uguale e da una delle
6699seguenti parole chiave: series, scalar, matrix, list, string, bundle or
6700accessor. L'effetto è di stampare i nomi di tutti gli oggetti di quel certo
6701tipo attualmente definiti.
6702
6703Un caso particolare è dato quando il tipo è accessor: in questo caso,
6704verrà stampato l'elenco delle variabili interne di tipo "accessore", come
6705ad esempio "$nobs" e "$uhat" (indipendentemente dal tipo).
6706
6707# vartest Tests
6708
6709Argomenti:  var1 var2
6710
6711Calcola la statistica F per l'ipotesi nulla che le varianze della
6712popolazione per le variabili var1 e var2 siano uguali e mostra il p-value.
6713La statistica test e il p-value sono disponibili tramite gli accessori
6714"$test" e "$pvalue". Il codice seguente
6715
6716      	open AWM18.gdt
6717	vartest EEN EXR
6718	eval $test
6719	eval $pvalue
6720
6721calcola il test e mostra come usare gli accessori:
6722
6723	Equality of variances test
6724
6725	EEN: Number of observations = 192
6726	EXR: Number of observations = 188
6727	Ratio of sample variances = 3.70707
6728	Null hypothesis: The two population variances are equal
6729	Test statistic: F(191,187) = 3.70707
6730	p-value (two-tailed) = 1.94866e-18
6731
6732	3.7070716
6733	1.9486605e-18
6734
6735Accesso dal menù:    /Modello/Modelli bivariati/Differenza delle varianze
6736
6737# vecm Estimation
6738
6739Argomenti:  ordine rango lista-y [ ; lista-x ] [ ; lista-rx ]
6740Opzioni:    --nc (senza costante)
6741            --rc (costante vincolata)
6742            --uc (costante non vincolata)
6743            --crt (costante e trend vincolato)
6744            --ct (costante e trend non vincolato)
6745            --seasonals (include dummy stagionali centrate)
6746            --quiet (omette l'output delle singole equazioni)
6747            --silent (non stampa nulla)
6748            --impulse-responses (mostra impulso-risposta)
6749            --variance-decomp (mostra decomposizioni della varianza delle previsioni)
6750Esempi:     vecm 4 1 Y1 Y2 Y3
6751            vecm 3 2 Y1 Y2 Y3 --rc
6752            vecm 3 2 Y1 Y2 Y3 ; X1 --rc
6753            Vedi anche denmark.inp, hamilton.inp
6754
6755Un VECM è un tipo di autoregressione vettoriale, o VAR (si veda "var"),
6756applicabile quando le variabili del modello sono individualmente integrate
6757di ordine 1 (ossia, sono "random walk" con o senza deriva), ma esibiscono
6758cointegrazione. Questo comando è strettamente connesso al test di Johansen
6759per la cointegrazione (si veda "johansen").
6760
6761Il parametro ordine rappresenta l'ordine di ritardo del sistema VAR. Il
6762numero di ritardi nel VECM (dove la variabile dipendente è data da una
6763differenza prima) è pari a ordine meno uno.
6764
6765Il parametro rango rappresenta il rango di cointegrazione, o in altre parole
6766il numero di vettori di cointegrazione. Questo deve essere maggiore di zero
6767e minore o uguale (in genere minore) al numero di variabili endogene
6768contenute nella lista-y.
6769
6770La lista-y rappresenta l'elenco delle variabili endogene, nei livelli.
6771L'inclusione di trend deterministici nel modello è controllata dalle
6772opzioni del comando. Se non si indica alcuna opzione, viene inclusa una
6773"costante non vincolata", che permette la presenza di un'intercetta diversa
6774da zero nelle relazioni di cointegrazione e di un trend nei livelli delle
6775variabili endogene. Nella letteratura originata dal lavoro di Johansen (si
6776veda ad esempio il suo libro del 1995), si fa riferimento a questo come al
6777"caso 3". Le prime quattro opzioni mostrate sopra, che sono mutualmente
6778esclusive, producono rispettivamente i casi 1, 2, 4 e 5. Il significato di
6779questi casi e i criteri per scegliere tra di essi sono spiegati nella guida
6780all'uso di gretl (il capitolo 33).
6781
6782Le liste opzionali xlist e rxlist permottoni di specificare delle variabili
6783esogene che entrano nel modello senza vincoli (xlist) o solo nello spazio di
6784cointegrazione (rxlist). Queste liste sono separate da ylist e fra loro
6785tramite punto e virgola.
6786
6787L'opzione --seasonals, che può accompagnare una qualsiasi delle altre
6788opzioni, specifica l'inclusione di un gruppo di variabili dummy stagionali
6789centrate. Questa opzione è disponibile solo per dati trimestrali o mensili.
6790
6791Il primo degli esempi mostrati sopra specifica un VECM con ordine di ritardo
6792pari a 4 e un unico vettore di cointegrazione. Le variabili endogene sono
6793Y1, Y2 e Y3. Il secondo esempio usa le stesse variabili ma specifica un
6794ritardo di ordine 3 e due vettori di cointegrazione, oltre a specificare una
6795"costante vincolata", che è appropriata se i vettori di cointegrazione
6796possono avere un'intercetta diversa da zero, ma le variabili Y non hanno
6797trend.
6798
6799Dopo la stima di un VECM sono disponibili alcuni accessori specializzati:
6800$jalpha, $jbeta e $jvbeta contengono, rispettivamente, le matrici α e beta
6801e la varianza stimata di beta. Per accedere a una specifica funzione di
6802risposta di impulso in forma matriciale, si veda la funzione "irf".
6803
6804Accesso dal menù:    /Modello/Serie storiche/VECM
6805
6806# vif Tests
6807
6808Opzione:    --quiet (soppprime la stampa dei risultati)
6809Esempi:     longley.inp
6810
6811Deve seguire la stima di un modello che includa almeno due variabili
6812indipendenti. Calcola e mostra i informazioni diagnostiche relative alla
6813collinearità
6814
6815Il VIF per il regressore j è definito come
6816
6817  1/(1 - Rj^2)
6818
6819dove R_j è il coefficiente di correlazione multipla tra il regressore j e
6820gli altri regressori. Il fattore ha un valore minimo di 1.0 quando la
6821variabile in questione è ortogonale alle altre variabili indipendenti.
6822Neter, Wasserman, e Kutner (1990) suggeriscono di usare il VIF maggiore come
6823test diagnostico per la collinearità; un valore superiore a 10 è in genere
6824considerato indice di un grado di collinearità problematico.
6825
6826Dopo l'esecusione di questo comando, l'accessore "$result" conterrà un
6827vetttore colonna con glil indici VIF. Per un approccio più sofisticato alla
6828diagnosi della collinearità, si vedia il comando "bkw".
6829
6830Accesso dal menù:    Finestra del modello, /Test/collinearità
6831
6832# wls Estimation
6833
6834Argomenti:  variabile-pesi variabile-dipendente variabili-indipendenti
6835Opzioni:    --vcv (mostra la matrice di covarianza)
6836            --robust (errori standard robusti)
6837            --quiet (non mostra i risultati)
6838            --allow-zeros (vedi sotto)
6839
6840Calcola stime con minimi quadrati ponderati (WLS - Weighted Least Squares),
6841prendendo i pesi da variabile-pesi. In pratica, detta w la radice quadrata
6842positiva della variabile-pesi, viene calcolata una regressione OLS di w *
6843variabile-dipendente rispetto a w * variabili-indipendenti. L'R-quadro,
6844comunque, è calcolato in un modo speciale, ossia come
6845
6846  R^2 = 1 - ESS / WTSS
6847
6848dove ESS è la somma dei quadrati degli residui dalla regressione ponderata,
6849mentre WTSS denota la "somma totale ponderata dei quadrati", che è pari
6850alla somma dei quadrati dei residui della regressione della variabile
6851dipendente ponderata sulla sola costante ponderata.
6852
6853Nel caso particolare in cui variabile-pesi sia una variabile dummy, la stima
6854WLS equivale a una stima OLS in cui tutte le osservazioni per cui essa vale
6855zero sono eliminate. In tutti gli altri casi, la presenza di zeri nella
6856variabile di ponderazione è considerata un errore, ma se per qualche motivo
6857si desidera ponderare per una variabile che contenga degli zeri, si può
6858disattivare tale errore usando l'opzione --allow-zeros.
6859
6860Per la stima con minimi quadrati ponderati in un contesto panel, in cui i
6861pesi sono basati sulle varianze delle unità longitudinali, si veda il
6862comando "panel" con l'opzione --unit-weights option.
6863
6864Accesso dal menù:    /Modello/Altri modelli lineari/WLS - Minimi quadrati ponderati
6865
6866# xcorrgm Statistics
6867
6868Argomenti:  var1 var2 [ maxlag ]
6869Opzioni:    --plot=mode-or-filename (vedi sotto)
6870            --quiet (non produrre il grafico)
6871Esempio:    xcorrgm x y 12
6872
6873Mostra il correlogramma incrociato per le variabili var1 e var2, che possono
6874essere specificate per nome o per numero. I valori sono i coefficienti di
6875correlazione campionari tra il valore presente di var1 e i valori ritardati
6876e anticipati di var2.
6877
6878Se si indica un valore maxlag, la lunghezza del correlogramma è limitata al
6879numero di ritardi e anticipi indicati, altrimenti è determinata
6880automaticamente in funzione della frequenza dei dati e del numero di
6881osservazioni.
6882
6883Di default, viene prodotto un grafico del correlogramma incrociato: un
6884grafico gnuplot in modo interattivo o un grafico ASCII in modalità batch.
6885Questo comportamento può essere aggiustato con l'opzione --plot. Per essa,
6886i valori accettabili dei parametri sono none (pr sopprimere il grafico);
6887ascii (per produrre un grafico testuale anche se in modo interattivo);
6888display (per produrre un grafico gnuplot anche se in modo batch), o il nome
6889di un file. L'effetto di quest'ultima scelta è identico a quello descritto
6890sotto l'opzione --output del comando "gnuplot".
6891
6892Accesso dal menù:    /Visualizza/Correlogramma
6893Accesso alternativo: Menù pop-up nella finestra principale (selezione multipla)
6894
6895# xtab Statistics
6896
6897Argomenti:  lista-y [ ; lista-x ]
6898Opzioni:    --row (mostra le percentuali per riga)
6899            --column (mostra le percentuali per colonna)
6900            --zeros (mostra i valori pari a zero)
6901            --no-totals (elimina la stampa delle marginali)
6902            --matrix=matname (usa le frequenze da una matrice)
6903            --quiet (vedi il caso bivariato più sotto)
6904            --tex[=nomefile] (produce output LaTeX)
6905            --equal (vedi il caso LaTeX più sotto)
6906Esempi:     xtab 1 2
6907            xtab 1 ; 2 3 4
6908            xtab --matrix=A
6909            xtab 1 2 --tex="xtab.tex"
6910
6911Mostra la tabella di contingenza, o la tabulazione incrociata, tra ogni
6912combinazione delle variabili della lista-y; se si indica anche una seconda
6913lista, lista-x, ogni variabile della lista-y viene tabulata (per riga)
6914rispetto ad ogni variabile della lista-x (per colonna). Le variabili in
6915queste liste possono essere referenziate per nome o per numero, e devono
6916essere state marcate come discrete. Alternativamente, con l'opzione
6917--matrix, la matrice specificata verrà trattata come un insieme di
6918frequenze già calcolate e il comando si limiterà a stamparla col formato
6919appropriato (vedi anche la funzione "mxtab"). In questo caso, gli argomenti
6920di tipo lista vanno omessi.
6921
6922Per impostazione predefinita le celle indicano la frequenza assoluta. Le
6923opzioni --row e --column (che sono mutualmente esclusive) sostituiscono la
6924frequenza assoluta con le frequenze in percentuale relativamente a ciascuna
6925riga o colonna. Le celle con valore di frequenza nullo sono lasciate vuote,
6926a meno che non venga usata l'opzione --zeros, che mostra esplicitamente i
6927valori pari a zero; questa opzione può essere comoda se occorre importare
6928la tabella in un altro programma, come un foglio di calcolo.
6929
6930Il test chi quadro di Pearson per l'indipendenza viene mostrato se la
6931frequenza attesa nell'ipotesi di indipendenza è pari almeno a 1.0e-7 per
6932tutte le celle. Una regola approssimativa usata spesso nel giudicare la
6933validità di questa statistica richiede che la frequenza attesa sia
6934superiore a 5 per almeno l'80 per cento delle celle; se questa condizione
6935non viene soddisfatta viene mostrato un messaggio di avvertimento.
6936
6937Se la tabella di contingenza è 2 x 2, viene calcolato il test esatto di
6938Fisher per l'indipendenza. Si noti che questo test si basa sull'ipotesi che
6939i totali per riga e colonna siano fissi; questo può essere appropriato o
6940meno a seconda di come sono stati generati i dati. Il p-value sinistro va
6941usato nel caso in cui l'ipotesi alternativa a quella di indipendenza sia
6942quella dell'associazione negativa (ossia i valori tendono ad accumularsi
6943nelle celle che non appartengono alla diagonale della tabella), mentre il
6944p-value destro va usato nell'ipotesi alternativa di associazione positiva.
6945Il p-value a due code di questo test è calcolato seguendo il metodo (b)
6946descritto in Agresti (1992), (capitolo 2.1): esso è la somma delle
6947probabilità di tutte le possibili tabelle che hanno i totali per riga e per
6948colonna pari a quelli della tabella data e che hanno una probabilità minore
6949o uguale a quella della tabella data.
6950
6951Il caso bivariato
6952
6953Nel caso base di una semplice tabella a doppia entrata si possono usare gli
6954accessori "$test" e "$pvalue" per il test chi-quadro di Pearson ed il
6955p-value corrispondente, a patto che sia rispettata la condizione sul valore
6956atteso minimo. In questo contesto, l'opzione --quiet fa sì che la tavola
6957non venga stampata.
6958
6959LaTeX output
6960
6961Dando l'opzione --tex, la tabella a doppia entrata viene stampata sotto
6962forma di un ambiente tabular di LaTeX. L'output verrà prodotto direttamente
6963(così da poterlo copincollare) o, se viene specificato il parametro
6964nomefile, nel file corrispondente. (Se nomefile non contiene un percorso
6965completo, il file sarà scritto nella locazione "workdir" attuale). la
6966statistica test non viene calcolata. L'opzione addizionale --equal viene
6967usata per far sì che venganp stampati in grassetto gli elementi della
6968tabella per cui le variabili riga e colonna hanno lo stesso valore numerico.
6969Quest'opzione è ignorata a se non è presente anche l'opzione --tex o
6970quando una delle due variabili sia di tipo stringa.
6971
6972Salvare la tavola come matrice
6973
6974Quando l'argomento del comando è dato da una sola lista, la tavola di
6975contingenza può essere salvata come matrice attraverso l'accessore
6976"$result".
6977
6978