gretl-2021d/share/gretl_cli_cmdref.it

headings 10
Tests 24
add
adf
bds
bkw
chow
coeffsum
coint
cusum
difftest
johansen
kpss
leverage
levinlin
meantest
modtest
normtest
omit
panspec
qlrtest
reset
restrict
runs
vartest
vif
Graphs 10
boxplot
gnuplot
graphpg
hfplot
panplot
plot
qqplot
rmplot
scatters
textplot
Statistics 13
anova
corr
corrgm
fractint
freq
hurst
mahal
pca
pergm
spearman
summary
xcorrgm
xtab
Dataset 18
append
data
dataset
delete
genr
info
join
labels
markers
nulldata
open
rename
setinfo
setmiss
setobs
smpl
store
varlist
Estimation 34
ar
ar1
arch
arima
arma
biprobit
dpanel
duration
equation
estimate
garch
gmm
heckit
hsk
intreg
lad
logistic
logit
midasreg
mle
mpols
negbin
nls
ols
panel
poisson
probit
quantreg
system
tobit
tsls
var
vecm
wls
Programming 19
break
catch
clear
elif
else
end
endif
endloop
flush
foreign
funcerr
function
if
include
loop
makepkg
run
set
setopt
Transformations 10
diff
discrete
dummify
lags
ldiff
logs
orthdev
sdiff
square
stdize
Utilities 7
eval
help
modeltab
pkg
pvalue
quit
shell
Printing 7
eqnprint
modprint
outfile
print
printf
sprintf
tabprint
Prediction 1
fcast

# add Tests

Argomento:  lista-variabili
Opzioni:    --lm (effettua un test LM (solo OLS))
            --quiet (non mostra le stime del modello aumentato)
            --silent (non mostra nulla)
            --vcv (mostra la matrice di covarianza)
            --both (aggiunge come regressore e come strumento, solo per TSLS)
Esempi:     add 5 7 9
            add xx yy zz --quiet

Va invocato dopo un comando di stima. Esegue un test congiunto per
l'aggiunta delle variabili specificate all'ultimo modello stimato; si può
avere accesso ai risultati del test tramite "$test" e "$pvalue".

Di default, aggiunge al modello precedente le variabili nella
lista-variabili e stima il nuovo modello. Il test è un test di Wald sul
modello aumentato, che rimpiazza quello originale come "ultimo modello" per
quanto riguarda,ad esempio, il contenuto di $uhat o test ulteriori.

Alternativamente, con l'opzione --lm (disponibile solo per i modelli stimati
via OLS), viene effettuato un test LM. Viene eseguita una regressione
ausiliaria in cui la variabile dipendente è il residuo dell'ultimo modello
e le variabili indipendenti sono quello del modello originale più
lista-variabili. Sotto l'ipotesi nulla che le variabili aggiuntive non hanno
potere esplicativo, il prodotto fra l'R-quadro non aggiustato della
regressione ausiliaria e il numero di osservazioni si distribuisce come una
chi quadro con tanti gradi di libertà quante sono le variabili in
lista-variabili. In questo caso, il modello originale non viene rimpiazzato.

L'opzione --both è specifica per le stime con i minimi quadrati a due
stadi: essa indica che le nuove variabili vanno aggiunte sia alla lista dei
regressori che a quella degli strumenti; di default, infatti, la
lista-variabili viene aggiunta soltanto ai regressori.

Accesso dal menù:    Finestra del modello, /Test/ADD - Aggiungi variabili

# adf Tests

Argomenti:  ordine lista-variabili
Opzioni:    --nc (test senza costante)
            --c (solo con la costante)
            --ct (con costante e trend)
            --ctt (con costante, trend e trend al quadrato)
            --seasonals (include variabili dummy stagionali)
            --gls (rimuove la media o il trend usando GLS)
            --verbose (mostra i risultati della regressione)
            --quiet (non mostra i risultati)
            --difference (usa la differenza prima della variabile)
            --test-down[=criterio] (ordine di ritardo automatico)
            --perron-qu (si veda di seguito)
Esempi:     adf 0 y
            adf 2 y --nc --c --ct
            adf 12 y --c --test-down
            Vedi anche jgm-1996.inp

Le opzioni precedenti e la discussione seguente si riferiscono per lo più
all'uso del comando adf con serie storiche vere e proprie. La discussione
dell'uso con dati panel è esposta nella sezione "Dati Panel".

Calcola una serie di test Dickey-Fuller sulle variabili specificate,
assumendo come ipotesi nulla che le variabili abbiano una radice unitaria.
Se si usa l'opzione --difference, i test vengono condotti sulla differenza
prima delle variabili e la discussione che segue va riferita a questa
trasformazione delle variabili.

Per impostazione predefinita, vengono mostrate due varianti del test: una
basata su una regressione che contiene solo una costante, e una che include
la costante e un trend lineare. È possibile controllare le varianti
specificando una o più fra le opzioni --nc, --c, --ct, --ctt.

L'opzione --gls può essere utilizzata congiuntamente alle opzioni --c e
--ct. L'effetto di questa opzione è che la rimozione della media o del
trend lineare dalla variabile che deve essere testata è fatta utilizzando
la procedura GLS suggerita da Elliott, Rothenberg e Stock (1996), la quale
restituisce un test di potenza superiore al test standard di Dickey-Fuller.
Questa opzione non è compatibile con --nc,--ctt o --seasonals.

In tutti i casi, la variabile dipendente nella regressione usata per
calcolare il test è la differenza prima della variabile specificata, y, e
la variabile dipendente più importante è il ritardo (di ordine uno) di y.
Il modello è costruito in modo che il coefficiente della variabile
ritardata y è pari a 1 meno la radice. Ad esempio, il modello con una
costante può essere scritto come

  (1 - L)y(t) = b0 + (a-1)y(t-1) + e(t)

Sotto l'ipotesi nulla di radice unitaria il coefficiente della y ritardata
è nullo; sotto l'alternativa che y sia stazionaria il coefficiente è
negativo. Di conseguenza, questo test è intrinsecamente a una coda.

Selezione dell'ordine dei ritardi

Nella versione più semplice del test Dickey-Fuller test si assume che il
termine di errore nella regressione di test sia serialmente incorrelato.
Poiché questo è spesso implausibile, la specificazione viene spesso estesa
includendo uno o più ritardi della variabile dipendente, dando così luogo
al cosiddetto test ADF (Augmented Dickey-Fuller). L'argomento ordine indica
il numero di tali ritardi, k, che può dipendere dall'ampiezza campiopnaria
T.

  Per selezionare un k fisso, basta inserire un numero non negativo per
  ordine.

  Per avere un numero di ritardi dipendente da T, specificare come order il
  numero -1. In questo caso, l'ordine viene automaticamente scelto secondo
  l'indicazione di Schwert (1989), ossia la parte intera di 12(T/100)^0.25.

In generale, però, non si sa quanti ritardi siano necessari per "sbiancare"
i residui Dickey-Fuller. Spesso si specifica il valore massimo di k e si
lascia decidere ai dati il numero di ritardi effettivo. Per fare questo,
c'è l'opzione --test-down: il criterio usato per scegliere il k ottimale è
determinato dal parametro dato a questa opzione, che deve essere uno fra AIC
(default), BIC o tstat.

Quando si testa "all'indietro" con lo AIC o il BIC, l'ordine dei ritardi
finale viene scelto in modo da ottimizzare rispettivamente una versione
modificata del Criterio di Informazione di Akaike o del Criterio Bayesiano
di Schwartz. La procedura varia a seconda se si sia scelta l'opzione --gls:
con la de-trendizzazione GLS, i valori AIC e BIC sono quelli "modificati"
descritti in Ng e Perron (2001), altrimenti sono quelli standard. Nel caso
GLS è disponibile un'ulteriore opzione, e cioè --perron-qu; essa fa sì
che i criteri di informazione modificati sono calcolati secondo il metodo
raccomandato in Perron e Qu (2007). In quest'ultimo caso, i dati sono prima
centrati in media o detrendizzati via OLS; il GLS viene applicato dopo aver
scelto l'ordine dei ritardi.

Quando si testa "all'indietro" usando la statistica t, la procedura è la
seguente:

1. Stima la regressione Dickey-Fuller con k ritardi della variabile
   dipendente.

2. Se questo ordine di ritardi è significativo, esegue il test con l'ordine
   di ritardo k. Altrimenti, prova il test con k = k - 1; se k = 0, esegue
   il test con ordine di ritardo 0, altrimenti va al punto 1.

Durante il punto 2 spiegato sopra, "significativo" significa che la
statistica t per l'ultimo ritardo abbia un p-value asintotico a due code per
la distribuzione normale pari a 0.10 o inferiore.

In sostanza, se accettiamo i vari argomenti di Perron, Ng, Qu e Schwert
citati sopra, il comando più appropriato per testare una serie y è
qualcosa del tipo:

	adf -1 y --c --gls --test-down --perron-qu

(Sosotituendo --ct a --c se la serie contiene un trend evidente.) L'ordine
dei ritardi del test verrà determinato testando all'indietro con il
criterio AIC modificato partendo del massimo di Schwert maximum, col
raffinamento di Perron-Qu.

I p-value per questo test sono basati su stime della superficie di risposta.
Se non si usa il GLS, essi sono tratti da MacKinnon (1996). Altrimenti, si
usa Cottrell (2015) o, quando si testa all'indietro, Sephton (2021). I
P-value sono specifici per ampiezza campionaria, a meno che non vengano
dichiarati come asintotici nell'output.

Dati panel

Quando il comando adf è usato con dati panel per calcolare un test panel di
radici unitarie le opzioni applicabili sono piuttosto diverse.

In primo luogo, mentre nel caso di serie storiche pure è possibile indicare
un elenco di variabili da testare, con dati panel ciascun comando può
esaminare una sola variabile alla volta. Secondo, le opzioni che governano
l'inclusione di trend deterministici diventano mutualmente esclusive: è
necessario scegliere fra il caso senza costante, quello con solo la
costante, e quello che la costante e il trend; il default è il secondo.
L'opzione --seasonals, inoltre, non è disponibile. Terzo, l'opzione
--verbose ha un significato diverso: produce un breve resoconto del test per
ciascuna singola serie storica (il default prevede di mostrare solo il
risultato complessivo).

Il test complessivo (ipotesi nulla: la variabile in questione ha una radice
unitaria per tutte le unità panel) viene calcolata in uno o in entrambi i
modi disponibili: usando il metodo di Im, Pesaran e Shin (Journal of
Econometrics, 2003) oppure quello di Choi (Journal of International Money
and Finance, 2001). Il test di Choi richiede che siano disponibili i P-value
dei test singoli; se così non fosse, per via delle opzioni selezionate,
esso viene omesso. La statistica riportata per il test di Im, Pesaran e Shin
varia come segue: se l'ordine di ritardi per il test è positivo, viene
riportata la statistica W; altrimenti, viene riportata la statistica Z se la
lunghezza delle serie è diversa fra individui, quella t barrato se è
uguale per tutte le unità. vedi anche il comando "levinlin".

Accesso dal menù:    /Variabile/Test di radice unitaria/Test Dickey-Fuller
      aumentato

# anova Statistics

Argomenti:  response treatment [ block ]
Opzione:    --quiet (non stampa i risultati)

Analisi della varianza: response è una serie che misura un effetto di
interesse e treatment deve essere una variabile discreta che identifica due
o più tipi di trattamento (o non trattamento). Nel caso dell'ANOVA a due
vie, la variabile block (anch'essa discreta) identifica i valori di qualche
variabile di controllo.

Se non è stata selezionata l'opzione --quiet, questo comando stampa una
tabella che mostra le somme e le medie dei quadrati, nonché un test F. Il
test F e il suo p-value possono essere recuperati rispettivamente con gli
accessori "$test" e "$pvalue".

L'ipotesi nulla del test F è che la risposta media sia invariante rispetto
al tipo di trattamento; in altre parole, che il trattamento non abbia alcun
effetto. Formalmente, la validità del test richiede che la varianza della
risposta sia la stessa per tutti i tipi di trattamento.

Si noti che i risultati prodotti da questo comando costituiscono in realtà
un sottoinsieme dell'informazione fornita dalla procedura seguente,
facilmente implementabile in gretl. Create un insieme di variabili dummy
associate a tutti i tipi di trattamento, tranne uno. Nel caso dell'ANOVA a
due vie, create anche un insieme di variabili dummy associate a tutti i
"blocchi", tranne uno. Una volta fatto questo, regredite response su una
costante e le dummy usando "ols". Per un'analisi a una via la tabella ANOVA
può essere creata ricorrendo all'opzione --anova del comando ols. Nel caso
di un'analisi a due vie il test F può essere calcolato usando il comando
"omit". Per esempio, se assumiamo che y sia la risposta, xt identifichi il
trattamento e xb identifichi i blocchi:

	# analisi a una via
	list dxt = dummify(xt)
	ols y 0 dxt --anova
	# analisi a due vie
	list dxb = dummify(xb)
	ols y 0 dxt dxb
	# test di significatività congiunta di dxt
	omit dxt --quiet

Accesso dal menù:    /Modello/Altri modelli lineari/ANOVA

# append Dataset

Argomento:  file-dati
Opzioni:    --time-series (si veda oltre)
            --fixed-sample (si veda oltre)
            --update-overlap (si veda oltre)
            --quiet (non stampa nulla)
            Si veda oltre per opzioni speciali addizionali

Apre un file di dati e aggiunge il suo contenuto al dataset attuale, se i
nuovi dati sono compatibili. Il programma cerca di riconoscere il formato
del file di dati (interno, testo semplice, CSV, Gnumeric, Excel, ecc.).

I dati aggiunti possono avere la forma di osservazioni aggiuntive su
variabili già presenti nel dataset, o di nuove variabili. In quest'ultimo
caso occorre che il numero delle nuove osservazioni sia pari a quello delle
osservazioni presenti nel dataset, oppure che i nuovi dati includano
informazioni precise sulle osservazioni in modo che gretl possa capire come
aggiungere i valori.

Attenzione: non è supportato il caso i nuovo dati inizino prima e finiscano
dopo quelli originali. Per aggiungere nuove serie in tal caso bisogna usare
l'opzione --fixed-sample; ciò ha l'effetto di di sopprimere l'aggiunta di
osservazioni, e quindi restringere l'operazione all'aggiunta di nuove serie.

Nel caso di aggiunta di dati a un dataset panel, c'è una possibilità
speciale. Siano n il numero di unità cross-section, T il numero di periodi
temporali, e m il numero di nuove osservazioni da aggiungere. Se m = n i
nuovi dati saranno considerati invarianti nel tempo, e saranno copiati per
ognuno dei periodi temporali. D'altra parte, se m = T i dati saranno
trattati come invarianti tra le unità. Se il panel è "quadrato", ed m è
pari sia ad n che a T, il comportamento predefinito consiste nel trattare i
nuovi casi come invarianti nel tempo, ma è possibile forzare
l'interpretazione dei nuovi dati come serie storiche usando l'opzione
--time-series (che verrà ignorata in tutti gli altri casi).

Quando viene scelto per l'aggiunta un file di dati, potrebbe esserci una
parziale sovrapposizione con il dataset esistente; in altre parole, una o
più serie potrebbero avere osservazioni in comune dalle due fonti. Se viene
passata l'opzione --update-overlap, il comando append sostituirà le
osservazioni in comune con quelle provenienti dal file dei dati; se no, i
valori presenti nel dataset in quel momento saranno lasciati inalterati.

Le opzioni specializzate aggiuntive --sheet, --coloffset, --rowoffset e
--fixed-cols funzionano come quelle corrispondenti per il comando "open".

Vedi anche "join" per una gestione più sofisticata di più di un file di
dati esterno.

Accesso dal menù:    /File/Aggiungi dati

# ar Estimation

Argomenti:  ritardi ; variabile-dipendente variabili-indipendenti
Opzioni:    --vcv (mostra la matrice di covarianza)
            --quiet (non riporta i parametri stimati)
Esempio:    ar 1 3 4 ; y 0 x1 x2 x3

Calcola le stime parametriche usando la procedura iterativa generalizzata di
Cochrane-Orcutt (si veda il Capitolo 9.5 di Ramanathan (2002). La procedura
termina quando le somme dei quadrati degli errori consecutivi non
differiscono per più dello 0.005 per cento, oppure dopo 20 iterazioni.

"ritardi" è una lista di ritardi nei residui, conclusa da un punto e
virgola. Nell'esempio precedente, il termine di errore è specificato come

  u(t) = rho(1)*u(t-1) + rho(3)*u(t-3) + rho(4)*u(t-4)

Accesso dal menù:    /Modello/Serie storiche/AR - Stima autoregressiva

# ar1 Estimation

Argomenti:  depvar indepvars
Opzioni:    --hilu (usa la procedura di Hildreth-Lu)
            --pwe (usa lo stimatore di Prais-Winsten)
            --vcv (mostra la matrice di covarianza)
            --no-corc (non affinare i risultati con Cochrane-Orcutt)
            --loose (usa un criterio di convergenza più blando)
            --quiet (non stampa nulla)
Esempi:     ar1 1 0 2 4 6 7
            ar1 y 0 xlist --hilu --no-corc
            ar1 y 0 xlist --pwe

Calcola stime feasible GLS per un modello in cui il termine di errore segue
un processo autoregressivo del prim'ordine.

Il metodo predefinito è la procedura iterativa di Cochrane-Orcutt (si veda
ad esempio il capitolo 9.4 di Ramanathan, 2002). La procedura termina quando
le stime successive del coefficiente di autocorrelazione non differiscono
per più di 0.001, oppure dopo 20 iterazioni. Sarà segnalato un errore se
la convergenza non è avvenuta dopo 100 iterazioni. Se ciò non si verifica
entro la 100esima iterata verrà stampato un messaggio di errore.

Se si usa l'opzione --pwe, viene usato lo stimatore di Prais-Winsten, che
prevede una procedura simile a quella di Cochrane-Orcutt; la differenza è
che mentre Cochrane-Orcutt tralascia la prima osservazione, Prais-Winsten ne
fa uso. Per i dettagli, si veda per esempio il capitolo 13 di Econometric
Analysis di Greene (2000).

Se si usa l'opzione --hilu, verrà usata la procedura di ricerca di
Hildreth-Lu. I risultati sono quindi ottimizzati con la procedura iterativa
di Cochrane-Orcutt, a meno che non si usi l'opzione --no-corc (che viene
ignorata se non viene specificata --hilu).

Accesso dal menù:    /Modello/Serie storiche/Cochrane-Orcutt
Accesso dal menù:    /Modello/Serie storiche/Hildreth-Lu
Accesso dal menù:    /Modello/Serie storiche/Prais-Winsten

# arch Estimation

Argomenti:  ordine variabile-dipendente variabili-indipendenti
Opzione:    --quiet (non stampa nulla)
Esempio:    arch 4 y 0 x1 x2 x3

Questo comando è attualmente mantenuto per ragioni di compatibilità con le
versioni precedenti, ma è preferibile usare lo stimatore di massima
verosimiglianza disponibile mediante il comando "garch"; per un modello ARCH
puro, fissate a 0 il primo parametro GARCH.

Stima il modello specificato tenendo conto della possibile
eteroschedasticità condizionale autoregressiva (ARCH, Autoregressive
Conditional Heteroskedasticity). Per prima cosa il modello viene stimato con
OLS, quindi viene eseguita una regressione ausiliaria, in cui i quadrati dei
residui della prima regressione vengono regrediti sui loro valori ritardati.
Il passo finale è una stima con minimi quadrati ponderati, in cui i pesi
sono i reciproci delle varianze dell'errore della regressione ausiliaria (se
la varianza prevista di qualche osservazione nella regressione ausiliaria
non risulta positiva, viene usato il corrispondente residuo al quadrato).

I valori alpha mostrati sotto i coefficienti sono i parametri del processo
ARCH stimati nella regressione ausiliaria.

Si veda anche "garch" e "modtest" (l'opzione --arch).

Accesso dal menù:    /Modello/Serie storiche/ARCH

# arima Estimation

Argomenti:  p d q [ ; P D Q ] ; variabile-dipendente [ variabili-indipendenti ]
Opzioni:    --verbose (mostra i dettagli delle iterazioni)
            --quite (non mostra i risultati)
            --vcv (mostra la matrice di covarianza)
            --hessian (si veda sotto)
            --opg (si veda sotto)
            --nc (non include l'intercetta)
            --conditional (usa la massima verosimiglianza condizionale)
            --x-12-arima (usa X-12-ARIMA, o X13, per la stima)
            --lbfgs (usa il massimizzatore L-BFGS-B)
            --y-diff-only (speciale per ARIMAX, si veda sotto)
Esempi:     arima 1 0 2 ; y
            arima 2 0 2 ; y 0 x1 x2 --verbose
            arima 0 1 1 ; 0 1 1 ; y --nc

Nota: arma è un sinomimo di questo comando.

Se non viene fornita una lista di variabili-indipendenti, stima un modello
autoregressivo integrato a media mobile (ARIMA: Autoregressive, Integrated,
Moving Average) univariato. I valori p, d e q rappresentano rispettivamente
gli ordini dei termini autoregressivi (AR), l'ordine di differenziazione, e
quello dei termini a media mobile (MA). Questi valori possono essere
indicati in forma numerica o con i nomi di variabili scalari preesistenti.
Ad esempio, un valore d pari a 1 significa che prima di stimare i parametri
ARMA occorre prendere la differenza della variabile dipendente.

Se si vuole includere solo alcuni specifici ritardi AR o MA (invece che
tutti i ritardi fino all'ordine specificato) è possibile sostituire p e/o q
in due modi: col nome di una matrice predefinita che contiene un insieme di
valori interi, oppure con un'espressione come {1 4}, ossia un insieme di
ritardi separati da spazi e racchiusi tra parentesi graffe.

I valori interi opzionali P, D e Q rappresentano rispettivamente, l'ordine
dei termini AR stagionali, l'ordine di differenziazione stagionale e
l'ordine dei termini MA stagionali. Essi sono rilevanti solo la frequenza
dei dati è superiore a 1 (ad esempio, dati trimestrali o mensili). Questi
valori devono essere indicati in forma numerica o come variabili scalari.

Nel caso univariato la scelta predefinita include un'intercetta nel modello,
ma questa può essere soppressa con l'opzione --nc. Se vengono aggiunte
delle variabili-indipendenti, il modello diventa un ARMAX: in questo caso
occorre indicare esplicitamente la costante se si desidera un'intercetta
(come nel secondo degli esempi proposti).

È disponibile una sintassi alternativa per questo comando: se non si
intende applicare alcuna operazione di differenziazione (stagionale o non
stagionale), è possibile omettere totalmente i termini d e D, invece che
impostarli esplicitamente pari a 0. Inoltre, arma è un sinonimo di arima,
quindi ad esempio il comando seguente è un modo valido per specificare un
modello ARMA(2,1):

	arma 2 1 ; y

Il funzionamento predefinito utilizza la funzionalità ARMA "interna" di
gretl, che usa la stima di massima verosimiglianza esatta usando il filtro
di Kalman; come opzione è possibile usare la stima di massima
verosimiglianza condizionale. Se è stato installato il programma X-12-ARIMA
è possibile usare questo al posto del codice interno di gretl. Per i
dettagli su queste opzioni si veda la guida all'uso di gretl (il capitolo
31).

Quando si usa il codice ARMA interno, le deviazioni standard sono stimate
basandosi su un'approssimazione numerica all'inversa negativa dell'Hessiana,
passando automaticamente al prodotto esterno del gradiente (OPG) in caso di
problemi numerici. Se si usa l'opzione --opg il prodotto esterno del
gradiente viene usato in ogni caso. L'opzione --hessian, invece, disabilita
il passaggio automatico all'OPG in caso di problemi. Si noti, peraltro, che
l'impossibilità di calcolare numericamente l'hessiana è per solito indice
di un modello mal specificato.

L'opzione --lbfgs è riservata alla stima basata su codice ARMA nativo e MV
esatta; quando viene indicata, la stima usa l'algoritmo L-BFGS a "memoria
limitata" anziché l'ottimizzatore BFGS consueto. Questa variante può
essere utile in alcune situazioni nelle quali la convergenza all'ottimo è
problematica.

L'opzione --y-diff-only è riservata alla stima di modelli ARIMAX (modelli
con ordine di integrazione non nullo e che includono regressori esogeni), e
si applica solo con la stima di MV esatta nativa di gretl. Per questi
modelli il comportamento di default consiste nel differenziare sia la
variabile dipendente che i regressori, ma quando viene indicata questa
opzione viene differenziata solo la variabile dipendente, mentre i
regressori restano nei livelli.

Il valore AIC mostrato nei modelli ARIMA è calcolato secondo la definizione
usata in X-12-ARIMA, ossia

  AIC = -2L + 2k

dove L è la log-verosimiglianza e k è il numero totale di parametri
stimati. Si noti che X-12-ARIMA non produce criteri di informazione come
l'AIC quando la stima è effettuata col metodo della massima verosimiglianza
condizionale.

Le radici AR e MA mostrate in occasione della stima ARMA sono basate sulla
seguente rappresentazione di un processo ARMA(p,q):

	(1 - a_1*L - a_2*L^2 - ... - a_p*L^p)Y =
        c + (1 + b_1*L + b_2*L^2 + ... + b_q*L^q) e_t

Di conseguenza le radici AR sono la soluzione di

        1 - a_1*z - a_2*z^2 - ... - a_p*L^p = 0

e la stazionarietà del processo richiede che queste radici si trovino al di
fuori del cerchio di raggio unitario.

Il valore di "frequenza" mostrato insieme alle radici AR e MA è il valore
di lambda che risolve z = r * exp(i*2*pi*lambda)dove z è la radice in
questione e r è il suo modulo.

Accesso dal menù:    /Modello/Serie Storiche/ARIMA
Accesso alternativo: Menù pop-up nella finestra principale (selezione singola)

# arma Estimation

Vedi "arima"; arma è un alias.

# bds Tests

Argomenti:  ordine x
Opzioni:    --corr1=rho (vedi sotto)
            --sdcrit=multiple (vedi sotto)
            --boot=N (vedi sotto)
            --matrix=m (usa una matrice come input)
            --quiet (non mostra i risultati)
Esempi:     bds 5 x
            bds 3 --matrix=m
            bds 4 --sdcrit=2.0

Esegue il test BDS (Brock, Dechert, Scheinkman and LeBaron, 1996) per la
nonlinearità della serie x. In un contesto econometrico il suo uso è
tipicamente associato all'analisi dei residui per la violazione della
condizione IID. Il test si basa su un insieme di integrali di correlazione,
pensati per rintracciare la nonlinearità in dimensioni via via più ampie,
e l'argomento ordine indica il numero di tali integrali. Esso deve essere
almeno 2; il primo integrale stabilisce una base ma non può essere usato
per calcolare il test. Il test è di tipo generico: rintraccia ogni tipo di
deviazione dalla linearità ma non è informativo sul perché questa
condizione venisse eventualmente violata.

Il test può essere calcolato su un vettore (riga o colonna) anziché su una
serie usando l'opzione --matrix.

Criterio di contiguità

Gli integrali di correlazione sono, in sostanza, misure di "contiguità",
ove due punti sono considerati vicini se la differenza fra loro non eccede
ε. Per specificare ε, di default gretl segue la raccomandazione di Kanzler
(1999): ε è scelto in modo tale che l'integrale di correlazione del primo
ordine sia intorno a 0.7. Una possibile alternativa (meno intensiva
computazionalmente) è quella di specificare ε come multiplo delle scarto
quadratico medio della serie in esame. L'opzione --sdcrit è usata per
quest'ultimo metodo; nel terzo esempio fornito sopra ε è posto al doppio
dello sqm di x. L'opzione --corr1 implica invece l'uso del metodo di
Kanzler's ma consente di specificare un valore di scala diverso da 0.7.
Ovviamente, queste due opzioni non possono essere usate insieme.

Bootstrap

Le statistiche test sono asintoticamente distribuite come N(0,1) ma il test
tende a sovra-rigettare la nulla in piccoli campioni. Per questa ragione, i
P-values sono ottenuti con una procedura di bootstrap se la lunghezza di x
fosse minore di 600 (in caso contrario, si fa riferimento alla normale
standard). Per usare il bootstrap in campioni più grandi basta dare un
valore non zero all'opzione --boot. Al contrario, per evitare il bootstrap
in piccoli campioni, basta settarla a 0.

Il default per il numero di iterazioni bootstrap è di 1999, ma questo
settaggio può essere modificato dandolo come argomento all'opzione --boot.

Matrice accessore

Se il comando va a buon fine, "$result" conterrà i risultati sotto forma di
una matrice con due righe e maxdim - 1 colonne. La prima riga contiene le
statistiche test, mentre la seconda contiene i P-values per ognuna delle
dimensioni, sotto l'ipotesi nulla per cui x sia lineare/IID.

# biprobit Estimation

Argomenti:  depvar1 depvar2 indepvars1 [ ; indepvars2 ]
Opzioni:    --vcv (stampa la matrice di covarianze)
            --robust (errori standard robusti)
            --cluster=clustvar (vedi "logit" per una spiegazione)
            --opg (vedi sotto)
            --save-xbeta (vedi sotto)
            --verbose (stampa informazione extra)
Esempi:     biprobit y1 y2 0 x1 x2
            biprobit y1 y2 0 x11 x12 ; 0 x21 x22
            Vedi anche biprobit.inp

Stima un modello probit bivariato massimizzando la verosimiglianza con il
metodo di Newton-Raphson.

L'elenco degli argomenti inizia con due variabili dipendenti (binarie),
seguite da una lista di regressori. Un'eventuale seconda lista, separata
dalla precedente da un punto e virgola, viene interpretata come contenente
l'insieme dei regressori specifici alla seconda equazione, mentre indepvars1
è specifica alla prima equazione; in caso contrario il comando assume che
indepvars1 rappresenti un insieme di regressori comuni alle due equazioni.

Per default, gli errori standard sono calcolati usando l'Hessiana analitica
calcolata in corrispondenza delle stime dei parametri. L'opzione --opg
permette di stimare la matrice di covarianza usando il prodotto esterno del
gradiente (Outer Product of the Gradient, OPG); l'opzione --robust permette
di calcolare gli standard error QML a partire dalla matrice di covarianza
"sandwich" che usa sia l'inversa dell'Hessiana che la matrice OPG.

Si noti che la stima di rho, il coefficiente di correlazione fra i due
termini di disturbo, è incluso nel vettore dei coefficienti, all'ultimo
posto, con le ovvie conseguenze sugli accessori coeff, stderr e vcv.

Una volta completata con successo la stima, l'accessore "$uhat" consente di
recuperare una matrice di due colonne contenente i residui generalizzati
delle due equazioni; in altre parole, i valori attesi degli errori
condizionali ai valori osservati delle variabili dipendenti e delle
covariate. Di default "$yhat" restituisce una matrice di quattro colonne
contenente le stime delle probabilità dei quattro possibili esiti congiunti
per (y_1, y_2), nell'ordine (1,1), (1,0), (0,1), (0,0). In alternativa, se
il comando è seguito dall'opzione --save-xbeta , "$yhat" ha due colonne
contenenti i valori delle funzioni indice delle rispettive equazioni.

L'output comprende un test dell'ipotesi che gli errori delle due equazioni
siano incorrelati fra loro. Il test è un test di tipo LR, a meno che lo
stimatore sia inteso come stimatore QMLE e quindi venga usata l'opzione
--robust; in questo caso, si usa un test di Wald.

# bkw Tests

Opzione:    --quiet (non stampa nulla)
Esempi:     longley.inp

Deve seguire la stima di un modello che includa almeno due variabili
indipendenti. Calcola e mostra le informazioni relative alla collinearità,
ovvero la tabella BKW, basandosi sul lavoro di Belsley, Kuh e Welsch (1980).
Questa tabella riporta una sofisticata analisi del grado di collinearità e
delle sue fonti, attraverso l'analisi degli autovalori ed autovettori
dell'inversa della matrice di correlazione. Per un resoconto completo circa
l'approccio BKW con riferimento a gretl, ed a diversi altri esempi, si veda
Adkins, Waters e Hill (2015).

Utilizzando l'accessore "$result" è possibile recuperare la tabella BKW
come matrice. Si veda anche il comando "vif" per un approccio semplificato
alla diagnostica della collinearità.

Esiste anche una funzione chiamata "bkw" che offre maggior flessibilità.

Accesso dal menù:    Finestra del modello, /Analisi/Collinearità

# boxplot Graphs

Argomento:  lista-variabili
Opzioni:    --notches (mostra l'intervallo di confidenza al 90 per cento per la mediana)
            --factorized (vedi sotto)
            --panel (vedi sotto)
            --matrix=name (opera su colonne di una matrice)
            --output=filename (manda l'output a un file specificato)

Questo tipo di grafici (da Tukey e Chambers) mostra la distribuzione di una
variabile. La "scatola" centrale (box) racchiude il 50 per cento centrale
dei dati, ossia è delimitato dal primo e terzo quartile. I "baffi"
(whiskers) si estendono fino un valore dato da una volta e mezzo il range
interquartile a partire dai bordi della scatola. Valori esterni a tale
intervallo sono considerati "outlier" e rappresentati con dei punti. Una
linea trasversale sulla scatola indica la mediana, mentre un segno "+"
indica la media. Se viene selezionata l'opzione di mostrare un intervallo di
confidenza per la mediana, questo viene calcolato via bootstrap e mostrato
sotto forma di lnee tratteggiate orizzontali sopra e sotto la mediana.

L'opzione "factorized" permette di esaminare la distribuzione di una
variabile condizionata ai valori di un fattore discreto. Ad esempio, se un
dataset contiene salari e una variable binaria per il genere, si può
scegliere di analizzare la distribuzione del salario condizionata al genere
e visualizzare boxplot dei salari per i maschi e per le femmine uno di
fianco all'altro, come ad esempio

	boxplot wage gender --factorized

Si noti che, in questo caso, bisogna specificare esattamente due variabili,
col fattore per secondo.

Se il dataset corrente è un panel ed è stata specificata una sola
variabile, l'opzione --panel produce una serie di grafici boxplot
affiancati, uno per ogni "unità" o gruppo panel.

In generale l'argomento varlist è necessario e deve indicare una o più
variabili nel dataset corrente (usando il nome o il numero di ID). Se viene
fornita una matrice usando l'opzione --matrix, tuttavia, questo argomento
diventa opzionale: di default viene mostrato un grafico per ciascuna delle
colonne della matrice specificata.

Il grafici boxplot di gretl sono generati usando gnuplot, ed è possibile
arricchire il grafico specificando altri comandi gnuplot, includendoli fra
parentesi graffa. Per maggiori dettagli consultate per favore l'help del
comando "gnuplot".

In modalità interattiva il risultato viene mostrato immediatamente. In
batch il comportamento di default di gretl è di scrivere nella directory di
lavoro dell'utente un file di comandi gnuplot chiamato gpttmpN.plt,
iniziando da N = 01. I grafici veri e propri possono essere generati in
seguito usando gnuplot (in MS Windows, wgnuplot). Questo comportamento può
essere modificato usando l'opzione --output=filename. Per ulteriori
dettagli, si veda il comando "gnuplot".

Accesso dal menù:    /Visualizza/Grafico/Boxplot

# break Programming

Esce da un ciclo. Questo comando può essere usato solo all'interno di un
ciclo e causa l'immediata interruzione dell'esecuzione del ciclo (o di
quello più interno, nel caso di cicli nidificati). Si veda anche il comando
"loop".

# catch Programming

Sintassi:
        catch command

Non si tratta di un vero e proprio comando, quanto piuttosto di un prefisso
applicabile alla maggior parte dei comandi consueti; il suo effetto è
quello di prevenire l'interruzione di uno script nel caso in cui si
verifichi un errore nell'esecuzione di un comando. Un eventuale errore viene
registrato in un codice d'errore interno cui è possibile accedere con
"$error" (un valore nullo indica che l'esecuzione ha avuto successo). Il
valore di "$error" dovrebbe sempre essere controllato subito dopo aver usato
catch, in modo da adottare le misure più opportune nel caso in cui il
comando non dovesse aver avuto successo.

catch non può essere usato prima di if, elif o endif. Inoltre, non può
essere neanche usato per chiamate a funzioni definite dall'utente; il suo
uso è limitato ai comandi di gretl e alle chiamate a funzioni od operatori
"nativi".

# chow Tests

Varianti:   chow obs
            chow dummyvar --dummy
Opzioni:    --dummy (usa una variabile dummy preesistente)
            --quiet (non mostra le stime del modello aumentato)
            --limit-to=lista (limita il test a un sottoinsieme di regressori)
Esempi:     chow 25
            chow 1988:1
            chow female --dummy

Va eseguito dopo una regressione OLS e fornisce un test per l'ipotesi nulla
che non esista un break strutturale del modello in corrispondenza del punto
di rottura specificato. La procedura consiste nel creare una variabile dummy
che vale 1 a partire dal punto di rottura specificato da osservazione fino
alla fine del campione, 0 altrove; inoltre vengono creati dei termini di
interazione tra questa dummy e i regressori originali. Viene quindi stimata
una regressione che include questi termini.

Per impostazione predefinita viene calcolata una statistica F, prendendo la
regressione aumentata come non vincolata e la regressione originale come
vincolata. Se il modello originale usa uno stimatore robusto per la matrice
di covarianza, come statistica test viene usato un valore chi-quadro di
Wald, basato su uno stimatore robusto della matrice di covarianza della
regressione aumentata.

L'opzione --limit-to si può usare per limitare l'insieme di regressori che
verrà interagito con la dummy di sottocampionamento a un sottoinsieme di
quelli originali. Il parametro di questa opzione dev'essere una lista
pre-definita, contenente un sottoinsieme delle variabili esplicative; la
costante non può farne parte.

Accesso dal menù:    Finestra del modello, /Test/CHOW

# clear Programming

Opzioni:    --dataset (cancella solo il dataset)
            --other (cancella tutto fuorché il dataset)

Senza alcuna opzione, cancella dalla memoria tutti gli oggetti salvati,
compreso l'eventuale campione corrente. Si noti che anche aprire un nuovo
dataset o usare il comando "nulldata" per creare un dataset vuoto ha lo
stesso effetto; per questo motivo di solito non è necessario usare "clear".

Con l'opzione --dataset viene cancellato dalla memoria solo il dataset;
tutti gli altri oggetti, come matrici e scalari salvati in precedenza,
vengono conservati.

# coeffsum Tests

Argomento:  lista-variabili
Opzione:    --quiet (non stampa nulla)
Esempi:     coeffsum xt xt_1 xr_2
            Vedi anche restrict.inp

Deve essere usato dopo una regressione. Calcola la somma dei coefficienti
delle variabili nella lista-variabili e ne mostra l'errore standard e il
p-value per l'ipotesi nulla che la loro somma sia zero.

Si noti la differenza tra questo test e "omit", che assume come ipotesi
nulla l'uguaglianza a zero di tutti i coefficienti di un gruppo di variabili
indipendenti.

L'opzione --quiet potrebbe risultare utile se si vuole accedere ai valori
"$test" e "$pvalue", che vengono registrati al completamento della
procedura.

Accesso dal menù:    Finestra del modello, /Test/Somma dei coefficienti

# coint Tests

Argomenti:  ordine variabile-dipendente variabili-indipendenti
Opzioni:    --nc (non include la costante)
            --ct (include la costante e il trend)
            --ctt (include la costante e il trend quadratico)
            --seasonals (include dummy stagionali)
            --skip-df (non esegue i test DF sulle variabili individuali)
            --test-down[=criterio] (scelta automatica dell'ordine dei ritardi)
            --verbose (mostra dettagli extra sulle regressioni)
            --silent (non stampa nulla)
Esempi:     coint 4 y x1 x2
            coint 0 y x1 x2 --ct --skip-df

Test di cointegrazione di Engle-Granger. La procedura predefinita è la
seguente: (1) eseguire dei test Dickey-Fuller aumentati, sull'ipotesi nulla
che ognuna delle variabili elencate abbia una radice unitaria; (2) stimare
la regressione di cointegrazione; (3) eseguire un test DF sui residui della
regressione di cointegrazione. Se si usa l'opzione --skip-df, il passo (1)
viene saltato.

Se l'ordine di ritardo specificato è positivo, tutti i test Dickey-Fuller
utilizzano questo ordine. Se l'ordine indicato viene preceduto da un segno
meno, viene interpretato come l'ordine massimo, e l'ordine utilizzato
effettivamente viene ricavato con la stessa procedura di test "all'indietro"
descritta per il comando "adf".

L'impostazione predefinita consiste nell'includere una costante nella
regressione di cointegrazione; se si vuole omettere la costante, basta usare
l'opzione --nc. Se si vuole aggiungere all'elenco dei termini deterministici
della regressione un trend lineare o quadratico, basta usare le opzioni --ct
o --ctt. Queste opzioni sono mutualmente esclusive. Volendo, se i dati sono
trimestrali o mensili, la regressione può comprendere dummy stagionali.

Test di cointegrazione di Engle-Granger. La procedura predefinita è la
seguente: (1) eseguire dei test Dickey-Fuller aumentati, sull'ipotesi nulla
che ognuna delle variabili elencate abbia una radice unitaria; (2) stimare
la regressione di cointegrazione; (3) eseguire un test DF sui residui della
regressione di cointegrazione. Se si attiva la casella Salta i test DF
iniziali, il passo (1) viene saltato.

I pvalue per questo test si basano su MacKinnon (1996). Il codice relativo
è stato incluso per gentile concessione dell'autore.

Per il test di cointegrazione di Søren Johansen, si veda il comando
"johansen".

Accesso dal menù:    /Modello/Serie storiche/Test di cointegrazione/Engle-Granger

# corr Statistics

Varianti:   corr [ lista-variabili ]
            corr --matrix=nome-matrice
Opzioni:    --uniform (assicura l'uniformità del campione)
            --spearman (Rho di Spearman)
            --kendall (Tau di Kendall)
            --verbose (mostra i ranghi)
            --plot=modo o nome del file (si veda di seguito)
            --triangle (si veda di seguito)
Esempi:     corr y x1 x2 x3
            corr ylist --uniform
            corr x y --spearman

Per impostazione predefinita, mostra le coppie di coefficienti di
correlazione (la correlazione del prodotto dei momenti di Pearson) per le
variabili date nella lista-variabili, o per tutte le variabili del dataset
se non viene specificata alcuna lista-variabili. Il comportamento
predefinito consiste nell'usare tutte le osservazioni disponibili per
calcolare ognuno dei coefficienti, ma se si usa l'opzione --uniform il
campione verrà limitato (se necessario) in modo che per tutti i
coefficienti venga usato lo stesso insieme di osservazioni. Questa opzione
ha effetto solo se le diverse variabili contengono un numero diverso di
valori mancanti.

Le opzioni (mutualmente esclusive) --spearman e --kendall producono
rispettivamente, la correlazione di rango di Spearman (rho) e la
correlazione di rango di Kendall (tau), invece del solito coefficiente di
Pearson. Quando si usa una di queste opzioni, la lista-variabili deve
contenere solo due variabili.

Quando viene calcolata la correlazione di rango, si può usare l'opzione
--verbose per mostrare i dati originali e ordinati (altrimenti questa
opzione verrà ignorata).

Se lista-variabili contiene più di due serie e il programma non è in
modalità batch, verrà mostrato un grafico a "temperatura" della matrice di
correlazione, regolato dall'opzione --plot. Per questa opzione, i parametri
possibili sono none (per non averlo), display (per mostrarlo a video anche
in modo batch), o un nome di file. Quest'ultima scelta ha effetti uguali a
quelli dell'opzione --output per il comando "gnuplot". L'opzione --triangle
fa sì che il grafico contenga solo il triangolo inferiore della matrice.

Se si usa la forma alternativa, dando come argomento un nome di matrice
piuttosto che una lista variabili, le opzioni --spearman e --kendall non
sono disponibili -- si veda quindi la funzione "npcorr".

L'accessore "$result" può essere utilizzato per ottenere le correlazioni
risultati dal comando sottoforma di matrice utilizzabile.

Accesso dal menù:    /Visualizza/Matrice di correlazione
Accesso alternativo: Menù pop-up nella finestra principale (selezione multipla)

# corrgm Statistics

Argomenti:  variabile [ max-ritardo ]
Opzioni:    --bartlett (usa gli errori standard di Bartlett)
            --plot=modo o nome di file (si veda sotto)
            --quiet (non mostra il grafico)
Esempio:    corrgm x 12

Mostra i valori della funzione di autocorrelazione per la variabile
specificata (dal nome o dal numero). I valori sono definiti come rho(u_t,
u_t-s) dove u_t è la t-esima osservazione della variabile u e s è il
numero dei ritardi.

Vengono mostrate anche le autocorrelazioni parziali (calcolate con
l'algoritmo di Durbin-Levinson), ossia al netto dell'effetto dei ritardi
intermedi. Il comando produce anche un grafico del correlogramma e mostra la
statistica Q di Ljung-Box per testare l'ipotesi nulla che la serie sia
"white noise" (priva di autocorrelazione). La statistica si distribuisce
asintoticamente come chi-quadro con gradi di libertà pari al numero di
ritardi specificati.

La significatività statistica delle singole autocorrelazioni viene indicata
per mezzo di asterischi. Di default, essa è calcolata per mezzo della
radice inversa dell'ampiezza campionaria, ma con l'opzione --bartlett
vengono usate le formule di Bartlett per l'ACF. Quest'opzione, se
applicabile, controlla anche la banda di confidenza mostrata nel grafico.

Se viene specificato un valore max-ritardo, la lunghezza del correlogramma
viene limitata al numero di ritardi specificato, altrimenti viene scelta
automaticamente in funzione della frequenza dei dati e del numero di
osservazioni.

Di default viene mostrato un grafico del correlogramma: un grafico gnuplot
in modalità interattiva o un grafico ASCII in modalità batch. Questo
comportamento può essere modificato con l'opzione --plot. Per questa
opzione i parametri accettabili sono none (per eliminare il grafico); ascii
(per produrre un grafico in formato testo anche in modalità interattiva);
display (per produrre un grafico gnuplot anche in modalità batch); oppure
il nome di un file. In quest'ultimo caso l'effetto è quello descritto per
l'opzione --output del comando "gnuplot".

Se il comando va a buon fine, gli accessori "$test" e "$pvalue" conterranno
i valori corrispondenti per la statistica di Ljung-Box, per l'ordine
max-ritardo. Peraltro, se si vuole semplicemente calcolare la statistica Q
senza che il programma produca alcun output, consigliamo di usare la
funzione "ljungbox" anziché questo comando.

Accesso dal menù:    /Variabile/Correlogramma
Accesso alternativo: Menù pop-up nella finestra principale (selezione singola)

# cusum Tests

Opzioni:    --squares (esegue il test CUSUMSQ)
            --quiet (stampa solamente il test di Harvey-Collier)
            --plot=output (vedi sotto)

Va eseguito dopo la stima di un modello OLS. Esegue il test CUSUM (o, se si
usa l'opzione --squares, il test CUSUMSQ) per la stabilità dei parametri.
Viene calcolata una serie di errori di previsione per il periodo successivo,
attraverso una serie di regressioni: la prima usa le prime k osservazioni e
viene usata per generare la previsione della variabile dipendente per
l'osservazione k + 1; la seconda usa le prime k + 1 osservazioni per
generare una previsione per l'osservazione k + 2 e cos via (dove k è il
numero dei parametri nel modello originale).

Viene mostrata, anche graficamente, la somma cumulata degli errori scalati
di previsione (o dei quadrati degli errori). L'ipotesi nulla della
stabilità dei parametri è rifiutata al livello di significatività del 5
per cento se la somma cumulata va al di fuori delle bande di confidenza al
95 per cento.

Nel caso di test CUSUM, viene mostrata anche la statistica t di
Harvey-Collier per testare l'ipotesi nulla della stabilità dei parametri.
Si veda il Capitolo 7 di Econometric Analysis di Greene, per i dettagli. Per
il test CUSUMSQ, la banda di confidenza al 95% è calcolata usando
l'algoritmo descritto in Edgerton e Wells (1994).

Di default, se il programma non è in modalità batch, viene mostrato un
grafico della series cumulata con la sua banda di confidenza. Questo
comportamento può essere modificato tramite l'opzione --plot, che può
prendere come parametri none (per non produrre il grafico); display (per
mostrarlo anche quando si è in modo batch); oppure, un nome di file.
Nell'ultimo caso l'effetto è lo stesso dell'opzione --output del comando
"gnuplot".

Accesso dal menù:    Finestra del modello, /Test/CUSUM(SQ)

# data Dataset

Argomento:  lista-variabili
Opzioni:    --compact=metodo (specifica un metodo di aggregazione)
            --interpolate (interpola i dati a bassa frequenza)
            --quiet (non mostra i risultati tranne che in caso di errore)
            --name=identificatore (rinomina le serie importate)
            --odbc (importa via ODBC)
            --no-align (specifico per ODBC, vedi sotto)

Legge le variabili nella lista-variabili da un database (gretl, RATS 4.0 o
PcGive), che deve essere stato precedentemente aperto con il comando "open".
Il comando data è anche usat pe rimportare dati da DB.NOMICS o da una fonte
dati ODBC; per maggiori dettugli su queste varianti si vedano
rispettivamente gretl + DB.NOMICS e la guida all'uso di gretl (il capitolo
42).

La frequenza dei dati e l'intervallo del campione possono essere impostati
usando i comandi "setobs" e "smpl" prima di questo comando. Ecco un esempio
completo:

	open fedstl.bin
	setobs 12 2000:01
	smpl ; 2019:12
	data unrate cpiaucsl

Questi comandi aprono il database chiamato fedstl.bin (fornito con gretl),
impostano un dataset mensile che va da gennaio 2000 a dicembre 2019 e infine
importano le serie unrate e cpiaucsl.

Se non si specificano setobs e smpl nel modo descritto, la frequenza dei
dati e l'intervallo del campione vengono impostati usando la prima variabile
letta dal database.

Se le serie da leggere hanno frequenza maggiore di quella impostata nel
dataset, è possibile specificare un metodo di compattamento, come mostrato
di seguito

	data LHUR PUNEW --compact=average

I cinque metodi di compattamento disponibili sono "average" (usa la media
delle osservazioni ad alta frequenza), "last" (usa l'ultima osservazione),
"first", "sum" e "spread". Se non si specifica alcun metodo, verrà usata la
media delle osservazioni. Il metodo "spread" è speciale: l'informazione,
anziché essere condensata, verrà suddivisa su più serie, una per
sottoperiodo. Ad esempio, l'aggiunta di una serie mensile ad un dataset
trimestrale provoca la creazione di tre, serie, una per ogni mese del
trimestre; nei loro nomi compaiono i suffissi m01, m02 e m03.

Se la serie in ingresso è a frequenza più bassa di quella del dataset, il
default è ripetere il valore dei dati in ingresso; in seguito, si può
usare la funzione "tdisagg" per disaggregare temporalmente la serie.

Se il database è in formato nativo gretl, i caratteri "glob" * e ? can be
used in varlist, nella ricerca delle serie da importare. L'esempio che segue
importerà tutte le serie i cui nomi comiciano per cpi:

	data cpi*

L'opzione --name può essere utilizzata per impostare un nome diverso
dall'originale per le nuove serie storiche importate nel dataset. Il
parametro deve essere un identificatore valido. Questa opzione è
circoscritta al caso in cui è stata specificata una singola serie storica
per l'importazione.

L'opzione --no-align produce effetti solo quando si importano serie via
ODBC. Per impostazione predefinita, la query ODBC deve ritornare delle
informazioni con cui gretl possa piazzare i dati in ingresso nelle righe
appropriate del dataset -- o per lo meno, che il numero di cifre in entrata
coincida con la lunghezza del dataset o del sottocampione attuale. Con
l'opzione --no-align questo requisito viene allentato: se le condizioni di
cui sopra non sono rispettate, i datri in ingresso sono semplicemente messi
all'inizio del dataset, partendo dalla prima riga. Se i dati in ingresso
sono meno della dimensione del campione, le righe in eccesso saranno
riempite con NAs; altrimenti, i dati in più verranno buttati via. Per
maggiori dettagli sull'importazione via ODBC, si veda la guida all'uso di
gretl (il capitolo 42).

Accesso dal menù:    /File/Database

# dataset Dataset

Argomenti:  parola-chiave parametri
Opzione:    --panel-time (vedi oltre, sotto addobs)
Esempi:     dataset addobs 24
            dataset insobs 10
            dataset compact 1
            dataset compact 4 last
            dataset expand
            dataset transpose
            dataset sortby x1
            dataset resample 500
            dataset renumber x 4
            dataset pad-daily 7
            dataset clear

Esegue varie operazioni sull'intero dataset, a seconda della parola-chiave
usata, che può essere addobs, insobs, clear, compact, expand, transpose,
sortby, dsortby, resample, renumber o pad-daily. Nota: ad eccezione del
comando clear questi comandi non sono disponibili quando sul dataset è
definito un sotto-campione ottenuto selezionando le osservazioni con un
criterio Booleano.

addobs: deve essere seguito da n, un intero positivo. Aggiunge n
osservazioni alla fine del dataset, tipicamente a scopo di ottenere delle
previsioni. I valori della maggior parte delle variabili nell'intervallo
aggiunto sono impostati come valori mancanti, ma alcune variabili
deterministiche, ad esempio le tendenze lineari e le variabili dummy
periodiche, sono riconosciute ed estese. Se il dataset aperto è di tipo
panel, l'opzione --panel-time è quella di allungare il campione di n
osservazioni per ogni unità cross-sezionale (mentre il default è di
aggiungere nunità).

insobs: Deve essere seguito da un intero positivo inferiore o uguale al
numero corrente di osservazioni. Inserisce una singola osservazione nella
posizione specificata. Tutti i dati successivi sono spostati di una
posizione e il dataset è allungato di un'osservazione. In corrispondenza
della nuova osservazione a tutte le variabili, a parte la costante, vengono
assegnati valori mancanti. Questa azione non è disponibile in dataset
panel.

clear: Non richiede parametri. Elimina il campione corrente e riporta gretl
al suo stato iniziale senza dati.

compact: deve essere seguito da un intero positivo che rappresenta la nuova
frequenza dei dati, che dovrebbe essere minore di quella attuale (ad esempio
un valore 4 quando la frequenza attuale è 12 significa che si compatterà
un dataset mensile in uno trimestrale). Questo comando è disponibile solo
se il dataset contiene serie storiche: compatta tutte le serie del dataset
alla nuova frequenza. È possibile dare un secondo parametro, tra sum,
first, last o spread, per specificare, rispettivamente, di compattare usando
la somma dei valori alla frequenza maggior, i valori di inizio periodo o
fine periodo, o di "spalmare" i valori ad alta frequenza su più serie (una
per sottoperiodo). Il comportamento predefinito consiste nel prendere la
media dei valori sul periodo.

expand: Questo comando è disponibile solo per serie storiche annuali o
trimestrali. I dati annuali vengono espansi a trimestrali, quelli
trimestrali a mensili. Tutte le serie nel dataset verranno espanse ripetendo
il valore a bassa frequenza. Se il dataset originale è annual l'espansione
di defaultè trimestrale ma si può far seguire expand dal numero 12 per
effettuare l'espansione a mensile.

transpose: non richiede parametri aggiuntivi. Traspone il dataset attuale:
ogni osservazione (riga) del dataset attuale diventerà una variabile
(colonna), e ogni variabile un'osservazione. Questo comando è utile quando
si importano da fonti esterne dei dati organizzati con le variabili disposte
per riga.

sortby: richiede il nome di una variabile o di una lista. Con una variabile,
questa viene usata come criterio di ordinamento. Le osservazioni di tutte le
altre variabili del dataset sono riordinate secondo valori crescenti della
variabile indicata. Nel caso di una lista, il comando procede
gerarchicamente: il primo criterio di ordinamento è la prima variabile, nel
caso in cui si arrivi ad una situazione di stallo si passa alla seconda
variabile della lista per risolvere il problema, e se il problema persiste
si passa alla terza e così via, finchè lo stallo non si esaurisce o si
esauriscono le variabili presenti nella lista. Questo comando è disponibile
solo per dati non datati.

dsortby: funziona come sortby ma riordina le osservazioni secondo i valori
decrescenti della variabile specificata.

resample: costruisce un nuovo dataset attraverso un campionamento causale,
con reimmissione, delle righe del dataset attuale. È richiesto un
argomento, ossia il numero di righe da includere, che può essere minore,
uguale o maggiore del numero di osservazioni nei dati originali. Il dataset
originale può essere recuperato usando il comando smpl full.

renumber: Richiede il nome di una variabile esistente seguito da un intero
compreso fra 1 e il numero delle variabili nel campione meno 1. Sposta la
serie specificata nel dataset nella posizione indicata, rinumerando le altre
variabili di conseguenza. (La posizione 0 è occupata dalla costante che non
può essere spostata.)

pad-daily: valido solamente se il dataset corrente contiene dei dati
giornalieri di un calendario incompleto. L'effetto prodotto dal comando
sarà quello di riempire il calendario aggiungendo le date mancanti come
righe vuote (in pratica significa creare delle righe vuote contenenti
solamente valori NA). Quest'opzione richiede un parametro intero, ovvero il
numero di giorni della settimana (che deve essere un numero tra 5, 6 o 7), e
deve essere maggiore, o uguale, alle correnti frequenze del dataset. Una
volta avvenuto con successo il completamento, il calendario dei dati
risulterà "completo" relativamente al valore del parametro dato. Ad
esempio, se i giorni della settimana sono 5 allora tutti i giorni della
settimana verranno rappresentati, sia che i dati per questi giorni siano
disponibili oppure no.

Accesso dal menù:    /Dati

# delete Dataset

Varianti:   delete varlist
            delete varname
            delete --type=type-name
            delete pkgname
Opzioni:    --db (rimuove dal database aperto)
            --force (vedi sotto)

Questo comando è uno strumento multi-uso per eliminare oggetti. Deve essere
usato con cautela: non viene chiesta alcuna conferma.

Utilizzandolo nella sua prima forma, varlist è un lista di variabili aventi
un nome ed un numero identificativo (ID). Si noti che quando si elimina una
serie tutte le restanti serie con un ID maggiore della precedente vengono
rinumerate dopo l'eliminazione di quelle selezionate. Se si utilizza
l'opzione --db con questo comando verranno eliminate le liste di variabili
non dal corrente dataset ma dal database di gretl, assumendo che un database
sia stato aperto e che l'utente abbia il permesso scritto per il file in
questione. Si veda anche il comando "open".

Nella seconda forma, il nome di uno scalare, matrice, stringa o bundle può
essere dato al comando per la cancellazione. In questo caso l'opzione --db
non è applicabile. Si noti che serie e variabili di tipo diverso non
dovrebbero essere mixate all'interno della chiamata delete.

Nella terza forma l'opzione --type deve essere accompagnata da uno dei
seguenti qualificatori:matrix, bundle, string, list, scalar o array.
L'effetto è quello di eliminare tutte le variabili di un certo tipo. In
questo caso nessun altro argomento è richiesto oltre l'opzione successiva
richiesta.

La quarta forma può essere utilizzata per rimuovere un pacchetto di
funzioni. In questo caso il suffisso .gfn deve essere fornito, come ad
esempio

	delete somepkg.gfn

Si noti che non elimina il pacchetto, quanto piuttosto lo deselezione e lo
rimuove dalla memoria.

Cancellazione di variabili in un loop

In generale, non è permesso cancellare variabili durante un loop, poiché
questo può mettere a repentaglio l'integrità del codice. Ciononostante, se
siete sicuri che l'operazione è senza rischi, questa proibizione può
essere disattivata usando l'opzione --force.

Accesso dal menù:    Pop-up nella finestra principale (selezione singola)

# diff Transformations

Argomento:  lista-variabili
Esempi:     penngrow.inp, sw_ch12.inp, sw_ch14.inp

Calcola la differenza prima di ogni variabile nella lista-variabili e la
salva in una nuova variabile il cui nome è prefissato con d_. Quindi "diff
x y" crea le nuove variabili

	d_x = x(t) - x(t-1)
        d_y = y(t) - y(t-1)

Accesso dal menù:    /Aggiungi/Differenze prime delle variabili selezionate

# difftest Tests

Argomenti:  var1 var2
Opzioni:    --sign (Test del segno, scelta predefinita)
            --rank-sum (Test "rank-sum" di Wilcoxon)
            --signed-rank (Test "signed-rank" di Wilcoxon)
            --verbose (Mostra informazioni aggiuntive)
            --quiet (Non stampa l'output)
Esempi:     ooballot.inp

Esegue un test non parametrico per la differenza tra due popolazioni o
gruppi; il tipo di test dipende dall'opzione usata.

Con l'opzione --sign, viene eseguito il test del segno, che si basa sul
fatto che per due campioni x e y estratti casualmente dalla stessa
distribuzione, la probabilità che valga x_i > y_i per ogni osservazione i
dovrebbe valere 0.5. La statistica test è w, ossia il numero di
osservazioni per cui vale x_i > y_i. Sotto l'ipotesi nulla, questa grandezza
si distribuisce come una binomiale con parametri (n, 0.5), dove n è il
numero di osservazioni.

Con l'opzione --rank-sum, viene eseguito il test "rank-sum" di Wilcoxon.
Questo test procede ordinando le osservazioni estratte da entrambi i
campioni dalla più piccola alla più grande, e quindi calcolando la somma
dei ranghi delle osservazioni da uno dei campioni. I due campioni non devono
necessariamente avere la stessa dimensione: se sono diversi, viene usato il
campione più piccolo per calcolare la somma dei ranghi. Sotto l'ipotesi
nulla che i campioni siano estratti da popolazioni con la stessa mediana, la
distribuzione di probabilità della somma dei ranghi può essere calcolata
per ogni valore dell'ampiezza dei due campioni, mentre per campioni
abbastanza ampi essa approssima la distribuzione normale.

Con l'opzione --signed-rank, viene eseguito il test "signed-rank" di
Wilcoxon. Questo test è valido per "coppie di campioni", come possono
essere ad esempio i valori di una variabile in un gruppo di individui prima
e dopo un certo trattamento. Il test procede calcolando le differenze tra le
coppie di osservazioni x_i - y_i, ordinando queste differenze per valore
assoluto e assegnando ad ogni coppia un valore di rango con segno, in cui il
segno rispecchia il segno della differenza. Quindi viene calcolato W_+, la
somma di tutti i ranghi con segno positivo. Come avviene per il test
rank-sum, questa statistica ha una distribuzione precisa nell'ipotesi nulla
che la differenza mediana sia zero, distribuzione che converte alla normale
nel caso di campioni abbastanza ampi.

Usando l'opzione --verbose con i test di Wilcoxon viene mostrato
l'ordinamento delle osservazioni (l'opzione non ha effetto se usata con il
test del segno).

Se il comando non ha dato errori, sono disponibili gli accessori "$test" e
"$pvalue". Per ottenere solo questi valori, si può usare l'opzione --quiet.

# discrete Transformations

Argomento:  lista-variabili
Opzione:    --reverse (marca le variabili come continue)
Esempi:     ooballot.inp, oprobit.inp

Marca ogni variabile della lista-variabili come discreta. In modalità
predefinita, tutte le variabili sono considerate come continue; marcando una
variabile come discreta, essa viene trattata in modo speciale nei diagrammi
di frequenza, e può esere usata con il comando "dummify".

Usando l'opzione --reverse, l'operazione viene invertita, ossia, le
variabili nella lista-variabili sono marcate come continue.

Accesso dal menù:    /Variabile/Modifica attributi

# dpanel Estimation

Argomento:  p ; depvar indepvars [ ; instruments ]
Opzioni:    --quiet (non mostra il modello stimato)
            --vcv (mostra la matrice di covarianza)
            --two-step (calcola la stima GMM a due passi)
            --system (aggiunge equazioni nei livelli)
            --time-dummies (aggiunge variabili dummy temporali)
            --dpdstyle (emula il pacchetto DPD per Ox)
            --asymptotic (errori standard asintotici non modificati)
            --keep-extra (vedi sotto)
Esempi:     dpanel 2 ; y x1 x2
            dpanel 2 ; y x1 x2 --system
            dpanel {2 3} ; y x1 x2 ; x1
            dpanel 1 ; y x1 x2 ; x1 GMM(x2,2,3)
            Vedi anche bbond98.inp

Stima modelli dinamici per dati di panel (in altre parole, modelli panel con
uno o più ritardi della variabile dipendente) usando il metodo GMM-DIF o
quello GMM-SYS.

Il paramtro p rappresenta l'ordine autoregressivo della variabile
dipendente. Nel caso più semplice si tratta di uno scalare, ma per
specificare un insieme di ritardi (non consecutivi) da è possibile indicare
una matrice definita in precedenza.

La variabile dipendente e i regressori dovrebbero essere indicati in
livelli; il comando provvede autonomamente a differenziarli (dato che questo
stimatore usa le differenze per eliminare gli effetti individuali).

L'ultimo campo (opzionale) nel comando serve a specificare gli strumenti. Se
questi ultimi non vengono indicati si assume che le variabili indipendenti
siano tutte strettamente esogene. Se si sceglie di specificare alcuni
strumenti è opportuno includere nell'elenco anche le variabili indipendenti
strettamente esogene. Nel caso di regressori predeterminati è possibile
usare la funzione GMM per includere uno specifico intervallo di ritardi
seguendo uno schema diagonale a blocchi. Una situazione di questo tipo è
stata illustrata in precedenza nel terzo esempio. Il primo argomento di GMM
è il nome della variabile in questione, il secondo è il ritardo minimo da
usare come strumento e il terzo è il ritardo massimo. La stessa sintassi
può essere utilizzata con la funzione GMMlevel per specificare strumenti di
tipo GMM per le equazioni nei livelli.

Di default vengono riportati (con errori standard robusti) i risultati della
stima al primo stadio; la stima al secondo stadio può essere richiesta
indicato l'opzione corrispondente. In entrambi i casi vengono forniti i test
di autocorrelazione del primo e del secondo ordine, così come il test di
sovraidentificazione di Sargan e un test di Wald della significatività
congiunta dei regressori. Si noti che in questo modello nelle differenze
l'autocorrelazione del primo ordine non impedisce che il modello sia valido;
l'autocorrelazione al secondo ordine, tuttavia, viola le ipotesi statistiche
che ne sono alla base.

Nel caso della stima a due passi, gli errori standard sono per default
calcolati usando la correzione per campioni finiti suggerita da Windmeijer
(2005). In generale l'inferenza basata sugli errori standard asintotici
associati allo stimatore al secondo stadio è considerata inaffidabile, ma
se per qualche ragione desiderate conoscere il loro valore potete usare
l'opzione --asymptotic per disattivare la correzione di Windmeijer.

Se viene indicata l'opzione --time-dummies il comando aggiunge ai regressori
specificati un insieme di variabili dummy. Il numero di queste ultime è
pari al numero massimo di periodi usati nella stima meno uno, allo scopo di
evitare di avere collinearità perfetta con la costante. Le dummy vengono
incluse in differenza, a meno che non sia indicata l'opzione --dpdstyle; in
questo caso le dummy sono incluse in livello.

Come per altri comandi di stima, un bundle di nome "$model" è disponibile
se il comando va a buon fine. Nel caso del comando dpanel, l'opzione
--keep-extra provoca l'inclusione nel bundle di elementi addizionali, e
cioè i pesi GMM e la matrice degli strumenti.

Per ulteriori dettagli ed esempi, si veda la guida all'uso di gretl (il
capitolo 24).

Accesso dal menù:    /Model/Panel/Dynamic panel model

# dummify Transformations

Argomento:  lista-variabili
Opzioni:    --drop-first (omette dalla codifica il valore minimo)
            --drop-last (omette dalla codifica il valore massimo)

Per ogni variabile rilevante nella lista-variabili, crea un insieme di
variabili dummy che codificano i valori distinti di quella variabile. Le
variabili rilevanti sono quelle che sono state marcate esplicitamente come
discrete, o quelle che assumono un numero limitato di valori che devono
essere "abbastanza arrotondati" (multipli di 0.25).

Per impostazione predefinita, viene aggiunta una variabile dummy per ognuno
dei valori distinti della variabile in questione. Ad esempio, se una
variabile discreta x ha 5 valori distinti, verranno create 5 variabili
dummy, di nome Dx_1, Dx_2 e così via. La prima variabile dummy avrà valore
1 per le osservazioni in cui x assume il suo valore minimo, e 0 altrove; la
successiva variabile dummy avrà valore 1 dove x assume il secondo tra i
suoi valori, e così via. Se viene usata una delle opzioni --drop-first o
--drop-last, il più basso o il più alto dei valori della variabile viene
omesso dalla codifica (questa funzione può essere utile per evitare la
cosiddetta "trappola delle variabili dummy").

Questo comando può anche essere usato nel contesto di una regressione. Ad
esempio, la riga seguente specifica un modello in cui y viene regredita
sull'insieme di variabili dummy che codificano x (in questo contesto non è
possibile passare opzioni al comando "dummify").

	ols y dummify(x)

# duration Estimation

Argomenti:  depvar indepvars [ ; censvar ]
Opzioni:    --exponential (usa la distribuzione esponenziale)
            --loglogistic (usa la distribuzione log-logistica)
            --lognormal (usa la distribuzione log-normale)
            --medians (i valori previsti sono mediane)
            --robust (errori standard robusti (QML))
            --cluster=clustvar (v. "logit" per una spiegazione)
            --vcv (mostra la matrice di covarianza)
            --verbose (mostra dettagli delle iterazioni)
            --quiet (non mostra nulla)
Esempi:     duration y 0 x1 x2
            duration y 0 x1 x2 ; cens
            Vedi anche weibull.inp

Stima un modello di durata: la variabile dipendente (che deve essere
positiva) rappresenta la durata di un certo fenomeno, per esempio la
lunghezza di un periodo di disoccupazione per una cross-section di
intervistati. Di default viene utilizzata una distribuzione Weibull, ma sono
disponibili anche le distribuzioni esponenziale, log-logistica e
log-normale.

Se alcune delle durate misurate sono censurate a destra (e.g. il periodo di
disoccupazione di un individuo non si è concluso all'interno del periodo di
osservazione), deve essere specificato l'argomento accessorio censvar che
indica una variabile i cui valori positivi segnalano osservazioni censurate
a destra.

Di default i valori stimati ottenuti mediante l'accessore "$yhat"
rappresentano le medie condizionali delle durate; se tuttavia viene indicata
l'opzione --medians, "$yhat" fornisce le mediane condizionali.

Vedi la guida all'uso di gretl (il capitolo 38) per ulteriori dettagli.

Accesso dal menù:    /Modello/Variabile dipendente limitata/Dati di durata

# elif Programming

Si veda "if".

# else Programming

Si veda "if". Si noti che "else" dev'essere su un linea a sé stante, prima
del comando corrispondente. Si può aggiungere un commento, come ad esempio

	else # OK, fa' un'altra cosa

ma non si può aggiungere un comando, come in

	else x = 5 # wrong!

# end Programming

Termina un blocco di comandi di qualsiasi tipo. Ad esempio, "end system"
termina un "system" (sistema di equazioni).

# endif Programming

Si veda "if".

# endloop Programming

Indica la fine di un ciclo (loop) di comandi. Si veda "loop".

# eqnprint Printing

Opzioni:    --complete (crea un documento completo)
            --output=filename (indirizza l'output ad uno specifico file)

Va eseguito dopo la stima di un modello. Stampa il modello stimato sotto
forma di equazione LaTeX. Se viene specificato un nome di file usando
l'opzione --output, il risultato viene scritto in quel file, altrimenti
viene scritto in un file il cui nome ha la forma equation_N.tex, dove N è
il numero di modelli stimati finora nella sessione in corso. Si veda anche
"tabprint".

Il file di output verrà scritto nella directory correntamente impostata
"workdir", a meno che la stringa filename contenga il percorso specifico
completo.

Usando l'opzione --complete, il file LaTeX è un documento completo, pronto
per essere processato; altrimenti il file va incluso in un documento.

Accesso dal menù:    Finestra del modello, /LaTeX

# equation Estimation

Argomenti:  variabile-dipendente variabili-indipendenti
Esempio:    equation y x1 x2 x3 const

Specifica un'equazione all'interno di un sistema di equazioni (si veda
"system"). La sintassi per specificare un'equazione in un sistema SUR è la
stessa usata ad esempio in "ols". Per un'equazione in un sistema con minimi
quadrati a tre stadi, invece è possibile usare una specificazione simile a
quella usata per OLS e indicare una lista di strumenti comuni usando
l'istruzione "instr" (si veda ancora "system"), oppure si può usare la
stessa sintassi di "tsls".

# estimate Estimation

Argomenti:  [ nome-sistema ] [ stimatore ]
Opzioni:    --iterate (itera fino alla convergenza)
            --no-df-corr (nessuna correzione per i gradi di libertà)
            --geomean (si veda oltre)
            --quiet (non mostra i risultati)
            --verbose (mostra i dettagli delle iterazioni)
Esempi:     estimate "Klein Model 1" method=fiml
            estimate Sys1 method=sur
            estimate Sys1 method=sur --iterate

Esegue la stima di un sistema di equazioni, che deve essere stato definito
in precedenza usando il comando "system". Per prima cosa va indicato il nome
del sistema, racchiuso tra virgolette se contiene spazi, quindi il tipo di
stimatore, preceduto dalla stringa method=. Gli stimatori disponibili sono:
"ols", "tsls", "sur", "3sls", "fiml" o "liml". Questi argomento sono
opzionali si il sistema in questione è già stato stimato e occupa il posto
dell'"ultimo modello"; in tal caso, per default viene usato il metodo di
stima precedente.

Se al sistema in questione sono stati imposti dei vincoli (si veda il
comando "restrict"), la stima sarà soggetta a tali vincoli.

Se il metodo di stima è "sur" o "3sls" e viene usata l'opzione --iterate,
lo stimatore verrà iterato. Nel caso di SUR, se la procedura converge, i
risultati saranno stime di massima verosimiglianza. Invece l'iterazione
della procedura dei minimi quadrati a tre stadi non produce in genere
risultati di massima verosimiglianza a informazione completa. L'opzione
--iterate viene ignorata con gli altri metodi di stima.

Se vengono scelti gli stimatori "equazione per equazione" "ols" o "tsls",
nel calcolo degli errori standard viene applicata in modo predefinito una
correzione per i gradi di libertà, che può essere disabilitata usando
l'opzione --no-df-corr. Questa opzione non ha effetti nel caso vengano usati
altri stimatori, che non prevedono correzioni per i gradi di libertà.

La formula usata in modo predefinito per calcolare gli elementi della
matrice di covarianza tra equazioni è

  sigma(i,j) = u(i)' * u(j) / T

Se viene usata l'opzione --geomean, viene applicata una correzione per i
gradi di libertà secondo la formula

  sigma(i,j) = u(i)' * u(j) / sqrt((T - ki) * (T - kj))

dove i k indicano il numero di parametri indipendenti in ogni equazione.

Se si usa l'opzione --verbose e un metodo iterativo, vengono mostrati i
dettagli delle iterazioni.

# eval Utilities

Argomento:  espressione
Esempi:     eval x
            eval inv(X'X)
            eval sqrt($pi)

Con questo comando, gretl diventa una specie di grande calcolatrice. Il
programma valuta l'espressione e stampa il risultato. L'argomento può
essere il nome di una variabile, o qualcosa di più complicato. In ogni
caso, dev'essere un'espressione ammissibile a destra dell'operatore di
assegnamento.

Si noti che un comando del tipo

	print x^2

non funziona in gretl, poiché x^2 non è (né può essere) il nome di una
variabile, ma (data una variabile scalare di nome x)

	eval x^2

funzionerà tranquillamente, e mostrerà il quadrato di x.

Vedi anche "printf", per il caso in cui si voglia combinare testo e output
numerici.

# fcast Prediction

Varianti:

	    fcast [oss-iniziale oss-finale]
	    [nome-variabile]

	    fcast [oss-iniziale oss-finale]

	  passi-avanti

	    [nome-variabile] --recursive

Opzioni:    --dynamic (crea previsioni dinamiche)
            --static (crea previsioni statiche)
            --out-of-sample (genera previsioni fuori dal campione)
            --no-stats (non mostra le statistiche di previsione)
            --stats-only (stampa solo le statistiche di previsione)
            --quiet (non mostra le previsioni)
            --recursive (vedi sotto)
            --plot=nome di file (vedi sotto)
Esempi:     fcast 1997:1 2001:4 f1
            fcast fit2
            fcast 2004:1 2008:3 4 rfcast --recursive
            Vedi anche gdp_midas.inp

Deve seguire un comando di stima. Calcola previsioni per un certo intervallo
delle osservazioni. L'intervallo può essere specificato indicando
oss-iniziale e oss-finale, oppure con l'opzione --out-of-sample (in questo
caso la previsione sarà per le osservazioni successive a quelle su cui è
stato stimato il modello); se non si usa alcuna opzione, l'intervallo sarà
quello attualmente impostato. Se si sceglie una previsione fuori dal
campione ma non sono disponibili osservazioni, viene segnalato un errore. A
seconda del tipo di modello, calcola anche gli errori standard (si veda
oltre). L'opzione --recursive produce un comportamento speciale spiegato
oltre.

Se l'ultimo modello stimato consiste in un'equazione singola, l'argomento
opzionale nome-variabile ha l'effetto seguente: i valori della previsione
non sono mostrati, ma vengono salvati nel dataset con il nome di variabile
indicato. Se l'ultimo modello stimato è un sistema di equazioni,
nome-variabile ha un effetto diverso, ossia seleziona una particolare
varabile endogena per cui effettuare la previsione (l'impostazione
predefinita consiste nel produrre previsioni per tutte le variabili
endogene). Nel caso del sistema, o se non viene specificata nome-variabile,
i valori della previsione possono essere recuperati usando la variabile
accessoria "$fcast", mentre gli errori standard, se disponibili, sono
recuperabili con "$fcse".

La scelta tra previsione statica e dinamica è rilevante solo nel caso di
modelli dinamici, che comprendono un processo di errore autoregressivo, o
che comprendono uno o più valori ritardati della variabile dipendente come
regressori. Le previsioni statiche sono per il periodo successivo, basate
sui valori effettivi nel periodo precedente, mentre quelle dinamiche usano
la regola della previsione a catena. Ad esempio, se la previsione per y nel
2008 richiede come input il valore di y nel 2007, non è possibile calcolare
una previsione statica se non si hanno dati per il 2007. È possibile
calcolare una previsione dinamica per il 2008 se si dispone di una
precedente previsione per y nel 2007.

La scelta predefinita consiste nel fornire una previsione statica per ogni
porzione dell'intervallo di previsione che fa parte dell'intervallo del
campione su cui il modello è stato stimato, e una previsione dinamica (se
rilevante) fuori dal campione. L'opzione dynamic richiede di produrre
previsioni dinamiche a partire dalla prima data possibile, mentre l'opzione
static richiede di produrre previsioni statiche anche fuori dal campione.

L'opzione recursive al momento è disponibile solo per i modelli composti da
una singola equazione e stimati via OLS. Quando si usa questa opzione, le
previsioni calcolate sono ricorsive, ossia: ogni previsione è generata da
una stima del modello che usa i dati a partire da un certo punto fisso
(ossia l'inizio dell'intervallo del campione usato per la stima originaria)
fino alla data di previsione meno k osservazioni, dove k è il numero di
passi-avanti specificato come argomento. Le previsioni sono sempre dinamiche
quando è possibile. Si noti che l'argomento passi-avanti deve essere
utilizzato solo insieme all'opzione recursive.

L'opzione --plot (disponibile solo nel caso della stima di un modello
uniequazionale) consente di ottenere un file con un grafico delle
previsioni. L'estensione dell'argomento filename di questa opzione controlla
il formato del grafico: .eps per EPS, .pdf per PDF, .png per PNG, .plt per
un file di comandi gnuplot. Il nome di file dummy display può essere usato
per mostrare il grafico in una finestra. Per esempio,

	fcast --plot=fc.pdf

genererà un grafico in formato PDF. Vengono rispettati gli indirizzi di
file assoluti; in caso contrario i fail vengono scritti nella directory di
lavoro di gretl.

La natura degli errori standard della previsione (se disponibili) dipende
dalla natura del modello e della previsione. Per i modelli lineari statici,
gli errori standard sono calcolati seguendo il metodo descritto in Davidson
e MacKinnon (2004); essi incorporano sia l'incertezza dovuta al processo
d'errore, sia l'incertezza dei parametri (sintetizzata dalla matrice di
covarianza delle stime dei parametri). Per modelli dinamici, gli errori
standard della previsione sono calcolati solo nel caso di previsione
dinamica, e non incorporano incertezza dei parametri. Per modelli non
lineari, al momento non sono disponibili errori standard della previsione.

Accesso dal menù:    Finestra del modello, /Analisi/Previsioni

# flush Programming

Questo semplice comando non ha argomenti né opzioni; è pensato per
l'esecuzione di script, la cui esecuzione richieda qualche tempo, attraverso
l'interfaccia grafica (la versione di gretl da linea di comando lo ignora).
L'idea è di fornire all'utente un'indicazione visuale che sta succedendo
qualcosa e il programma non si è "piantato".

Normalmente, quando uno script viene fatto girare nel client grafico, non
viene mostrato alcun output finché l'esecuzione non è completa; se perà
si usa flush l'effetto prodotto è il seguente:

  Alla prima invocazione, gretl apre una finestra, mostra l'output prodotto
  fino a quel momento, e aggiunge il messaggio "elaborazione in corso...".

  Ad ogni invocazione successiva, il testo mostrato nella finestra di output
  viene aggiornato e un nuovo messaggio "elaborazione in corso..." viene
  aggiunto.

Tutto il resto dell'output viene automaticamente mostrato al completamenteo
dell'esecuzione dello script.

Attenzione: non ha senso usare flush in uno script la cui esecuzione
richiede pochi secondi. Inoltre, bisognerebbe evitare di usare questo
comando in un punto dello script dove non c'è più output da mostrare,
perché il messaggio "elaborazione in corso..." risulterebbe fuorviante.

L'uso che abbiamo in mente per il comando flush è esemplificato dal
seguente frammento:

	set echo off
	scalar n = 10
	loop i=1..n
	# qualcosa che richiede del tempo
	loop 100 --quiet
	a = mnormal(200,200)
	b = inv(a)
	endloop
	# stampa qualcosa in output
	printf "Iterazione %2d fatta\n", i
	if i < n
	flush
	endif
	endloop

# foreign Programming

Sintassi:   foreign language=lang
Opzioni:    --send-data (pre-carica il dataset attuale)
            --quiet (sopprime l'output dal programma esterno)

Questo comando apre una modalità speciale, in cui vengono accettati comandi
che verranno eseguiti da un programma esterno. Con il comando end foreign si
esce da questa modalità e i comandi verranno eseguiti.

Al momento, i programmi esterni compatibili con questa modalità sono GNU R
(language=R), Ox di Jurgen Doornik Ox (language=Ox), GNU Octave
(language=Octave), Python, Julia e Stata. I nomi dei programmi esterni sono
case-insensitive.

Con R, Octave e Stata l'opzione --send-data ha l'effetto di rendere
disponibile all'interno del programma di destinazione l'intero dataset
corrente. È possibile limitare l'invio dell'intero dataset al programma di
destinazione attraverso la creazione preventiva di una lista di variabili, a
cui va assegnato un nome che dovrà essere dato in specifica al comando. Di
seguito un esempio:

	list Rlist = x1 x2 x3
	foreign language=R --send-data=Rlist

Si veda la guida all'uso di gretl (il capitolo 44) per dettagli ed esempi.

# fractint Statistics

Argomenti:  series [ order ]
Opzioni:    --gph (calcola il test di Geweke e Porter-Hudak)
            --all (calcola entrambi i test)
            --quiet (non mostra i risultati)

Verifica la presenza di integrazione frazionale ("long memory") per la
variabile specificata. L'ipotesi nulla è che l'ordine di integrazione della
variabile sia zero. Di default viene utilizzato lo stimatore locale di
Whittle (Robinson, 1995), ma se si indica l'opzione --gph il comando usa il
test GPH (Geweke e Porter-Hudak, 1983). L'opzione --all permette di ottenere
i risultati di entrambi i test.

Per maggiori dettagli su questo tipo di test, v. Phillips e Shimotsu (2004).

Se non si specifica l'argomento opzionale order, l'ordine del test (o dei
test) è automaticamente fissato al più piccolo fra T/2 e T^0.6.

Gli ordini di integrazione stimati e i loro errori standard sono disponibili
con l'accessore "$result". Con l'opzione --all, lo stimatore Local Whittle
è nella prima riga e il GPH nella seconda.

I risultati possono essere recuperati usando gli accessori "$test" e
"$pvalue". Questi valori sono basati sullo stimatore locale di Whittle a
meno che non sia stata indicata l'opzione --gph.

Accesso dal menù:    /Variabile/Test per radici unitarie/Integrazione frazionale

# freq Statistics

Argomento:  variabile
Opzioni:    --nbins=n (specifica il numero di intervalli)
            --min=minval (specifica il valore minimo, v. oltre)
            --binwidth=width (specifica l'ampiezza degli intervalli, v. oltre)
            --normal (test per la distribuzione normale)
            --gamma (test per la distribuzione gamma)
            --silent (non mostra nulla)
            --matrix=nome (usa una colonna di una matrice indicata per nome)
            --show-plot (v. oltre)
            --quiet (non mostra il grafico)
Esempi:     freq x
            freq x --normal
            freq x --nbins=5
            freq x --min=0 --binwidth=0.10

Se non vengono indicate opzioni, mostra la distribuzione di frequenza per la
variabile (indicata con il nome o il numero).

Se viene indicata l'opzione --matrix, var (che deve essere un intero) viene
invece interpretato come un indice di base 1 che individua una colonna in
una matrice indicata per nome. Nel caso in cui la matrice in questione sia
un vettore colonna allora l'argomento var può essere omesso.

Per controllare la presentazione della distribuzione è possibile
specificare o il numero di intervalli o il valore minimo più l'ampiezza
degli intervalli, come illustrato negli ultimi due esempi precedenti.
L'opzione --min fissa il limite inferiore dell'intervallo più a sinistra.

Usando l'opzione --normal, vengono mostrati i risultati del test chi-quadro
di Doornik-Hansen per la normalità. Usando l'opzione --gamma, al posto del
test di normalità viene eseguito il test non parametrico di Locke per
l'ipotesi nulla che la variabile segua la distribuzione gamma; si veda Locke
(1976), Shapiro e Chen (2001). Si noti che la parametrizzazione della
distribuzione gamma in gretl è (forma, scala).

Di default, viene mostrato un grafico della distribuzione se il programma
non è in batch mode ma in modalità interattiva. Questo comportamento può
essere modulato con l'opzione --plot. I parametri accettabili per questa
opzione sono none, per sopprimere il grafico, display, per mostrare il
grafico a video anche in batch mode, o un nome di file. L'effetto del
fornire un nome di file è lo stesso di quello descritto dall'opzione
--output del comando "gnuplot".

In modalità interattiva viene mostrato anche un grafico della
distribuzione, a meno che non si usi l'opzione --quiet. Per converso, il
grafico non viene mostrato quando il comando è invocato da script, a meno
che non venga usata l'opzione --show-plot. (Questo non si applica alla
versione di gretl a linea di comando, gretlcli.)

L'opzione --silent sopprime interamente l'output mostrato di solito. Ha
senso usarla insieme a una delle opzioni riguardanti la distribuzione: in
questo modo la statistica test e il suo p-value verranno salvati, e potranno
essere recuperati attraverso l'utilizzo degli accessori "$test" e "$pvalue".
Può anche essere utilizzato assieme all'opzione --plot se si è solamente
interessati alla visione dei relativi istogrammi e non si è interessati al
resto del testo.

Si noti che in gretl non è disponibile una funzione che è parallela a
questo comando, ma è possibile utilizzare una funzione parallela che
permette di raggiungere lo stesso scopo, che è "aggregate". Inoltre la
distribuzione di frequenza costruita con il comando freq può essere
ottenuta in forma matriciale attraverso l'utilizzo dell'accessore "$result".

Accesso dal menù:    /Variabile/Distribuzione di frequenza

# funcerr Programming

Argomento:  [ messaggio ]

Questo comando è utilizzabile soltanto nel contesto di funzioni definite
dall'utente (vedi "function"); esso provoca un'interruzione della funzione
con errore.

Il parametro opzionale messaggio dev'essere una stringa (anche sotto forma
di variabile); se presente, viene stampato assieme al messaggio di errore
inviato alla funzione chiamante.

# function Programming

Argomento:  nome_funzione

Apre un blocco di istruzioni che definiscono una funzione. Il blocco va
chiuso con end function. (Eccezione: per cancellare dalla memoria una
funzione definita dall'utente, si usa il comando function pippo delete, dove
"pippo" è la funzione da cancellare.) Per maggiori dettagli, si veda la
guida all'uso di gretl (il capitolo 14).

# garch Estimation

Argomenti:  p q ; variabile-dipendente [ variabili-indipendenti ]
Opzioni:    --robust (errori standard robusti)
            --verbose (mostra i dettagli delle iterazioni)
            --quiet (non stampa nulla)
            --vcv (mostra la matrice di covarianza)
            --nc (non include una costante)
            --stdresid (standardizza i residui)
            --fcp (usa l'algoritmo di Fiorentini, Calzolari e Panattoni)
            --arma-init (parametri di varianza iniziale da ARMA)
Esempi:     garch 1 1 ; y
            garch 1 1 ; y 0 x1 x2 --robust
            Vedi anche garch.inp, sw_ch14.inp

Stima un modello GARCH (Generalized Autoregressive Conditional
Heteroskedasticity) univariato, o, se sono specificate delle
variabili-indipendenti, includendo delle variabili esogene. I valori interi
p e q (che possono essere indicati in forma numerica o col nome di variabili
scalari preesistenti) rappresentano gli ordini di ritardo nell'equazione
della varianza condizionale.

  h(t) = a(0) + somma(per i da 1 a q) a(i)*u(t-i)^2 + somma( per j da 1 a p) b(j)*h(t-j)

Il parametro p rappresenta quindi l'ordine generalizzato (o "AR"), mentre q
rappresenta il consueto ordine ARCH (o "MA"). Se p è diverso da zero, anche
q deve essere diverso da zero, altrimenti il modello non è identificato.
Comunque, è possibile stimare un semplice modello ARCH impostando q a un
valore positivo e p a zero. La somma di p e q non deve superare 5. Si noti
che nell'equazione della media viene automaticamente inclusa una costante, a
meno che non si usi l'opzione --nc.

Per impostazione predefinita, i modelli GARCH vengono stimati usando il
codice nativo gretl, ma è anche possibile usare l'algoritmo di Fiorentini,
Calzolari e Panattoni (1996). Il primo usa il massimizzatore BFGS, mentre il
secondo usa un algoritmo di tipo Newton-Raphson con la matrice di
informazione e un successivo raffinamento usando l'Hessiana.

Sono disponibili varie stime della matrice di covarianza dei coefficienti.
Il metodo predefinito è quello dell'Hessiana, a meno che non si usi
l'opzione --robust, nel qual caso viene usata la matrice di covarianza QML
(White). Altre possibilità (ad es. la matrice di informazione, o lo
stimatore di Bollerslev-Wooldridge) possono essere specificate con il
comando "set".

In modalità predefinita, le stime dei parametri di varianza sono
inizializzate usando la varianza dell'errore non condizionale, ottenuta
dalla stima OLS iniziale, per la costante, e piccoli valori positivi per i
coefficienti dei valori passati dell'errore al quadrato e per la varianza
dell'errore. L'opzione --arma-init fa in modo che i valori iniziali per
questi parametri siano ricavati da un modello ARMA iniziale, sfruttando la
relazione tra GARCH e ARMA mostrata nel capitolo 21 di Time Series Analysis
di Hamilton. In alcuni casi, questo metodo può aumentare le probabilità di
convergenza.

I residui GARCH e la varianza condizionale stimata sono memorizzate
rispettivamente nelle variabili "$uhat" e "$h". Ad esempio, per ottenere la
varianza condizionale è possibile scrivere:

      genr ht = $h

Con l'opzione --stdresid, i valori di "$uhat" vengono divisi per la radice
di h_t.

Accesso dal menù:    /Modello/Serie storiche/GARCH

# genr Dataset

Argomenti:  nuova-variabile = formula

NOTA: questo comando ha subito molti cambiamenti e migliorie da quando
l'help seguente è stato scritto, per cui per informazioni complete e
aggiornate consigliamo di far riferimento alla guida all'uso di gretl (il
capitolo 10). D'altro canto, il testo che segue non contiene informazioni
erronee, per cui può essere interpretato come "questo ed altro".

In contesti appropriati, series, scalar, matrix, string e bundle sono
sinonimi per questo comando.

Crea nuove variabili, di solito per mezzo di trasformazioni di variabili
esistenti. Si veda anche "diff", "logs", "lags", "ldiff", "sdiff" e "square"
per alcune scorciatoie. Nel contesto di una formula genr, le variabili
esistenti devono essere referenziate per nome, non per numero
identificativo. La formula dev'essere una combinazione ben definita di nomi
di variabile, costanti, operatori e funzioni (descritte oltre). Ulteriori
dettagli su alcuni aspetti di questo comando si possono trovare nella guida
all'uso di gretl (il capitolo 10).

Il comando genr può produrre come risultato una serie o uno scalare. Ad
esempio, la formula x2 = x * 2 produce una serie se la variabile x è una
serie e uno scalare se x è uno scalare. Le formule x = 0 e mx = mean(x)
producono degli scalari. In alcune circostanze, può essere utile che un
risultato scalare sia espanso in una serie o in un vettore: è possibile
ottenere questo risultato usando series come "alias" per il comando genr. Ad
esempio, series x = 0 produce una serie con tutti i valori pari a 0. Allo
stesso modo, è possibile usare scalar come alias per genr, ma non è
possibile forzare un risultato vettoriale in uno scalare: con questa parola
chiave si indica che il risultato dovrebbe essere uno scalare; se non lo è,
viene emesso un messaggio di errore.

Quando una formula produce come risultato una serie, l'intervallo su cui
essi sono definiti dipende dall'impostazione attuale del campione. È quindi
possibile definire una serie a pezzi, alternando l'uso dei comandi smpl e
genr.

Gli operatori aritmetici supportati sono, in ordine di precedenza: ^
(esponenziale); *, / e % (modulo o resto); + e -.

Gli operatori Booleani disponibili sono (ancora in ordine di precedenza): !
(negazione), && (AND logico), || (OR logico), >, <, =, >= (maggiore o
uguale), <= (minore o uguale) e != (disuguale). Gli operatori Booleani
possono essere usati per costuire variabili dummy: ad esempio (x > 10)
produce 1 se x > 10, 0 altrimenti.

Le costanti predefinite sono pi e NA. L'ultima rappresenta il codice per i
valori mancanti: è possibile inizializzare una variabile con valori
mancanti usando scalar x = NA.

Il comando genr supporta un'ampia gamma di funzioni matematiche e
statistiche, da quelle più comuni a quelle di uso specifico in econometria.
Inoltre offre l'accesso a numerose variabili interne che vengono definite
nel corso della stima di regressioni, dell'esecuzione di test, e così via.
Per un elenco delle funzioni e degli accessori, eseguire: "help functions".

Oltre agli operatori e alle funzioni mostrati, ci sono alcuni usi speciali
del comando "genr":

  "genr time" crea una variabile trend temporale (1,2,3,...) chiamata
  "time". "genr index" fa la stessa cosa, ma chiamando la variabile index.

  "genr dummy" crea una serie di variabili dummy a seconda della
  periodicità dei dati. Ad esempio, nel caso di dati trimestrali
  (periodicità 4) il programma crea dq1, che vale 1 nel primo trimestre e 0
  altrove, dq2 che vale 1 nel secondo trimestre e 0 altrove, e così via.
  Nel caso di dati mensili, le dummy si chiamano dm1, dm2 e così via. Con
  altre frequenze dei dati, i nomi delle dummy sono dummy_1, dummy2, ecc.

  "genr unitdum" e "genr timedum" creano insiemi di variabili dummy speciali
  da usare in un dataset di tipo panel. Il primo comando crea dummy che
  rappresentano le unità cross section, il secondo i periodi di
  osservazione.

Nota: nella versione a riga di comando del programma, i comandi "genr" che
estraggono dati relativi al modello si riferiscono sempre al modello stimato
per ultimo. Questo vale anche per la versione grafica del programma se si
usa "genr" nel "terminale di gretl" o si immette una formula usando
l'opzione "Definisci nuova variabile" nel menù Variabile della finestra
principale. Usando la versione grafica, però, è possibile anche estrarre i
dati da qualunque modello mostrato in una finestra (anche se non è il
modello più recente) usando il menù "Analisi" nella finestra del modello.

La variabile speciale obs serve da indice per le osservazioni. Ad esempio,
genr dum = (obs==15) crea una variabile dummy che vale 1 per l'osservazione
15 e 0 altrove. È anche possibile usare questa variabile per selezionare
alcune osservazioni particolari secondo la data o il nome. Ad esempio genr d
= (obs>1986:4), genr d = (obs>"2008/04/01"), oppure genr d = (obs=="CA").
Quando si usano in questo contesto date giornaliere o etichette per le
osservazioni, bisogna racchiuderle fra virgolette. Questo non è necessario
per date trimestrali o annuali. Si noti che, per serie storiche annuali,
l'anno non è sintatticmante distiguibile da un semplice intero; per cui,
per confrontare un'osservazione con obs per anno, bisogna usare la funzione
obsnum per convertire l'anno in un numero progressivo, come ad esempio in in
genr d = (obs>obsnum(1986)).

È possibile estrarre dei valori scalari da una serie usando una formula
genr con la sintassi nome-variabile[osservazione]. Il valore di osservazione
può essere specificato con un numero o una data. Esempi: x[5],
CPI[1996:01]. Per i dati giornalieri occorre usare la forma AAAA/MM/GG, ad
esempio ibm[1970/01/23].

È possibile modificare una singola osservazione in una serie usando genr.
Per farlo, occorre aggiungere un numero di osservazione o una data valida
tra parentesi quadre al nome della variabile nel lato sinistro della
formula. Ad esempio: genr x[3] = 30 o genr x[1950:04] = 303.7.

  Formula                Commento
  -------                -------
  y = x1^3               x1 al cubo
  y = ln((x1+x2)/x3)
  z = x>y                z(t) = 1 se x(t) > y(t), 0 altrove
  y = x(-2)              x ritardata di 2 periodi
  y = x(+2)              x anticipata di 2 periodi
  y = diff(x)            y(t) = x(t) - x(t-1)
  y = ldiff(x)           y(t) = log x(t) - log x(t-1), il tasso di crescita
                         istantaneo di x
  y = sort(x)            ordina x in senso crescente e la salva in y
  y = dsort(x)           ordina x in senso decrescente
  y = int(x)             tronca x e salva il valore intero in y
  y = abs(x)             salva il valore assoluto di x
  y = sum(x)             somma i valori di x escludendo i valori mancanti NA
  y = cum(x)             cumulativa: y(t) = somma di x(s) per s da 1 a t
  aa = $ess              imposta aa uguale alla somma dei quadrati degli
                         errori dell'ultima regressione
  x = $coeff(sqft)       estrae il coefficiente stimato per la variabile sqft
                         nell'ultima regressione
  rho4 = $rho(4)         estrae il coefficiente di autoregressione del quarto
                         ordine dall'ultimo modello (presume un modello ar
                         model)
  cvx1x2 = $vcv(x1, x2)  estrae il coefficiente di covarianza stimato tra le
                         variabili x1 e x2 dall'ultimo modello
  foo = uniform()        variabile pseudo-casuale uniforme nell'intervallo 0-1
  bar = 3 * normal()     variabile pseudo-casuale normale con mu = 0, sigma =
                         3
  samp = ok(x)           vale 1 per le osservazioni dove il valore di x non è
                         mancante.

Accesso dal menù:    /Variabile/Definisci nuova variabile
Accesso alternativo: Menù pop-up nella finestra principale

# gmm Estimation

Opzioni:    --two-step (Stima a due passi)
            --iterate (GMM iterato)
            --vcv (Mostra la matrice di covarianza)
            --verbose (Mostra i dettagli delle iterazioni)
            --quiet (non stampa nulla)
            --lbfgs (usa il massimizzatore L-BFGS-B anziché il BFGS standard)
Esempi:     hall_cbapm.inp

Esegue la stima col metodo dei momenti generalizzato (Generalized Method of
Moments, GMM) usando l'algoritmo BFGS (Broyden, Fletcher, Goldfarb, Shanno).
Occorre specificare uno o più comandi per aggiornare le quantità rilevanti
(tipicamente i residui GMM), una o più condizioni di ortogonalità, una
matrice iniziale dei pesi e un elenco dei parametri da stimare, il tutto
racchiuso tra le parole chiave gmm e end gmm. Ogni opzione aggiuntiva va
messa nella riga del comando end gmm.

Si veda la guida all'uso di gretl (il capitolo 27) per i dettagli. Quello
che segue è un semplice esempio illustrativo.

	gmm e = y - X*b
	orthog e ; W
	weights V
	params b
	end gmm

Nell'esempio si assume che y e X siano matrici di dati, b sia un vettore con
i valori dei parametri, W sia una matrice di strumenti, e V un'appropriata
matrice dei pesi. La dichiarazione

	orthog e ; W

indica che il vettore dei residui e è in linea di principio ortogonale ad
ognuno degli strumenti che compongono le colonne di W.

Nome dei parametri

Nella stima di un modello non lineare spesso risulta conveniente rinominare
i parametri in maniera concisa. Durante la stampa dei risultati, comunque,
risulta desiderabile l'utilizzo di etichette il più informative possibile.
Questo può essere fatto attraverso l'aggiunta della parola chiave
param_names dentro il blocco di comando. Per un modello con k parametri
l'argomento che segue questa parola chiave dovrebbe essere o una stringa
letterale contenente tutti i k nomi separati da spazi e racchiusi dentro le
doppie virgolette, oppure il nome di nome di una variabile stringa
contenente tutti k nomi dell'elenco.

Accesso dal menù:    /Modello/GMM

# gnuplot Graphs

Argomenti:  variabili-y variabile-x [ variabile-dummy ]
Opzioni:    --with-lines[=varspec] (usa linee invece che punti)
            --with-lp[=varspec] (usa linee e punti)
            --with-impulses[=varspec] (usa linee verticali)
            --with-steps[=varspec] (usa segmenti orizzontali e verticali)
            --time-series (mostra rispetto al tempo)
            --single-yaxis (forza l'uso di un solo asse delle ordinate)
            --ylogscale[=base] (ordinate in scala logaritmica)
            --dummy (si veda sotto)
            --fit=fitspec (si veda sotto)
            --font=fontspec (si veda sotto)
            --band=bandspec (si veda sotto)
            --band-style=style (si veda sotto)
            --matrix=name (mostra le colonne di una data matrice)
            --output=filename (ridirige l'output su file)
            --input=filename (prende l'input da file)
Esempi:     gnuplot y1 y2 x
            gnuplot x --time-series --with-lines
            gnuplot wages educ gender --dummy
            gnuplot y x --fit=quadratic
            gnuplot y1 y2 x --with-lines=y2

Le variabili nella lista variabili-y vengono mostrate rispetto alla
variabile variabile-x. Per avere un grafico storico è possibile usare time
come variabile-x, oppure usare l'opzione --time-series. Vedi anche i comandi
"plot" e "panplot".

Per default, i dati sono mostrati come punti; ma questa scelta può essere
modificata usando una delle opzioni --with-lines, --with-lp o
--with-impulses. Se il grafico contiene più di una serie, l'effetto di
queste opzioni può essere limitato ad un sottoinsieme delle variabili
usando il parametro varspec. Esso deve essere dato sotto forma di una lista
separata da virgole dei nomi (o dei numeri) delle variabili da tracciare con
linee e/o con impulsi. L'ultimo tra gli esempi di cui sopra mostra come
tracciare y1 e y2 contro x, in modo tale che y2 sia rappresentata da una
linea ma y1 da punti.

Usando l'opzione --dummy, occorre fornire esattamente tre variabili: una
variabile y, una variabile x, e una variabile dummy dumvar. L'effetto è
quello di mostrare y rispetto a x colorando in modo diverso i vari punti, a
seconda che dumvar valga 1 o 0.

Usando l'opzione --ylogscale si punò far sì che l'asse delle ordinate sia
logaritmico anziché lineare. L'opzione accetta un parametro come base. Ad
esempio,

	gnuplot y x --ylogscale=2

produce un grafico in cui l'asse delle ordinate è espresso in termini di
potenze di 2. Se la base è omessa, si userà il valore 10.

Creare un grafico da dati in una matrice

In generale è necessario specificare sia l'argomento yvars che quello xvar;
entrambi devono indicare variabili nel dataset corrente (per nome o numero
identificativo). Se tuttavia viene specificata con l'opzione --matrix una
matrice definita in precedenza questi argomenti diventano opzionali: se la
matrice specificata ha k colonne, di default le prime k - 1 sono considerate
come yvars, e l'ultima come xvar. Se viene indicata l'opzione --time-series,
tuttavia, il comando fornisce il grafico di tutte le k variabili rispetto al
tempo. Se si desidera il grafico solo di alcune colonne della matrice è
necessario identificare yvars e xvar fornendo l'indice delle colonne
corrispondenti, dove la prima colonna ha indice 1. Per esempio, se si
desidera un grafico a dispersione della colonna 2 della matrice M rispetto
alla colonna 1, il comando da digitare è:

	gnuplot 2 1 --matrix=M

Mostrare una linea interpolante

L'opzione "fit" si applica solo al caso di un diagramma a dispersione
bivariato, o quando il grafico contiene un'unica serie storica. Il
comportamento predefinito consiste nel mostrare la linea con le stime OLS,
se il coefficiente di pendenza è significativo almeno al 10 per cento.
Azioni diverse possono essere effettuate usando questa opzione con una delle
seguenti specificazioni fitspec. Se il grafico contiene un'unica serie
storica, x è implicitamente dato dal tempo.

  linear: la linea OLS viene mostrata a prescindere dalla sua
  significatività.

  none: non mostrare alcuna interpolazione.

  inverse, quadratic, cubic, semilog o linlog: mostrano una linea
  interpolante basata su una regressione del tipo corrispondente. Per
  semilog, si intende una regressione del logaritmo y on x; la linea
  interpolante mostra la media condizionale di y, ottenuta per
  esponenziazione. Per linlog, si intende una regressione di y sul logaritmo
  di x.

  loess: usa una regressione robusta ponderata localmente (anche nota come
  "lowess").

Bande

L'opzione --band si usa per mostrare zero o più serie assieme ad una
"banda" (spesso, ma non sempre, associata ad un intervallo di confidenza).
Questa opzione richede due parametri, separati da una virgola: il nome (o
numero ID) di una serie con il centro della banda e il nome(o numero ID) di
una con la sua ampiezza: l'effetto ottenuto è una banda con coordinate in
ordinata date dal centro, più o meno l'ampiezza. Si può usare un terzo
parametro opzionale (anch'esso separato da virgola), dato da uno scalare,
per specificare un moltiplicatore per l'ampiezza. Ad esempio, il codice che
segue disegna y assieme ad una banda di 1.96 volte se_y:

	gnuplot y --time-series --band=y,se_y,1.96 --with-lines

Assieme all'opzione --band, esiste l'opzione --band-style per controllare
l'aspetto della banda. Di default, i limiti alto e basso vengono mostrati
con linee continue, ma i parametri fill, dash, bars o step alterano questa
scelta, usando rispettivamente un'area, linee tratteggiate, barre verticali
o scalini. In più, si può aggiungere una specificazione di colore (dopo
una virgola). Ad esempio:

	gnuplot ... --band-style=fill
	gnuplot ... --band-style=dash,0xbbddff
	gnuplot ... --band-style=,black
	gnuplot ... --band-style=bars,blue

Il primo esempio produce un'area col colore di default; il secondo passa a
linee tratteggiate in un azzurro grigiastro; il terzo, linee continue nere,
e l'ultimo barre blu. Si noti che i colori possono essere dati con specifica
esadecimale o nomi (in inglese); la lista dei colori ammessi da gnuplotpuò
essere viaulizzata dando il comando "show colornames" in gnuplot, o
eseguendo nella console di gretl il comando

	eval readfile("@gretldir/data/gnuplot/gpcolors.txt")

Barre di recessione

L'opzione "band" descritta sopra può inoltre essere utilizzata per
aggiungere di barre di recessione al grafico. Con ciò si intendono delle
barre verticali che occuperanno l'intera dimensione y del grafico ed
indicando la presenza (con barra) o l'assenza (senza barra) di alcune
caratteristiche qualitative in grafico di serie storiche. Queste barre sono
comunemente utilizzate per indicare periodi di recessione/periodi di
guerra/qualasiasi cosa possa essere codificata da una variabile dummy 0/1.

In questo contesto l'opzione --band richiede un solo paramentro:
l'identificatore di serie con valori 0 e 1, dove 1 indica "on" e 0 indica
"off". L'opzione --band-style può essere utilizzata per specificare il
colore delle barre, dando o l'idendificatore esadecimale del colore o il
nome riconosciuto da gnuplot (vedi la sezione precedente). Un esempio che
mostra l'utilizzo del comandso su una singola barra è il seguente:

	open AWM17 --quiet
	series dum = obs >= 1990:1 && obs <= 1994:2
	gnuplot YER URX --with-lines --time-series \
	--band=dum --band-style=0xcccccc --output=display \
	{set key top left;}

Controllo dell'output

In modalità interattiva il risultato è mostrato immediatamente. In
modalità "batch", viene scritto un file di comandi gnuplot, chiamato
gpttmpN.plt, a partire da N = 01; il grafico vero e proprio può essere
generato usando il programma gnuplot (su MS Windows: wgnuplot). Questo
comportamento può essere modificato usando l'opzione --output=filename, che
controlla il nome del file utilizzato e contemporaneamente permette di
specificare un particolare formato di output usando l'estensione del nome
del file (le tre lettere che seguono il .): .eps produce un file
Encapsulated PostScript (EPS); .pdf produce un file PDF; .png produce un
formato PNG, .emf un formato EMF (Enhanced MetaFile), .fig un file Xfig, e
.svg uno SVG (Scalable Vector Graphics). Se come nome del file si indica
"display", il grafico è inviato allo schermo come nella modalità
interattiva. Se si indica un nome del file con un'estensione diversa da
quelle appena citate viene prodotto un file di comandi gnuplot.

Specificare un font

L'opzione --font può essere utilizzata per specificare un particolare tipo
di font per il grafico. Il parametro fontspec dovrebbe assumere la forma del
nome di un carattere, ed opzionalmente dovrebbe essere seguito da la
grandezza dei punti (separati dal nome da una virgola od uno spazione, il
tutto messo dentro le doppie virgolette ""). Di seguito un esempio:

	--font="serif,12"

Nota: i font disponibili per gnuplot variano da piattaforma a piattaforma,
quindi se si intende scrivere un comando di plot portabile allora è
consigliabile optare per font generici come sans oppure serif.

Aggiungere comandi gnuplot

È disponibile un'ulteriore opzione per questo comando: dopo la
specificazione delle variabili e le eventuali opzioni, è possibile
aggiungere direttamente dei comandi gnuplot per modificare l'aspetto visivo
del grafico (ad esempio, impostando il titolo e o gli intervalli degli
assi). Questi comandi aggiuntivi vanno inclusi tra parentesi graffe e ogni
comando va separato con un punto e virgola; è possibile usare una barra
rovesciata (\) per continuare un gruppo di comandi gnuplot sulla riga
successiva. Ecco un esempio della sintassi:

	{ set title 'Il mio titolo'; set yrange [0:1000]; }

Accesso dal menù:    /Visualizza/Grafico
Accesso alternativo: Menù pop-up nella finestra principale, pulsante grafico sulla barra degli strumenti

# graphpg Graphs

Varianti:   graphpg add
            graphpg fontscale value
            graphpg show
            graphpg free
            graphpg --output=filename

La "pagina dei grafici" funzionerà solo se si è installato il sistema di
composizione LaTeX e si è in grado di generare e visualizzare file in
formato postscript.

Nella finestra della sessione, è possibile trascinare fino a otto grafici
sull'icona della pagina dei grafici. Facendo doppio clic sull'icona della
pagina dei grafici (o facendo clic col tasto destro e selezionando
"Mostra"), la pagina contenente i grafici selezionati verrà composta e
aperta con il proprio visualizzatore di file postscript, da cui sarà
possibile stamparla.

Per pulire la pagina dei grafici, fare clic col tasto destro sull'icona e
selezionare "Pulisci".

Su sistemi diversi da MS Windows, può essere necessario modificare
l'impostazione del programma per visualizzare il postscript, che si trova
nella sezione "Programmi" della finestra di dialogo delle Preferenze di
gretl (nel menù Strumenti della finestra principale).

È anche possibile operare sulla pagina del grafico via script, oppure
usando la console (nel programma GUI). Sono disponibili i comandi seguenti:

Per aggiungere un grafico alla pagina dei grafici, digitate il comando
graphpg add dopo aver salvato un grafico con un nome, come in

	grf1 <- gnuplot Y X
	graphpg add

Per aprire la pagina dei grafici: graphpg show.

Per svuotare la pagina dei grafici: graphpg free.

Per modificare la dimensione del font usato nella pagina dei grafici usate
graphpg fontscale scale, dove scale è un moltiplicatore (con un valore di
default pari a 1.0). Per rendere il fonto più grande del 50 per cento,
dunque, è possibile scrivere

	graphpg fontscale 1.5

Per stampare su un file la pagina dei grafici usate l'opzione --output=
seguita dal nome di un file; questo nome deve avere il suffisso ".pdf",
".ps" o ".eps". Per esempio:

	graphpg --output="myfile.pdf"

Il file di output verrà scritto nella directory corrispondente al valore
corrente di "workdir", a meno che il nome di file contenga un percorso
completo.

In questo contesto l'output usa linee colorate di default; per usare linee
punteggiate o tratteggiate al posto dei colori è possibile aggiungere
l'opzione --monochrome.

# heckit Estimation

Argomenti:  variabile-dipendente variabili-indipendenti ; equazione di selezione
Opzioni:    --quiet (non mostra i risultati)
            --two-step (esegue la stima in due passi)
            --vcv (mostra la matrice di covarianza)
            --opg (errori standard OPG)
            --robust (errori standard QML)
            --cluster=clustvar (vedi "logit" per una spiegazione)
            --verbose (mostra risultati aggiuntivi)
Esempi:     heckit y 0 x1 x2 ; ys 0 x3 x4
            Vedi anche heckit.inp

Modello di selezione di tipo Heckman. Nella specificazione, la lista che
precede il punto e virgola rappresenta l'equazione principale, mentre la
seconda lista rappresenta l'equazione di selezione. La variabile dipendente
nell'equazione di selezione (ys nell'esempio visto sopra) deve essere una
variabile binaria.

Per impostazione predefinita, i parametri sono stimati per massima
verosimiglianza. La matrice di covarianza dei parametri è calcolata usando
l'inversa negativa dell'Hessiana. Se si vuole usare la procedura di stima in
due passi, basta usare l'opzione --two-step. In questo caso, la matrice di
covarianza dei parametri dell'equazione principale è corretta nel modo
descritto da Heckman (1979).

Accesso dal menù:    /Modello/Variabile dipendente limitata/Heckit

# help Utilities

Varianti:   help
            help functions
            help comando
            help funzione
Opzione:    --func (sceglie l'aiuto sulle funzioni)

Se non vengono indicati argomenti, mostra un elenco dei comandi disponibili.
Indicando l'argomento "functions", mostra un elenco delle funzioni
disponibili (si veda "genr").

"help" comando descrive il comando (ad es. "help smpl"). help funzione
descrive la funzione (e.g. help ldet). Alcune funzioni hanno lo stesso nome
dei comandi relativi (e.g. diff): in questo caso verrà mostrato l'aiuto
relativo al comando, a meno che non si usi l'opzione --func.

Accesso dal menù:    /Aiuto

# hfplot Graphs

Argomenti:  hflist [ ; lflist ]
Opzioni:    --with-lines (crea grafico lineare)
            --time-series (tempo in ascissa)
            --output=filename (manda l'output al file specificato)

Consente di creare un grafico di una serie ad alta frequenza, anche assieme
ad una o più serie osservate alla frequenza base del dataset. Il primo
argomento dev'essere una "MIDAS list"; gli argomenti aggiuntivi opzionali
lflist, separati da un punto e virgola, devono essere normali serie a bassa
frequenza.

Per ulteriori dettagli sull'effetto dell'opzione --output, consultare lo
help per il comando "gnuplot".

# hsk Estimation

Argomenti:  variabile-dipendente variabili-indipendenti
Opzioni:    --no-squares (si veda sotto)
            --vcv (mostra la matrice di covarianza)
            --quiet (non stampa nulla)

Questo comando è utile in presenza di eteroschedasticità sotto forma di
una funzione incognita dei regressori, che può essere approssimata da una
relazione quadratica. In questo contesto, offre la possibilità di avere
errori standard consistenti e stime dei parametri più efficienti, rispetto
alla stima OLS.

La procedura richiede: (a) la stima OLS del modello, (b) una regressione
ausiliaria per generare la stima della varianza dell'errore e (c) la stima
con minimi quadrati ponderati, usando come peso il reciproco della varianza
stimata.

Nella regressione ausiliaria (b) il logaritmo dei quadrati dei residui dalla
prima regressione OLS viene regredito sui regressori originali e sui loro
quadrati (o solamente sui regressori originali se l'opzione --no-squares è
data). La trasformazione logaritmica viene effettuata per assicurarsi che le
varianze stimate siano non negative. Indicando con u^* i valori stimati da
questa regressione, la serie dei pesi per la regressione con minimi quadrati
ponderati è data da 1/exp(u^*).

Accesso dal menù:    /Modello/Altri modelli lineari/HSK - WLS corretti per eteroschedasticità

# hurst Statistics

Argomento:  nome-variabile
Opzione:    --plot=tipologia o nome del file (si veda sotto)

Calcola l'esponente di Hurst (una misura di persistenza, o di memoria lunga)
per una serie storica con almeno 128 osservazioni.

L'esponente di Hurst è discusso da Mandelbrot (1983). In termini teorici è
l'esponente H nella relazione

  RS(x) = an^H

dove RS è l'"intervallo riscalato" della variabile x in un campione
dell'ampiezza n, mentre a è una costante. L'intervallo riscalato è
l'intervallo (valore massimo meno valore minimo) del valore cumulato, o
somma parziale, di x sul periodo del campione (dopo aver sottratto la media
campionaria), diviso per lo scarto quadratico medio campionario.

Come punto di riferimento, se x è un rumore bianco (media zero, persistenza
zero) l'intervallo dei suoi valori cumulati (che forma una passeggiata
casuale), scalato per lo scarto quadratico medio, cresce come la radice
quadrata dell'ampiezza campionaria, ossia ha un esponente di Hurst atteso
pari a 0.5. Valori dell'esponente sensibilmente maggiori di 0.5 indicano
persistenza della serie, mentre valori minori di 0.5 indicano
anti-persistenza (autocorrelazione negativa). In teoria l'esponente deve
essere compreso tra 0 e 1, ma in campioni finiti è possibile ottenere delle
stime per l'esponente maggiori di 1.

In gretl, l'esponente è stimato usando il sotto-campionamento binario: si
inizia dall'intero intervallo dei dati, quindi si usano le due metà
dell'intervallo, poi i quattro quarti, e così via. Per ampiezze campionarie
minori dell'intervallo dei dati complessivo il valore RS è la media presa
sui vari campioni. L'esponente è quindi stimato come il coefficiente di
pendenza della regressione del logaritmo di RS sul logaritmo dell'ampiezza
del campione.

Di default, viene mostrato un grafico dell'intervallo riscalato se il
programma è in modalità interattiva. Questo comportamento può essere
calibrato attraverso l'opzione --plot. I parametri accettabili dall'opzione
sono none, per non mostrare il grafico, display, per mostrare il grafico
anche in batch mode, o un nome di file. L'effetto di fornire un nome di file
è reperibile alla descrizione del comando "gnuplot", sotto l'opzione
--output.

Accesso dal menù:    /Variabile/Esponente di Hurst

# if Programming

Struttura di controllo per l'esecuzione dei comandi. Sono supportate le tre
forme seguenti:

  # forma semplice
  if condition
  commands
  endif

  # a due rami
  if condition
  commands1
  else
  commands2
  endif

  # a tre o più rami
  if condition1
  commands1
  elif condition2
  commands2
  else
  commands3
  endif

La "condizione" deve essere un'espressione Booleana, per la cui sintassi si
veda "genr". Può essere incluso più di un blocco "elif". Inoltre, i
blocchi if ... endif possono essere nidificati.

# include Programming

Argomento:  filename
Opzione:    --force (forza una rilettura dal file)
Esempi:     include myfile.inp
            include sols.gfn

Da usare in uno script di comandi, principalmente per includere definizioni
di funzioni. Il comando filename dovrebbe includere l'estensione inp (un
script di testo semplice) oppure l'estensione gfn (una pacchetto di funzioni
gretl). I comandi del filename vengono eseguiti e il controllo viene
restituito allo script principale.

L'opzione --force è specifica dei file di tipo gfn: quest'ultima ha come
effetto quello di forzare gretl a rileggere il pacchetto di funzioni anche
se quest'ultimo è già stato caricato in memoria. (In risposta a questo
comando, gli script di testo semplici inp sono sempre ricaricati.)

Si veda anche il comando "run".

# info Dataset

Mostra le informazioni aggiuntive contenute nel file di dati attuale.

Accesso dal menù:    /Dati/Visualizza descrizione
Accesso alternativo: Finestre di esplorazione dei dati

# intreg Estimation

Argomenti:  var-min var-max var-indip
Opzioni:    --quiet (non mostra i risultati)
            --verbose (mostra i dettagli delle iterazioni)
            --robust (errori standard robusti)
            --opg (vedi sotto)
            --cluster=clustvar (vedi "logit" per la spiegazione)
Esempi:     intreg lo hi const x1 x2
            Vedi anche wtp.inp

Stima un modello di regressione per intervallo. Questo modello è adatto al
caso in cui la variabile dipendente è osservata in modo imperfetto per
alcune osservazioni (o anche tutte). In altre parole, si ipotizza che il
processo generatore dei dati sia

  y* = x b + u

ma che solo m <= y* <= M sia osservato (l'intervallo può essere limitato a
destra o a sinistra). Si noti che per alcune osservazioni m può essere
uguale a M. Le variabili var-min e var-max devono contenere valori NA nel
caso di osservazioni non limitate a sinistra o a destra.

Il modello è stimato per massima verosimiglianza, ipotizzando la normalità
del termine di disturbo.

Per impostazione predefinita, gli errori standard sono calcolati usando
l'inversa dell'Hessiana. Se si usa l'opzione --robust, vengono calcolati
invece gli errori standard QML o Huber-White. In questo caso la matrice di
covarianza stimata è un "sandwich" dell'inversa dell'Hessiana stimata e del
prodotto esterno del gradiente. In alternativa, l'opzione --opg produce una
matrice varianze-covarianze basata sul prodotto esterno dei gradienti.

Accesso dal menù:    /Modello/Modelli non lineari/Regressione per intervalli

# johansen Tests

Argomenti:  ordine lista-y [ ; lista-x ] [ ; lista-rx ]
Opzioni:    --nc (senza costante)
            --rc (costante vincolata)
            --uc (costante non vincolata)
            --crt (costante e trend vincolato)
            --ct (costante e trend non vincolato)
            --seasonals (include dummy stagionali centrate)
            --asy (registra i p-value asintotici)
            --silent (non mostra nulla)
            --quiet (mostra solo i test)
            --verbose (mostra i dettagli delle regressioni ausiliarie)
Esempi:     johansen 2 y x
            johansen 4 y x1 x2 --verbose
            johansen 3 y x1 x2 --rc
            Vedi anche hamilton.inp, denmark.inp

Esegue il test di Johansen per la cointegrazione tra le variabili della
lista-y per l'ordine specificato di ritardi. Per dettagli, si veda la guida
all'uso di gretl (il capitolo 33) oppure Hamilton (1994), capitolo 20. I
valori critici sono calcolati con l'approssimazione gamma di J. Doornik
(Doornik, 1998). Per il test traccia, vengono formiti due set di valori
critici: asintotici e aggiustati per l'ampiezza campionaria. Di default,
l'accessore "$pvalue" riporta la variante aggiustata, ma i valori asintotici
possono essere ottenuti usando l'opzione --asy.

L'inclusione di trend deterministici nel modello è controllata dalle
opzioni del comando. Se non si indica alcuna opzione, viene inclusa una
"costante non vincolata", che permette la presenza di un'intercetta diversa
da zero nelle relazioni di cointegrazione e di un trend nei livelli delle
variabili endogene. Nella letteratura originata dal lavoro di Johansen (si
veda ad esempio il suo libro del 1995), si fa riferimento a questo come al
"caso 3". Le prime quattro opzioni mostrate sopra, che sono mutualmente
esclusive, producono rispettivamente i casi 1, 2, 4 e 5. Il significato di
questi casi e i criteri per scegliere tra di essi sono spiegati nella guida
all'uso di gretl (il capitolo 33).

Le liste opzionali lista-x e lista-rx permettono di controllare per
specifiche variabili esogene che entrano nel sistema in modo non vincolato
(lista-x) o vincolate allo spazio di cointegrazione (lista-rx). Queste liste
vanno separate tra di loro e dalla lista-y usando il carattere punto e
virgola.

L'opzione --seasonals, che può accompagnare una qualsiasi delle altre
opzioni, specifica l'inclusione di un gruppo di variabili dummy stagionali
centrate. Questa opzione è disponibile solo per dati trimestrali o mensili.

La tabella seguente fornisce un esempio di interpretazione dei risultati del
test nel caso di 3 variabili. H0 denota l'ipotesi nulla, H1 l'ipotesi
alternativa e c il numero delle relazioni di cointegrazione.

      Rango    Test traccia       Test Lmax
      H0     H1          H0     H1
      ---------------------------------------
      0      c = 0  c = 3       c = 0  c = 1
      1      c = 1  c = 3       c = 1  c = 2
      2      c = 2  c = 3       c = 2  c = 3
      ---------------------------------------

Si veda anche il comando "vecm".

Accesso dal menù:    /Modello/Serie storiche/Test di cointegrazione/Johansen

# join Dataset

Argomenti:  filename varname
Opzioni:    --data=column-name (v. oltre)
            --filter=expression (v. oltre)
            --ikey=inner-key (v. oltre)
            --okey=outer-key (v. oltre)
            --aggr=method (v. oltre)
            --tkey=nome-colonna,stringa-formato (v. oltre)
            --verbose (visualizza dettagli sul comando)

Questo comando importa una o più serie dal file di origine filename (che
deve essere un file di dati testuale delimitato o un file di dati nativo di
gretl) assegnandoli alla variabile varname. Per maggiori dettagli, si veda
la guida all'uso di gretl (il capitolo 7); in questa sede ci limitiamo a
ricordare brevemente le opzioni disponibili. Vedi anche "append" per alcune
semplici operazioni di unione di dataset.

L'opzione --data può essere usata per specificare l'intestazione della
colonna nel file di origine se quest'ultima è diversa dal nome con il quale
dovrebbero essere chiamati i dati in gretl.

L'opzione --filter può essere usata per specificare un criterio da seguire
per filtrare i dati di origine (in altre parole, per selezionare un
sottoinsieme di osservazioni).

Le opzioni --ikey e --okey possono essere utilizzate per specificare una
relazione fra le osservazioni nel dataset corrente e quelle nel file di
origine (per esempio, gli individui possono essere assegnati alla famiglia
di appartenenza).

L'opzione --aggr viene usata quando la relazione fra osservazioni nel
dataset corrente e nel file di origine non è biunivoca.

L'opzione --tkey è applicabile solo quando il dataset corrente ha una
struttura di serie storiche. Viene usato per specificare il nome di una
colonna contenente le date da accoppiare al dataset e/o il formato in cui le
date sono rappresentate in quella colonna.

Come importare più di una serie alla volta

Il comando "join" può essere usato per importare più di una serie alla
volta. Questo si ha quando (a) l'argomento varname è una lista di nomi
separati da spazi, anziché una stringa semplice, oppure (b) quando è il
nome di un array di stringhe, gli elementi del quale saranno i nomi delle
serie da importare.

Va detto che questo metodo ha alcune limitazioni: l'opzione --data non è
disponibile, e bisogna accettare i nomi delle variabili così come sono nel
dataset filename. Le altre opzioni verranno applicate uniformemente a tutte
le serie così importate.

# kpss Tests

Argomenti:  ordine lista-variabili
Opzioni:    --trend (include un trend)
            --seasonals (include dummy stagionali)
            --verbose (mostra i risultati della regressione)
            --quiet (non mostra i risultati)
            --difference (usa la differenza prima della variabile)
Esempi:     kpss 8 y
            kpss 4 x1 --trend

Si veda il paragrafo in fondo per l'uso di questo test su dati panel.

Calcola il test KPSS (Kwiatkowski et al, Journal of Econometrics, 1992) per
la stazionarietà di ognuna delle variabili specificate (o della loro
differenza prima, se si usa l'opzione --difference. L'ipotesi nulla è che
la variabile in questione sia stazionaria, attorno a un valore fisso o, se
è stata usata l'opzione --trend, attorno a un trend deterministico lineare.

> L'argomento order determina l'ampiezza della finestra usata per il
livellamento di Bartlett. Se viene dato un valore negativo questo è
considerato come un segnale per l'utilizzo in automatico di una finestra di
riferimento di ampiezza 4(T/100)^0.25, dove T è l'ampiezza del campione.

Se si sceglie l'opzione --verbose il risultato della regressione ausiliaria
verrà stampato insieme alla varianza stimata della componente di random
walk della variabile

Il valori critici riportati per questa statistica test sono basati sulle
superfici di risposta stimate secondo il metodo descritto da Sephton
(Economics Letters, 1995), che per piccoli campioni sono più accurate di
quelle fornite nell'articolo originale di KPSS. Quando la statistica test si
trova fra i valori critici al 10 e all'1 per cento viene mostrato un p-value
ottenuto per interpolazione lineare, che non dovrebbe essere accettato in
maniera acritica. Vedi anche la funzione "kpsscrit" per ottenere questi
valori critici come codice.

Dati panel

Quando il comando kpss viene usato con dati panel per calcolare un test
panel di radice unitaria, le opzioni applicabili e i risultati mostrati sono
leggermente diversi. Mentre nel caso di serie storiche regolari potete
fornire una lista di variabili da testare, con dati panel il comando può
testare solo una variabile alla volta. L'opzione --verbose, inoltre, ha un
significato diverso: produce un breve resoconto del test per ciascuna
singola serie storica (di default viene mostrato solo il risultato
complessivo).

Se possibile, viene calcolato il test complessivo (ipotesi nulla: la
variabile in questione è stazionaria per tutte le unità panel) usando il
metodo di Choi (Journal of International Money and Finance, 2001). Questo
calcolo non è sempre immediato perchè, mentre il test di Choi è basato
sui p-value dei test sulle singole serie, attualmente non esiste un modo per
calcolare i p-value della statistica test KPSS; dobbiamo perciò basarci su
qualche valore critico.

Se per una data variabile la statistica test cade fra i valori critici al 10
e all'1 per cento siamo in grado di interpolare un p-value. Ma se il test
cade a sinistra del valore critico al 10 per cento, o supera quello all'1
per cento, non riusciamo a compiere l'interpolazione e tutto ciò che
possiamo al limite fare è apporre un limite al test globale di Choi. Se le
singole statistiche test si trovano a sinistra del valore critico al 10 per
cento per alcune unità, ma superano quello all'1 per cento per altre, non
è possibile neppure il calcolo del limite superiore del test globale.

Accesso dal menù:    /Variabile/Test di radice unitaria/Test KPSS

# labels Dataset

Varianti:   labels [ varlist ]
            labels --to-file=filename
            labels --from-file=filename
            labels --delete
Esempi:     oprobit.inp

Nella sua prima forma mostra le etichette informative (se presenti) per le
variabili in varlist, oppure per tutte le variabili nel dataset se varlist
non è specificata.

Con l'opzione --to-file, scrive nel file indicato le etichette di tutte le
variabili nel dataset, una per linea. Se non sono presenti etichette viene
emesso un messaggio d'errore; se alcune variabili hanno etichette e altre
no, per le seconde viene mostrata una linea vuota. Il file di output verrà
scritto nella directory corrispondente al valore corrente di "workdir", a
meno che il nome di file contenga un percorso completo.

Con l'opzione --from-file, legge il file specificato (che deve essere di
testo) e assegna le etichette alle variabili nel dataset, leggendo
un'etichetta per linea e interpretando linee vuote come etichette vuote.

L'opzione --delete da quello che vi attendete: rimuove dal dataset tutte le
etichette di variabili.

Accesso dal menù:    /Dati/Etichette delle variabili

# lad Estimation

Argomenti:  variabile-dipendente variabili-indipendenti
Opzioni:    --vcv (mostra la matrice di covarianza)
            --no-vcv (non calcolare la matrice di covarianza)
            --quiet (non stampa nulla)

Calcola una regressione che minimizza la somma delle deviazioni assolute dei
valori stimati dai valori effettivi della variabile dipendente. Le stime dei
coefficienti sono derivate usando l'algoritmo del simplesso di
Barrodale-Roberts; viene mostrato un messaggio di avvertimento se la
soluzione non è unica.

Gli errori standard sono derivati usando la procedura bootstrap con 500
estrazioni. La matrice di covarianza per le stime dei parametri, mostrata se
si usa l'opzione --vcv, si basa sulla stessa procedura. Questa è
un'operazione computazionalmente piuttosto onerosa, per cui se sono
richieste le sole stime puntuali, essa può essere omessa attraverso
l'opzione --no-vcv; in questo caso, gli errori standard non saranno
disponibili.

Si noti che questo stimatore può richiedere molto tempo di calcolo per
campioni grandi o modelli con molte variabili esplicative; in questi casi,
consigliamo di usare il comando "quantreg". I due comandi sono di fatto
equivalenti, a parte il fatto che quantreg usa l'algoritmo di Frisch-Newton
(più efficiente) e fornisce errori standard analitici anziché via
bootstrap.

  lad y const X
  quantreg 0.5 y const X

Accesso dal menù:    /Modello/Stima robusta/LAD - Minime deviazioni assolute

# lags Transformations

Argomenti:  [ ordine ; ] lista-variabili
Opzione:    --bylag (ordina i termini per ritardo)
Esempi:     lags x y
            lags 12 ; x y
            lags 4 ; x1 x2 x3 --bylag
            Vedi anche sw_ch12.inp, sw_ch14.inp

Crea delle nuove variabili le quali sono i valori ritardati di ognuna delle
variabili nella lista-variabili. Il numero dei ritardi può essere indicato
dal primo parametro opzionale, altrimenti sarà pari alla periodicità del
dataset. Ad esempio, se la periodicità è 4 (trimestrale), il comando "lags
x y" crea

      x_1 = x(t-1)
      x_2 = x(t-2)
      x_3 = x(t-3)
      x_4 = x(t-4)

Il numero dei ritardi creati può essere indicato come primo parametro
opzionale (se presente, deve essere seguito da un punto e virgola).

L'opzione --bylag ha senso solo se la lista-variabili contiene più di una
serie di variabili con ordine massimo di ritardo maggiore di 1. Da
impostazione predefinita, i termini ritardati vengono aggiunti al dataset
come variabili: si inizia con tutti i ritardi della prima serie, poi si
passa quelli della seconda, poi della terza e così via. Tuttavia, se
l'opzione --bylag è data il riordino viene fatto per ritardi: si inizia con
il primo ritardo di tutte le variabili, poi si passa al secondo e così via.

Accesso dal menù:    /Aggiungi/Ritardi delle variabili selezionate

# ldiff Transformations

Argomento:  lista-variabili

Calcola la differenza prima del logaritmo naturale di ogni variabile della
lista-variabili e la salva in una nuova variabile con il prefisso ld_.
Così, "ldiff x y" crea le nuove variabili

      ld_x = log(x) - log(x(-1))
      ld_y = log(y) - log(y(-1))

Accesso dal menù:    /Aggiungi/Differenze logaritmiche

# leverage Tests

Opzioni:    --save (salva le variabili risultato)
            --quiet (non mostra i risultati)
            --plot=mode-or-filename (si veda oltre)
Esempi:     leverage.inp

Deve seguire immediatamente un comando "ols". Calcola il "leverage" (h,
compreso tra 0 e 1) di ogni osservazione nel campione su cui è stato
stimato il precedente modello. Mostra il residuo (u) per ogni osservazione
assieme al leverage corrispondente e a una misura della sua influenza sulla
stima: u*h/(1-h). I "punti di leverage" per cui il valore di h supera 2k/n
(dove k è il numero dei parametri stimati e n è l'ampiezza del campione)
sono indicati con un asterisco. Per i dettagli sui concetti di leverage e
influenza, si veda Davidson e MacKinnon (1993), capitolo 2.

Vengono mostrati anche i valori DFFITS: questi sono "residui studentizzati"
(ossia i residui previsti, divisi per i propri errori standard) moltiplicati
per sqrt[h/(1 - h)]. Per una discussione dei residui studentizzati e dei
valori DFFITS si veda Maddala,Introduction to Econometrics, cap. 12, oppure
Belsley, Kuh e Welsch (1980).

In breve, i "residui previsti" sono la differenza tra il valore osservato e
il valore stimato della variabile dipendente all'osservazione t, ottenuti da
una regressione in cui quell'osservazione è stata omessa (oppure in cui è
stata aggiunta una variabile dummy che vale 1 solo per l'osservazione t); il
residuo studentizzato si ottiene dividendo il residuo previsto per il
proprio errore standard.

Se si usa l'opzione --save, il leverage, il valore di influenza e il valore
DFFITS vengono aggiunti al dataset in uso. In questo contesto, l'opzione
--quiet evita che i risultati vengano stampati. I nomi di default delle
serie prodotte sono rispettivamente lever, influ e dffits. Se però serie
con questo nome già esistono, i nomi delle serie prodotte sarano ritoccati
per assicurarne l'unicità; se così avvenisse, occuperanno i tre numeri di
serie più alti nel dataset.

Dopo l'esecuzione, l'accessore "$test" restituisce il criterio di
validazione incrociata, definito come la somma dei quadrati degli scarti fra
la variabile dipendente e il suo valore previsto, calcolato a partire da un
campione dal quale quell'osservazione è stata esclusa. (Questo stimatore è
chiamato leave-one-out). Per una discussione più approfondita del criterio
di validazione incrociata, v. Davidson e MacKinnon's Econometric Theory and
Methods, pag. 685-686, e i riferimenti bibliografici ivi citati.

Per impostazione predefinita, se questo comando viene invocato verrà
mostrata una versione interattiva del grafico del leverage e dei valori
d'influenza. Questo può essere aggiustato tramite l'opzione --plot. I
parametri accettabili per quest'opzione sono none per sopprimere il grafico,
display per mostrare il grafico anche in modalità script, oppure il nome
del file. L'effetto di dare un nome di file al comando è descritto
all'interno dell'opzione --output del comando "gnuplot".

Accesso dal menù:    Finestra del modello, /Test/LEVERAGE - Osservazioni influenti

# levinlin Tests

Argomenti:  order series
Opzioni:    --nc (test senza costante)
            --ct (con costante e trend)
            --quiet (non mostra i risultati)
            --verbose (stampa i risultati per unità)
Esempi:     levinlin 0 y
            levinlin 2 y --ct
            levinlin {2,2,3,3,4,4} y

Calcola il test di radice unitaria per dati panel di Levin, Lin e Chu
(2002). L'ipotesi nulla che tutte le singole serie storiche contengano una
radica unitaria, mentre l'alternativa è che nessuna delle serie storiche ne
contenga una. (In altre parole, si assume un coefficiente AR(1) comune a
tutte le serie, anche se altre proprietà statistiche delle serie possono
variare da un'unità di osservazione all'altra.)

Di default le regressioni dei test ADF contengono una costante; per
eliminarla usate l'opzione --nc; per aggiungere un trend lineare usate
l'opzione --ct. (Vedi il comando "adf" per una spiegazione delle regressioni
ADF.)

Il valore (non negativo) order del numero di ritardi della variabile
dipendente da usare nel test può essere indicato in due modi diversi. Se si
fornisce uno scalare, questo viene applicato a tutte le serie nel panel. In
alternativa è possibile fornire una matrice che contiene un particolare
ordine di ritardo per ogni serie. La matrice deve essere un vettore con
numero di elementi pari a quello delle unità di osservazione nel
sottoinsieme corrente del campione, e può essere indicata per nome o
costruita usando parentesi graffe come illustrato nell'ultimo degli esempi
precedenti.

Con l'opzione --verbose, vengono stampate per ogni unità nel panel le
seguenti statistiche: delta, il coefficiente sul livello ritardato in ognuna
delle regressioni ADF; s2e, la varianza stimata delle innovazioni; e s2y, la
varianza di lungo periodo stimata per la serie in differenze.

Si noti che test di radice unitaria in panel pèossono anche essere
condiotti mediante i comandi "adf" e "kpss".

Accesso dal menù:    /Variable/Unit root tests/Levin-Lin-Chu test

# logistic Estimation

Argomenti:  variabile-dipendente variabili-indipendenti
Opzioni:    --ymax=value (specifica il massimo della variabile dipendente)
            --robust (utilizza errori standard robusti)
            --cluster=clustvar (si veda "logit" per una ulteriore spiegazione)
            --vcv (mostra la matrice di varianza-covarianza)
            --fixed-effects (si veda oltre)
            --quiet (non mostra nulla)
Esempi:     logistic y const x
            logistic y const x --ymax=50

Regressione logistica: esegue una regressione OLS usando la trasformazione
logistica sulla variabile dipendente:

  log(y/(y* - y))

La variabile dipendente dev'essere strettamente positiva. Se è una frazione
decimale, compresa tra 0 e 1, il valore predefinito per y^* (il massimo
asintotico della variabile dipendente) è 1. Se la variabile dipendente è
una percentuale, compresa tra 0 e 100, il valore predefinito di y^* è 100.

È possibile indicare un valore diverso per il massimo, usando l'opzione
--ymax. Il valore fornito deve essere maggiore di tutti i valori osservati
della variabile dipendente.

I valori stimati e i residui della regressione sono trasformati
automaticamente usando l'inversa della trasformazione logistica:

  y = y* / (1 + exp(-x))

dove x rappresenta un valore stimato oppure un residuo della regressione
OLS, usando la variabile dipendente trasformata. I valori riportati sono
dunque confrontabili con la variabile dipendente originale. Il bisogno
dell'approssimazione sorge dal fatto che la trasformazione inversa è una di
natura non-lineare e quindi quest'ultima non conserva un valore atteso.

L'opzione --fixed-effects è utilizzabile solo se il dataset assume una
forma panel. In questo caso si sottrae la media del gruppo dalla
trasformazione logistica della variabile dipendente e si procede alla
classica stima ad effetti fissi.

Si noti che se la variabile dipendente è binaria, occorre usare il comando
"logit" invece di questo comando.

Accesso dal menù:    /Modello/Modelli non lineari/Logistico

# logit Estimation

Argomenti:  variabile-dipendente variabili-indipendenti
Opzioni:    --robust (errori standard robusti)
            --cluster=clustvar (errori standard clusterizzati)
            --multinomial (stima un logit multinomiale)
            --vcv (mostra la matrice di covarianza)
            --verbose (mostra i dettagli delle iterazioni)
            --quiet (non mostra i risultati)
            --p-values (mostra i p-value invece delle pendenze)
Esempi:     keane.inp, oprobit.inp

Se la variabile dipendente è binaria (i suoi valori sono 0 o 1), esegue una
stima di massima verosimiglianza dei coefficienti per le
variabili-indipendenti con il metodo di Newton-Raphson. Visto che il modello
è nonlineare, le pendenze dipendono dai valori delle variabili
indipendenti: per impostazione predefinita, al posto dei p-value vengono
mostrate le pendenze rispetto ad ognuna delle variabili indipendenti,
calcolate in corrispondenza della media della variabile. Questo
comportamento può essere soppresso usando l'opzione --p-values. La
statistica chi-quadro testa l'ipotesi nulla che tutti i coefficienti tranne
la costante siano pari a zero.

In modalità predefinita, gli errori standard sono calcolati con l'inversa
negativa dell'Hessiana. Se si usa l'opzione --robust, verranno calcolati gli
errori standard QML o quelli di Huber-White. In questo caso, la matrice di
covarianza stimata è un "sandwich" dell'inversa dell'Hessiana stimata e del
prodotto esterno del gradiente. Per i dettagli, si veda il cap. 10 di
Davidson e MacKinnon (2004). Ma se viene usata l'opzione --cluster, verranno
prodotti errori standard "cluster-robusti"; vedi la guida all'uso di gretl
(il capitolo 22) per maggiori dettagli.

Se la variabile dipendente non è binaria, ma è discreta, si ottengono
stime Logit ordinate. Tuttavia, se viene fornita l'opzione --multinomial, la
variabile dipendente è interpretata come non ordinale, e vengono prodotte
stime Logit Multinomiali. (In ambo i casi, verrà dato un errore se la
dipendente non è discreta.) Nel caso multinomiale, l'accessore "$mnlprobs"
sarà disponibile dopo la stima; esso conterrà una matrice con le
probabilità stimate dei possibili valori della dipendente per ogni
osservazione (osservazioni per riga, valori per colonna).

Per condurre un'analisi delle proporzioni (dove la variabile dipendente è
la proporzione dei casi che hanno una certa caratteristica in ogni
osservazione, invece che una variabile binaria che indica se la
caratteristica è presente o no), non bisogna usare il comando "logit", ma
occorre costruire la variabile logit come

      genr lgt_p = log(p/(1 - p))

e usare questa come variabile dipendente in una regressione OLS. Si veda
Ramanathan (2002), capitolo 12.

Accesso dal menù:    /Modello/Modelli non lineari/Logit

# logs Transformations

Argomento:  lista-variabili

Calcola il logaritmo naturale di ognuna delle variabili della
lista-variabili e lo salva in una nuova variabile col prefisso l_, ossia una
"elle" seguita da un trattino basso. Ad esempio "logs x y" crea le nuove
variabili l_x = ln(x) e l_y = ln(y).

Accesso dal menù:    /Aggiungi/Logaritmi delle variabili selezionate

# loop Programming

Argomento:  controllo
Opzioni:    --progressive (abilita modalità speciali di alcuni comandi)
            --verbose (mostra i dettagli dei comandi genr)
Esempi:     loop 1000
            loop 1000 --progressive
            loop while essdiff > .00001
            loop i=1991..2000 --verbose
            loop for (r=-.99; r<=.99; r+=.01)
            loop foreach i xlist
            Vedi anche armaloop.inp, keane.inp

Questo comando apre una modalità speciale, in cui il programma accetta
comandi da eseguire più volte. Si esce dalla modalità loop con
l'istruzione "endloop": solo a questo punto i comandi indicati vengono
eseguiti.

Il parametro "controllo" deve assumere uno dei cinque valori mostrati negli
esempi: un numero di volte per cui ripetere i comandi all'interno del loop;
"while" seguito da una condizione booleana; un intervallo di valori interi
per una variabile indice; "for" seguito da tre espressioni tra parentesi,
separate da punti e virgola (in modo simile all'istruzione for nel
linguaggio di programmazione C); infine, "foreach" seguito da una variabile
indice e una lista.

Si veda la guida all'uso di gretl (il capitolo 13) per altri dettagli ed
esempi, oltre che per la spiegazione dell'opzione --progressive (che è
destinata ad essere usata nelle simulazioni Monte Carlo) e per l'elenco dei
comandi di gretl che possono essere usati all'interno di un loop.

Per impostazione predefinita, l'esecuzione dei comandi procede con un output
ridotto rispetto dentro un loop, rispetto ad altri contesti. Per avere più
informazioni su quel che succede dentro il loop, si può usare l'opzione
--verbose.

# mahal Statistics

Argomento:  lista-variabili
Opzioni:    --quiet (non mostra nulla)
            --save (salva le distanze nel dataset)
            --vcv (mostra la matrice di covarianza)

La distanza di Mahalanobis è la distanza tra due punti in uno spazio
k-dimensionale, scalata rispetto alla variazione statistica in ogni
dimensione dello spazio. Ad esempio, se p e q sono due osservazioni su un
insieme di k variabili con matrice di covarianza C, la distanza di
Mahalanobis tra le due osservazioni è data da

  sqrt((p - q)' * C-inversa * (p - q))

dove (p - q) è un vettore a k dimensioni. Se la matrice di covarianza è la
matrice identità, la distanza di Mahalanobis corrisponde alla distanza
Euclidea.

Lo spazio in cui vengono calcolate le distanze è definito dalle variabili
selezionate; per ogni osservazione nell'intervallo attuale viene calcolata
la distanza tra l'osservazione e il centroide delle variabili selezionate.
La distanza è la controparte multidimensionale di uno z-score standard e
può essere usata per giudicare se una certa osservazione "appartiene" a un
gruppo di altre osservazioni.

Se si usa l'opzione --vcv, vengono mostrate la matrice di covarianza e la
sua inversa. Se si usa l'opzione --save, le distanze vengono salvate nel
dataset con il nome mdist (o mdist1, mdist2 e così via, se esiste già una
variabile con quel nome).

Accesso dal menù:    /Visualizza/Distanze di Mahalanobis

# makepkg Programming

Argomento:  filename
Opzioni:    --index (crea un file ausiliario di indicizzazione)
            --translations (crea un file ausiliario di stringhe)
            --quiet (lavora silenziosamente)

Permette la creazione di un "function package" da linea di comando. Il nome
di file indica il nome del pacchetto da creare e deve avere estensione .gfn.
Si veda la guida all'uso di gretl (il capitolo 14) per dettagli.

Modalità gfn

Crea un file gfn. Si assume che sia accessibile un file di specificazione
del pacchetto, con lo stesso nome di filename ma con estensione .spec;
devono anche esistere tutti gli eventuali file ausiliatri in esso
menzionati. Infine, si assume che tutte le funzioni da inserire nel
pacchetto siano presenti in memoria.

Modalità zip

Scrive un pacchetto di tipo zip (gfn più materiale extra). Se viene trovato
un file gfn con lo stesso nome di filename, gretl cercherà due file
corrispondenti con estensione inp e spec: se vengono trovati entrambi e
almeno uno di essi è più recente del file gfn, allora quest'ultimo viene
ricreato, altrimenti viene usato quello esistente. Se il file non esiste,
gretl creerà il file gfn come prima cosa.

Opzioni gfn

Le opzioni consentono la scrittura di file ausiliari per l'uso con gli
"addon" di gretl. Il file indice è un breve documento XML contenente alcune
informazioni base sul pacchetto; ha lo stesso nome del pacchetto stesso ed
estensione .xml. Il file di traduzione contiene le stringhe da tradurre del
pacchetto, in formato C; per il pacchetto pippo questo file in questione
dovrà chiamarsi pippo-i18n.c. Questi file non vengono prodotti se si opera
tramite la modalità zip con l'utilizzo di un file gfn pre-esistente.

Per maggiori dettagli, consultare Guida ai pacchetti.

Accesso dal menù:    /Strumenti/Pacchetti di funzioni/Nuovo pacchetto

# markers Dataset

Varianti:   markers --to-file=nomefile
            markers --from-file=nomefile
            markers --delete

Con l'opzione --to-file, scrive nel file indicato le stringhe marcatrici
delle osservazioni presenti nel dataset corrente, una per ogni linea. Se il
dataset non contiene stringhe viene emesso un messaggio d'errore. Il file di
output verrà scritto nella directory corrispondente al valore corrente di
"workdir", a meno che il nome di file contenga un percorso completo.

Con l'opzione --from-file, legge dal file specificato (che deve essere in
formato testo) e assegna alle righe del dataset i marcatori di osservazione,
leggendone uno per riga. In generale il file dovrebbe contenere tanti
marcatori quante sono le osservazioni nel dataset, ma se quest'ultimo è un
panel il numero di marcatori nel file potrebbe anche essere pari al numero
di unità in cross-section (nel qual caso i marcatori sono ripetuti a ogni
data).

L'opzione --delete fa quello che vi aspettate: cancella le stringhe
marcatrici delle osservazioni dal dataset.

# meantest Tests

Argomenti:  var1 var2
Opzione:    --unequal-vars (assume varianze diverse)

Calcola la statistica t per l'ipotesi nulla che le medie della popolazione
siano uguali per le variabili var1 e var2, mostrando il suo p-value.

L'impostazione predefinita prevede di assumere che le varianze delle due
variabili siano uguali, mentre usando l'opzione --unequal-vars, si assume
che esse siano diverse; in questo caso i gradi di libertà per la statistica
test saranno approssimati per Satterthwaite (1946).

Accesso dal menù:    /Modello/Modelli bivariati/Differenza delle medie

# midasreg Estimation

Argomenti:  depvar indepvars ; MIDAS-terms
Opzioni:    --vcv (stampa la matrice di covarianze)
            --robust (errori standard robusti)
            --quiet (non stampa i risultati)
            --levenberg (vedi sotto)
Esempi:     midasreg y 0 y(-1) ; mds(X, 1, 9, 1, theta)
            midasreg y 0 y(-1) ; mds(X, 1, 9, 0)
            midasreg y 0 y(-1) ; mdsl(XL, 2, theta)
            Vedi anche gdp_midas.inp

Stima coi minimi quadrati (lineari o meno, a seconda della specificazione)
un modello MIDAS (Mixed Data Sampling), ossia un modello in cui una o più
delle variabili esplicative sono osservate a frequenza più alta della
dipendente; per una buona introduzione all'argomento si veda Armesto,
Engemann e Owyang (2010).

Le variabili in indepvars devono essere alla stessa frequenza della
dipendente. Questa lista normalmente contiene anche const o 0 (intercetta)
e, di solito, uno o più ritardi della variabile dipendente. I termini ad
alta frequenza vengono forniti dopo un punto e virgola; ognuno di essi sotto
forma di numeri separati da virgole fra parentesi, col prefisso mds oppure
mdsl.

mds: questa variante richiede 5 argomenti, come segue: il nome di una "MIDAS
list", due interi col minimo e massimo ritardo ad alta frequenza, un intero
fra 0 e 4, che specifica il tipo di parametrizzazione da usare, e il nome di
un vettore contenente i valori iniziali dei parametri. L'esempio qui sotto
usa i ritardi da 3 a 11 della serie ad alta frequenza contenuta nella lista
X, usando la parametrizzazione di tipo 1 (Almon esponenziale, vedi sotto)
con inizializzazione theta.

	  mds(X, 3, 11, 1, theta)

mdsl: in gnere richiede 3 argomenti: il nome di una lista di ritardi MIDAS,
un intero per il tipo di parametrizzazione e il nome di un vettore di valori
iniziali. In questo caso i ritardi minimo e massimo sono impliciti
nell'argomento lista iniziale. Nell'esempio seguente Xlags deve essere una
lista che contiene già i ritardi necessari; essa può essere costruita
tramite la funzione "hflags" function.

	  mdsl(XLags, 1, theta)

I tipi di parametrizzazione sono disponibili come segue; nel contesto mds e
mdsl le specificazioni in questione dovrebbero essere date in forma di
codice numerio o di stringhe virgolettate esposte dopo i numeri.

0 o "umidas": "MIDAS non vincolato" o U-MIDAS (un coefficiente per ritardo)

1 o "nealmon": Almon esponenziale normalizzato; necessita di almeno un
parametro, di solito due

2 o "beta0": beta normalizzato con zero finale; richiede due parametri

3 o "betan": beta normalizzato senza zero finale; richiede tre parametri

4 o "almonp": polinomio di Almon non normalizzato; richiede almeno un
parametro

Quando la parametrizzazione è U-MIDAS, l'argomento di inzializzazione non
è necessario con mds or mdsl. In altri casi, si può richiedere
un'inizializzazione automatica sostituendo una di queste due forme col nome
di un vettore di parametri iniziali:

  La parola chiave null: accettabile solo se la parameterizzazione scelta ha
  un numero fisso di termini (i casi beta, 2 o 3). È accettata anche nel
  caso di Almon esponenziale, implicando come valori predifiniti 2
  parametri.

  Un intero col numero di parametri richiesto.

Il metodo di stima usato da questo comando dipende dalla specificazione dei
termini ad alta frequenza. Nel caso U-MIDAS il metodo è l'OLS; in tutti gli
altri casi si usano i minimi quadrati non lineari (NLS). Quando si
specificano le parametrizzazioni Almon esponenziale normalizzata oppure beta
normalizzata, il metodo NLS di default è una combinazione di BFGS vincolato
e OLS, ma per forzare l'uso dell'algoritmo di Levenberg-Marquardt si può
usare l'opzione --levenberg.

Accesso dal menù:    /Model/Time series/MIDAS

# mle Estimation

Argomenti:  funzione di log-verosimiglianza [ derivate ]
Opzioni:    --quiet (non stampa il modello stimato)
            --vcv (mostra la matrice di covarianza)
            --hessian (calcola la matrice di covarianza a partire dall'Hessiana)
            --robust (matrice di covarianza QML)
            --cluster=clustvar (errori standard clusterizzati)
            --verbose (stampa i dettagli delle iterazioni)
            --no-gradient-check (vedi sotto)
            --auxiliary (vedi sotto)
            --lbfgs (usa L-BFGS-B anziché il BFGS standard)
Esempi:     weibull.inp, biprobit_via_ghk.inp, frontier.inp, keane.inp

Esegue la stima di massima verosimiglianza (ML, Maximum Likelihood) usando a
scelta o l'algoritmo BFGS (Broyden, Fletcher, Goldfarb, Shanno) o quello di
Newton. Occorre specificare la funzione di log-verosimiglianza e dichiarare
i valori iniziali per i parametri della funzione Se possibile è
consigliabile indicare anche le espressioni per le derivate di questa
funzione, rispetto ad ognuno dei parametri; se non si indicano le derivate
analitiche, verrà calcolata un'approssimazione numerica.

Questo messaggio di aiuto presuppone l'utilizzo dell'algoritmo di
massimizzazione BFGS, per maggiori informazioni circa l'uso dell'algoritmo
di Newton si consulti la guida all'uso di gretl (il capitolo 26).

Esempio: si supponga di avere una serie X con valori 0 o 1 e di voler
ottenere la stima di massima verosimiglianza della probabilità p che X
valga 1 (è semplice intuire che la stima ML di p corrisponderà alla
proporzione dei valori 1 nel campione).

Occorre per prima cosa aggiungere p al dataset e assegnargli un valore
iniziale; ad esempio,

	scalar p = 0.5

Quindi costruiamo il blocco di comandi per la stima di massima
verosimiglianza:

	mle loglik = X*log(p) + (1-X)*log(1-p)
	deriv p = X/p - (1-X)/(1-p)
	end mle

La prima riga specifica la funzione di log-verosimiglianza: inizia con la
parola chiave mle, quindi contiene la variabile dipendente e una
specificazione per la log-verosimiglianza usando la stessa sintassi del
comando "genr". La riga seguente (che è opzionale), inizia con la parola
chiave deriv e fornisce la derivata della funzione di log-verosimiglianza
rispetto al parametro p. Se non vengono indicate derivate, occorre includere
una dichiarazione che identifica i parametri liberi (separati da spazi)
utilizzando la parola chiave params; questi parametri liberi possono essere
sia scalari, che vettori, che una qualsiasi combinazione dei due. Ad esempio
si sarebbe potuto scrivere:

	mle loglik = X*log(p) + (1-X)*log(1-p)
	params p
	end mle

e in questo caso la derivata verrebbe calcolata numericamente.

Si noti che eventuali opzioni vanno indicate nella riga finale del blocco
MLE. Ad esempio:

	mle loglik = X*log(p) + (1-X)*log(1-p)
	  params p
	end mle --quiet

Matrice di covarianza ed errori standard

Se la funzione di log-verosimiglianza restituisce una variabile o un vettore
per ogni valore delle osservazioni allora gli errori standard sono, per
impostazione predefinita, basati sul prodotto esterno del gradiente (OPG),
mentre se l'opzione --hessian è fornita allora quest'ultimi saranno
ottenuti sulla base dell'inversa negativa della matrice hessiana, la quale
verrà approssimata numericamente. Se l'opzione --robust è data allora
verrà utilizzato uno stimatore di quasi-massima verosimiglianza (QML),
ossia uno stimatore ottenuto dal sandwich dell'inversa negativa della
matrice hessiana e del prodotto esterno del gradiente (OPG). In ogni caso,
se la funzione di log-verosimiglianza restituisce semplicemente un valore
scalare il metodo OPG non risulta disponibile (come anche lo stimatore QML),
e gli errori standard sono necessariamente calcolati usando l'hessiana
numerica.

Nel caso in cui si volesse solo il parametro primario delle stime è
possibile dare l'opzione --auxiliary, la quale sopprime il calcolo della
matrice di covarianza e degli errori standard; questo permetterà di
risparmiare alcuni cicli della CPU, salvando anche un po' di memoria.

Controllo delle derivate analitiche

Se si forniscono le derivate analitiche della funzione di
log-verosimiglianza, di default gretl esegue un controllo numerico circa la
loro attendibilità. Occasionalmente, questo controllo potrebbe produrre dei
falsi positivi, ovvero casi in cui derivate calcolate correttamente vengono
segnalate come errate e di cui la stima viene quindi negata. Per impedire
che ciò accada, o per aggiungere un poco di velocità in più al processo,
è possibile dare l'opzione --no-gradient-check. Ovviamente questo andrebbe
fatto solo nel caso in cui si è assolutamente sicuri che il gradiente dato
in specifica è corretto.

Nomi dei parametri

Quando si stima un modello non lineare spesso risulta conveniente nominare i
parametri in maniera concisa. Nella stampa dei risultati, comunque, risulta
desiderabile che le etichette data siano le più informative e sintetiche
possibili. Questo risultato pyò venire ottenuto aggiungendo la parola
chiave param_names all'interno del blocco di comando. Per un modello con k
parametri l'argomento successivo a questa parola chiave può essere sia una
stringa di testo, messa tra virgolette, contenente k nomi separati da uno
spazio, sia il nome di una stringa di variabili avente al suo interno tutti
i k nomi.

Per maggiori informazioni circa la massima verosimiglianza ("mle")
raccomandiamo di consultare la guida all'uso di gretl (il capitolo 26).

Accesso dal menù:    /Modello/Massima verosimiglianza

# modeltab Utilities

Varianti:   modeltab add
            modeltab show
            modeltab free
            modeltab --output=nomefile

Manipola la "tabella modelli" di gretl. Si veda la guida all'uso di gretl
(il capitolo 3) per i dettagli. Le opzioni hanno i seguenti effetti: "add"
aggiunge l'ultimo modello stimato alla tabella modelli, se possibile; "show"
mostra la tabella modelli in una finestra; "free" pulisce la tabella.

Per stampare la tabella del modello, si usi l'opzione --output= seguita dal
nome di un file. Se quest'ultimo ha il suffisso ".tex", l'output sarà in
formato TeX; se il suffisso è ".rtf" l'output sarà RTF; in caso contrario
sarà in formato di testo. Nel caso di output in formato TeX per default
verrà prodotto un "frammento" pronto per essere inserito in un documento;
se invece si preferisce ottenere un documento completo, usate l'opzione
--complete; per esempio,

	modeltab --output="myfile.tex" --complete

Accesso dal menù:    Finestra delle icone, Icona Tabella Modelli

# modprint Printing

Argomenti:  matcoeff nomi [ stat ]
Opzione:    --output=filename (invia l'output al file specificato)

Stampa la tabella dei coefficienti e le statistiche aggiuntive opzionali per
un modello stimato "a mano". Utile principalmente per le funzioni definite
dall'utente.

L'argomento matcoeff deve essere una matrice k per 2 che contiene i k
coefficienti stimati nella prima colonna ed i k relativi errori standard
associati nella seconda. L'argomento nomi deve fornire almeno k etichette
per i coefficienti. Può avere la forma di una stringa fissa (fra virgolette
doppie) o di una variabile di tipo stringa, nel qual caso le etichette vanno
separate con spazi oppure virgole. Alternativamente, si può usare allo
scopo un array di stringhe.

L'argomento opzionale stat è un vettore che contiene p statistiche
aggiuntive da stampare sotto la tabella dei coefficienti. Se si usa questo
argomento, nomi deve contenere k + p stringhe di cui le ultime p sono
relative alle statistiche aggiuntive.

Per inviare l'output ad un file, usate l'opzione --output= seguita dal nome
di un file. Se quest'ultimo ha il suffisso ".tex", l'output sarà in formato
TeX; se il suffisso è ".rtf" l'output sarà RTF; in caso contrario sarà in
formato di testo. Nel caso di output in formato TeX per default verrà
prodotto un "frammento" pronto per essere inserito in un documento; se
invece si preferisce ottenere un documento completo, usate l'opzione
--complete.

Il file di output verrà scritto nella directory corrispondente al valore
corrente di "workdir", a meno che il nome di file contenga un percorso
completo.

# modtest Tests

Argomento:  [ ordine ]
Opzioni:    --normality (normalità dei residui)
            --logs (non linearità, logaritmi)
            --squares (non linearità, quadrati)
            --autocorr (autocorrelazione)
            --arch (ARCH)
            --white (test di White per l'eteroschedasticità)
            --white-nocross (test di White per l'eteroschedasticità cono solo i quadrati)
            --breusch-pagan (test per l'eteroschedasticità di Breusch-Pagan)
            --robust (stima robusta della varianza per Breusch-Pagan)
            --panel (eteroschedasticità, a gruppi)
            --comfac (restrizione a fattor comune, solo per modelli AR1)
            --xdepend (dipendenza cross-section, solo per dati panel)
            --quiet (non mostra i dettagli)
            --silent (non mostra i risultati)
Esempi:     credscore.inp

Deve seguire immediatamente un comando di stima. La discussione che segue è
relativa all'esecuzione del comando dopo la stima di un modello ad equazione
singola; si veda la guida all'uso di gretl (il capitolo 32) per una
descrizione di come funziona "modtest" dopo la stima di un VAR

A seconda dell'opzione usata, il comando esegue uno dei test seguenti: test
di Doornik-Hansen per la normalità del termine di errore; test dei
moltiplicatori di Lagrange per la non-linearità (logaritmi o quadrati);
test di White (con o senza i prodotti incrociati) o test di Breusch-Pagan
per l'eteroschedasticità (Breusch e Pagan, 1979), test LMF per la
correlazione seriale (si veda (Kiviet, 1986)); test per il modello ARCH
(Autoregressive Conditional Heteroskedasticity, si veda anche il comando
"arch"); o restrizione a fattore comune, (solo modelli AR1); o un test per
la dipendenza tra unità cross-sectio in caso di modelli con dati panel. Ad
eccezione dei test sulla normalità, a fattor comune e sulla dipendenza
cross-section, la maggior parte dei test risultano disponibili solo in caso
di stima OLS; per ulteriori dettagli circa lo stimatore TSLS (two-stage
least squares) si veda oltre.

L'argomento opzionale ordine è rilevante solo nel caso si scelga l'opzione
--autocorr o l'opzione --arch. Per impostazione predefinita, questi test
sono eseguiti usando un ordine di ritardo pari alla periodicità dei dati,
ma è possibile anche impostare un ordine di ritardo specifico.

L'opzione --robust ha effetto solo se viene scelto il test di Breusch-Pagan;
l'effetto è quello di usare lo stimatore robusto per la varianza proposto
da Koenker (1981), rendendo il test meno sensibile all'ipotesi di
normalità.

L'opzione --panel è disponibile solo se il modello viene stimato su dati
panel: in questo caso viene eseguito un test per eteroschedasticità a
gruppi (ossia per una varianza dell'errore diversa fra le unità cross
section).

L'opzione --comfac è disponibile solo quando il modello è stimato usando
un metodo AR(1), come quello di Hildreth-Lu. La regressione ausiliaria ha la
struttura di un modello dinamico relativamente poco vincolato ed è usata
per verificare il vincolo di fattori comuni implicito nella specificazione
AR(1).

L'opzione --xdepend è disponibile solo se il modello viene stimato su dati
panel. La statistica test è sviluppata secondo il metodo di Pesaran (2004).
L'ipotesi nulla riguarda il termine di errore assunto come indipendentemente
distribuito per tutte le osservazioni cross-section o gli individui.

Per impostazione predefinita il programma mostra la regressione ausiliaria
sulla quale la statistica test è basata, laddove possibile. Questa funzione
può venir soppressa utilizzando o l'opzione --quiet (che mostra le
informazioni strettamente necessarie) oppure con l'opzione --silent (che non
mostra alcuna informazione). La statistica test ed il relativo p-value
possono essere richiamati utilizzando gli accessori "$test" e "$pvalue".

Nel caso di modelli stimati col metodo dei minimi quadrati a due stadi (si
veda "tsls"), non è possibile usare il test LM, quindi gretl offre alcuni
test equivalenti; in questo caso, l'opzione --autocorr calcola il test di
Godfrey per l'autocorrelazione (si veda Godfrey, 1994), mentre l'opzione
--white produce il test HET1 per l'eteroschedasticità (si veda Pesaran e
Taylor, 1999.

Per ulteriori test diagnostici sui modelli si vedano anche le voci "chow",
"cusum", "reset" e "qlrtest".

Accesso dal menù:    Finestra del modello, /Test

# mpols Estimation

Argomenti:  variabile-dipendente variabili-indipendenti
Opzioni:    --vcv (mostra la matrice di covarianza)
            --simple-print (non mostra le statistiche ausiliarie)
            --quiet (non mostra i risultati)

Calcola le stime OLS per il modello indicato usando aritmetica in virgola
mobile a precisione multipla. Questo comando è disponibile solo se gretl è
compilato con il supporto per la libreria Gnu Multiple Precision (GMP). Per
impostazione predefinita, vengono usati 256 bit di precisione nei calcoli,
ma è possibile aumentare questo valore usando la variabile d'ambiente
GRETL_MP_BITS. Ad esempio, usando l'interprete dei comandi bash, è
possibile aumentare la precisione a 1024 bit eseguendo il comando seguente
prima di avviare gretl

	export GRETL_MP_BITS=1024

Per questo comando è disponibile un'opzione abbastanza speciale (utile
soprattutto a scopo di test): se la lista variabili-indipendenti è seguita
da un punto e virgola, e da un'ulteriore lista di numeri, questi numeri
vengono interpretati come potenze di x da aggiungere alla regressione, dove
x è l'ultima variabile della lista variabili-indipendeti. Questi termini
addizionali vengono calcolati e memorizzati in precisione multipla.
Nell'esempio seguente, y è regredita su x e sulla seconda, terza e quarta
potenza di x:

	mpols y 0 x ; 2 3 4

Accesso dal menù:    /Modello/Altri modelli lineari/MPOLS - Minimi quadrati in alta precisione

# negbin Estimation

Argomenti:  depvar indepvars [ ; offset ]
Opzioni:    --model1 (usa il modello NegBin 1)
            --robust (matrice di covarianza QML)
            --cluster=clustvar (vedi "logit" per una spegazione)
            --opg (vedi sotto)
            --vcv (stampa la matrice di covarianze)
            --verbose (mostra i dettagli delle iterazioni)
            --quiet (non mostra i risultati)
Esempi:     camtriv.inp

Stima un modello Binomiale Negativo. Il comando assume che la variabile
dipendente rappresenti un conteggio del numero di volte in cui si è
verificato un certo evento e deve assumere solo valori interi non negativi.
Di default, viene usata la distribuzione NegBin 2, in cui la varianza
condizionale è data da mu(1 + αmu), dove mu denota la media condizionale.
Tuttavia, se vien data l'opzione --model1 allora la varianza condizionale
sarà data da mu(1 + α).

L'argomento opzionale offset funziona come per il comando "poisson". In
effetti, il modello di Poisson è un caso particolare del binomiale negativo
con α = 0.

Di default, gli errori standard vengono calcolati unsando un'approssimazione
numerica dell'Hessiana sul punto di massimo. Con l'opzione --opg la matrice
di covarianze verrà invece calcolata tramite il prodotto esterno dei
gradienti (OPG), o via QML con l'opzione --robust usando un "sandwich"
dell'hessiana inversa e dell'OPG.

Accesso dal menù:    /Modelli/Modelli non lineari/Dati di conto

# nls Estimation

Argomenti:  funzione [ derivate ]
Opzioni:    --quiet (non stampa il modello stimato)
            --robust (errori standard robusti)
            --vcv (mostra la matrice di covarianza)
            --verbose (mostra i dettagli delle iterazioni)
            --no-gradient-check (si veda oltre)
Esempi:     wg_nls.inp, ects_nls.inp

Esegue una stima con minimi quadrati non-lineari (NLS: Nonlinear Least
Squares) usando una versione modificata dell'algoritmo di
Levenberg-Marquardt. Occorre fornire una specificazione di funzione e
dichiarare i parametri di interesse della funzione ed i relativi valori
iniziali prima che la stima venga eseguita. Opzionalmente, è anche
possibile specificare le espressioni per le derivate della funzione rispetto
a ognuno dei parametri. Se non si indicano le derivate, occorre fornire una
lista dei parametri da stimare (separati da spazi o virgole), preceduta
dalla parola chiave params. In quest'ultimo caso, viene calcolata
un'approssimazione numerica del Jacobiano.

È più semplice mostrare il funzionamento con un esempio. Quello che segue
è uno script completo per stimare la funzione di consumo non-lineare
presentata in Econometric Analysis di William Greene (capitolo 11 della
quarta edizione, o capitolo 9 della quinta). I numeri alla sinistra delle
righe sono dei punti di riferimento e non fanno parte dei comandi. Si noti
che le opzioni, come ad esempio --vcv per mostrare la matrice di covarianza
delle stime dei parametri, vanno aggiunte al comando finale end nls.

	1   open greene11_3.gdt
	2   ols C 0 Y
	3   genr a = $coeff(0)
	4   genr b = $coeff(Y)
	5   genr g = 1.0
	6   nls C = a + b * Y^g
	7   deriv a = 1
	8   deriv b = Y^g
	9   deriv g = b * Y^g * log(Y)
	10  end nls --vcv

Spesso è comodo inizializzare i parametri con riferimento a un modello
lineare collegato, come è mostrato nelle righe da 2 a 5. I parametri alfa,
beta e gamma possono essere impostati a qualunque valore iniziale (non
necessariamente sulla base di un modello stimato con OLS), ma la convergenza
della procedura NLS non è garantita per qualunque punto di partenza.

I veri comandi NLS occupano le righe da 6 a 10. Sulla riga 6 viene dato il
comando "nls": viene specificata una variabile dipendente, seguita dal segno
uguale, seguito da una specificazione di funzione. La sintassi per
l'espressione a destra è la stessa usata per il comando "genr". Le tre
righe successive specificano le derivate della funzione di regressione
rispetto a ognuno dei parametri. Ogni riga inizia con il comando "deriv",
che indica il nome di un parametro, il segno di uguale e un'espressione che
indica come calcolare la derivata (anche qui la sintassi è la stessa di
"genr"). In alternativa, invece di fornire le derivate, è possibile
sostituire le righe dalla 7 alla 9 con la seguente:

	params a b g

La riga 10, "end nls", completa il comando ed esegue la stima.

Se si forniscono le derivate in forma analitica, di default gretl
effettuerà una verifica numerica sulla correttezza dell'espressione data.
Occasionalmente, questa procedura potrebbe produrre "falsi positivi", ad
esempio indicando come errate delle derivate che invece sono correte,
facendo si che la stima di quest'ultime venga negata. Per evitare che ciò
accada, e/o per compilare leggermente più velocemente il codice, è
possibile utilizzare l'opzione --no-gradient-check. Ovviamente questo
andrebbe fatto solo in caso di assoluta certezza circa la correttezza delle
derivate analitiche.

Nomi dei parametri

Quando si stima un modello non lineare spesso risulta conveniente rinominare
i parametri in maniera sintetica. Durante la stampa del risultato, comunque,
è desiderabile che le etichette date, per quanto sintetiche, risultino le
più informative possibili. Questo risultato può essere ottenuto
aggiungendo al comando la parola chiave param_names. Per un modello con k
parametri l'argomento che segue a questa parola chiave dovrebbe essere o una
stringa letterale, posta tra virgolette, contenente k nomi diversi separati
da spazi o virgole, oppure il nome di un vettore contente un lista di nomi k
di variabile al suo interno.

Per ulteriori dettagli sulla stima NLS si veda la guida all'uso di gretl (il
capitolo 25).

Accesso dal menù:    /Modello/Modelli non lineari/NLS - Minimi quadrati non lineari

# normtest Tests

Argomento:  series
Opzioni:    --dhansen (test di Doornik-Hansen, utilizzato di default)
            --swilk (test di Shapiro-Wilk)
            --lillie (test di Lilliefors)
            --jbera (test di Jarque-Bera)
            --all (esegue tutti i test)
            --quiet (non mostra i dettagli dei risultati)

Conduce un test di normalità per la serie specificata. Il tipo di test
eseguito è determinato dalle opzioni del comando (se non ne viene usata
alcuna, viene eseguito il test di Doornik-Hansen). Nota: si raccomanda
l'utilizzo dei test di Doornik-Hansen e Shapiro-Wilk rispetto agli altri
test per via delle loro migliori proprietà in campioni relativamente
piccoli.

La statistica test e il suo p-value possono essere recuperati usando gli
accessori "$test" e "$pvalue". Se si usa l'opzione --all, i risultati
richiamati saranno quelli del test di Doornik-Hansen.

# nulldata Dataset

Argomento:  lunghezza_serie
Opzione:    --preserve (preserva le matrici)
Esempio:    nulldata 500

Crea un dataset "vuoto", che contiene solo una costante e una variabile
indice, con periodicità 1 e il numero indicato di osservazioni. Ad esempio,
è possibile creare un dataset a scopo di simulazione usando alcuni comandi
come "uniform()" e "normal()") i quali genereranno serie di dati ex nihilo
che dovranno poi venir riempiti con dati. Questo comando può risultare
particolarmente comodo se utilizzato assieme a "loop". Si veda anche
l'opzione "seed" del comando "set".

Per impostazione predefinita, questo comando cancella tutti i dati presenti
nell'ambiente di lavoro di gretl. Usando l'opzione --preserve, verranno
mantenute tutte le matrici attualmente definite.

Accesso dal menù:    /File/Nuovo dataset

# ols Estimation

Argomenti:  variabile-dipendente variabili-indipendenti
Opzioni:    --vcv (mostra la matrice di covarianza)
            --robust (errori standard robusti)
            --cluster=clustvar (errori standard clusterizzati)
            --jackknife (vedi sotto)
            --simple-print (non mostra le statistiche ausiliarie)
            --quiet (non mostra i risultati)
            --anova (stampa una tabella ANOVA)
            --no-df-corr (sopprime la correzione per i gradi di libertà)
            --print-final (si veda sotto)
Esempi:     ols 1 0 2 4 6 7
            ols y 0 x1 x2 x3 --vcv
            ols y 0 x1 x2 x3 --quiet

Calcola le stime minimi quadrati ordinari (OLS: Ordinary Least Squares)
usando la variabile-dipendente e la lista di variabili-indipendenti, che
possono essere specificate per nome o numero. Il termine costante può
essere indicato usando il numero 0.

Oltre alle stime dei coefficienti e agli errori standard, il programma
mostra i p-value per le statistiche t (a due code) e F. Un p-value inferiore
a 0.01 indica significatività al livello dell'1 per cento ed è denotato
con ***. ** indica invece la significatività tra l'1 e il 5 per cento,
mentre * indica un livello di significatività tra il 5 e il 10 per cento.
Vengono mostrate anche le statistiche di selezione del modello (il criterio
di informazione di Akaike, AIC, e il criterio di informazione bayesiana di
Schwarz, BIC). La formula usata per AIC è descritta in Akaike (1974), ossia
meno due volte la log-verosimiglianza massimizzata più il doppio del numero
di parametri stimati.

Usando l'opzione --no-df-corr la correzione per i gradi di libertà non
viene applicata nel calcolo della varianza stimata dell'errore (e quindi
anche dell'errore standard delle stime dei parametri).

L'opzione --print-final è utilizzabile solo nel contesto di un "loop".
L'effetto è quello di eseguire la regressione in modo silenzioso per tutte
le iterazioni del loop tranne l'ultima. Si veda la guida all'uso di gretl
(il capitolo 13) per i dettagli.

Varie variabili interne possono essere recuperate per futuri scopi di stima.
Ad esempio:

      series uh = $uhat

dove così facendo si salvano i residui stimati dal modello sotto il nome
uh. Per ulteriori riferimenti si guardi anche alla sezione "accessori" di
gretl function.

La formula utilizzata nella versione --HC per generare errori standard
robusti con l'opzione --robust può essere calibrata attraverso il comando
"set". L'opzione --jackknife ha l'effetto di selezionare la versione 3a
della matrice HC. L'opzione --cluster annulla la procedura di selezione
della versione della matrice HC in quanto produce errori standard robusti in
seguito all'operazione di raggruppamento delle singole osservazioni di
clustvar. Si veda anche la guida all'uso di gretl (il capitolo 22) per
maggiori dettagli.

Accesso dal menù:    /Modello/OLS - Minimi quadrati ordinari
Accesso alternativo: Pulsante Beta-hat sulla barra degli strumenti

# omit Tests

Argomento:  lista-variabili
Opzioni:    --test-only (non rimpiazza il modello corrente)
            --chi-square (restituisce un test chi-quadro di Wald)
            --quiet (stampa solo i risultati del test)
            --silent (non stampa nulla)
            --vcv (stampa la matrice di varianze-covarianze del modello
	ridotto)
            --auto=alpha (eliminazione sequenziale, si veda oltre)
            --inst (omette come strumento, solo per TSLS)
            --both (omette come regressore e come strumento, solo per TSLS)
Esempi:     omit 5 7 9
            omit seasonals --quiet
            omit --auto
            omit --auto=0.05
            Vedi anche restrict.inp, sw_ch12.inp, sw_ch14.inp

Questo comando deve seguire un comando di stima. Nella sua forma principale,
questo comando calcola un test di Wald per la significatività congiunta
delle variabili presenti nella lista variabili, che deve essere un
sottoinsieme delle variabili indipendenti presenti nell'ultimo modello
stimato. I risultati possono poi venire richiamati attraverso l'uso degli
accessori "$test" e "$pvalue".

A meno che non vengano rimossi tutti i regressori, il modello ristretto che
viene stimato va a rimpiazzare il modello originale come "modello corrente"
con lo scopo, ad esempio, di richiamare i residui come $uhat o di eseguire
dei test. Questo comportamento può essere soppresso attraverso l'uso
dell'opzione --test-only.

Per default, viene usata la forma F del test di Wald; se invece si vuole un
test chi-quadro, si usi l'opzione --chi-square.

Se il modello ristretto viene sia stimato che stampato l'utilizzo
dell'opzione --vcv ha l'effetto di stampare anche la matrice di covarianze,
altrimenti se non usata l'opzione viene ignorata.

Alternativamente, se l'opzione --auto è abilitata, l'eliminazione
sequenziale viene eseguita in questo modo: ad ogni step le variabili con
p-value più alto vengono omesse sicchè tutte quelle con p-value maggiore
di un certo cutoff vengono eliminate. Il cutoff di default è impostato al
10 per cento (considerando sia la coda destra che sinistra); esso, tuttavia,
può venire modificato utilizzando l'argomento "=" ed un valore compreso tra
0 e 1 (senza spazio in mezzo), come nel quarto esempio descritto sopra. Se
viene data una lista-variabili questo processo sarà limitato alle sole
variabili presenti nella lista, altrimenti tutte le variabili saranno
coinvolte e considerate come possibili candidate all'omissione. Si noti che
le opzioni --auto e --test-only sono incompatibili.

Accesso dal menù:    Finestra del modello, /Test/OMIT - Ometti variabili

# open Dataset

Argomento:  file-dati
Opzioni:    --quiet (non stampare la lista di serie)
            --preserve (mantieni in memoria le variabili non-serie)
            --select=selezione (leggi solo le serie specificate, vedi sotto)
            --frompkg=pkgname (vedi sotto)
            --all-cols (vedi sotto)
            --www (usa un database sul server di gretl)
            Si veda oltre per le opzioni specifiche per i fogli elettronici
Esempi:     open data4-1
            open voter.dta
            open fedbog --www

Apre un file di dati o un database (vedi la guida all'uso di gretl (il
capitolo 4) per una spiegazione sulla differenza fra le due possibilità).
L'effetto del comando è abbastanza diverso nei due casi: quando si apre un
file di dati, il suo contenuto viene letto in memoria, sostituendo i dati
eventualmente già presenti. Per aggiungere dati al dataset aperto, vedi
"append" o, per maggiore flessibilità, "join". Se invece viene aperto un
database, nessun dato viene letto immediatamente. Il comando si limita a
impostare la fonte per i susseguenti comandi "data", usati per effettuare
l'importazione vera e propria. Si veda "Apertura di un database" più sotto.

Se non si specifica un percorso completo, il programma cercherà
automaticamente il file in alcuni percorsi predefiniti, a partire dal valore
attuale di "workdir". Se non si specifica un'estensione per il file, come
nel primo degli esempi, gretl assume che si tratti di un file di dati
standard, con estensione .gdt. A seconda del nome del file e di alcune sue
caratteristiche, gretl cerca di indovinare il formato dei dati (standard,
testo semplice, CSV, MS Excel, Stata, SPSS, ecc.).

Usando l'opzione --frompkg, gretl cercherà il file di dati specificato
nella sottodirectory associata al pacchetto pkgname.

Se l'argomento nome-file è un URI che inizia con http:// o https://, allora
gretl cercherà di scaricare il file dalla rete prima di aprirlo.

Come impostazione predefinita, l'apertura di un nuovo file di dati annulla
la sessione corrente, il che implica la perdita di tutte le variabili di
tipo matrice, scalare e stringa. Se si vuole preservare tali variabili (con
l'eccezione delle serie, che sono necessariamente eliminate), va usata
l'opzione --preserve.

Fogli elettronici

Quando si apre un file di un foglio elettronico (Gnumeric, Open Document o
XLS), è possibile fornire fino a tre parametri aggiuntivi, oltre al nome
del file. Per prima cosa, è possibile selezionare un particolare foglio di
lavoro all'interno del file, indicando il suo numero con la sintassi
--sheet=2, oppure indicando il suo nome tra virgolette doppie, usando la
sintassi --sheet="MacroData". L'impostazione predefinita consiste nel
leggere il primo foglio di lavoro del file. È anche possibile specificare
la riga/colonna da cui iniziare a leggere, usando la sintassi

      --coloffset=3 --rowoffset=2

che indica a gretl di ignorare le prime 3 colonne e le prime 2 righe.
L'impostazione predefinita consiste nel leggere tutte le celle del foglio, a
partire dalla prima in alto a sinistra.

File di testo con delimitatori

Con file di testo, gretl in genere si aspetta di trovare le colonne di dati
separate da un qualche carattere standard; in genere, la virgola, il tab, lo
spazio o il punto e virgola (copyright Totò e Peppino). Come impostazione
base, gretl cerca di trovare nella prima colonna etichette identificative o
date, se l'intestazione è vuota o contiene qualcosa che verosimilmente va
interpretato in tal modo, come "year", "date" o "obs". Questa euristica
sulla prima colonna può essere disattivata attraverso l'opzione --all-cols
option.

File di testo in formato fisso

Tuttavia, c'è anche modo di leggere dati in "formato fisso", dove non ci
sono delimitatori ma esiste una specifica del formato; ad esempio, "la
variabile k occupa 8 caratteri a partire dal 24esimo". Per leggere file
siffatti, va aggiunta la stringa --fixed-cols=colspec, dove colspec si
compone di interi separati da virgole. Essi vengono interpretati a coppie,
in cui il primo elemento denota la colonna di partenza, misurata in byte
dall'inizio della riga (dove 1 indica il primo byte); il secondo elemento
indica quanti byte vanno letti per quel dato campo. Facciamo un esempio: il
comando

      open fixed.txt --fixed-cols=1,6,20,3

farà sì che vengano letti 6 byte a partire dalla colonna 1 per la prima
variabile; per la seconda, 3 byte a partire dalla colonna 20. Linee vuote, o
che iniziano con #, vengono ignorate; per tutte le altre si applica la
regola del formato, e se viene trovato qualcosa non interpretabile come
numero, viene segnalato un errore. Se i dati sono letti senza problemi, le
variabili avranno per nome v1, v2, ecc. Sta all'utente dare alle variabili
nomi e descrizioni informative tramite i comandi "rename" e/o "setinfo".

Di default, quando si importa un file contenente delle stringhe di valori
una casella di testo si aprirà mostrando i contenuti del file
string_table.txt, il quale contiene una legenda sull'associazione fra le
stringhe ed i valori numerici corrispondenti. Per far sì che ciò non
accada, si usi l'opzione --quiet.

Apertura di una selezione

In generale, l'uso di open con un file di dati (al contrario di ciò che
accade con un database) implica la lettura di tutte le serie che esso
contiene. Tuttavia, per dati in formato gretl nativo (gdt e gdtb) è
possibile indicare un sottinsieme delle serie da leggere. L'opzione da usare
a questo scopo è --select, che richiede un argomento. Quest'ultimo può
prendere tre forme: il nome di una serie singola, una lista di nomi,
comppresa fra virgolette doppie e separati da spazi, o un array di stringhe
preesistente. Ad esempio:

      # serie singola
      open somefile.gdt --select=x1
      # più serie
      open somefile.gdt --select="x1 x5 x27"
      # metodo alternativo
      strings Sel = defarray("x1", "x5", "x27")
      open somefile.gdt --select=Sel

Apertura di un database

Come si diceva sopra, questo comando può essere usato anche per aprire un
database (gretl, RATS 4.0 o PcGive) per la lettura. In questo caso,
dev'essere seguito dal comando "data" per estrarre una particolare serie dal
database.

Sono ammessi anche altri casi: in primo luogo, se si usa l'opzione www, il
programma cercherà di accedere al database specificato sul server di gretl
-- ad esempio il database "Federal Reserve interest rates" nel terzo degli
esempi visti sopra. Un altra possibilità è quella di usare il comando
nella forma "open dbnomics", che userà DB.NOMICS come fonte dei dati; su
questo argomento, vedi dbnomics per gretl. Infine, se viene date l'opzione
--odbc gretl prenderà i dati da un database ODBC. Per spiegazioni
dettagliate, si veda la guida all'uso di gretl (il capitolo 42).

Accesso dal menù:    /File/Apri dati
Accesso alternativo: Trascinare un file di dati in gretl (MS Windows o Gnome)

# orthdev Transformations

Argomento:  lista-variabili

Utilizzabile solo con dati panel. Per ognuna delle variabili nella
lista-variabili viene generata una serie di deviazioni ortogonali in avanti,
salvata col nome della variabile prefissata da o_. Quindi, "orthdev x y"
crea le nuove variabili o_x e o_y.

I valori sono salvati con un periodo di ritardo rispetto alla loro
collocazione temporale (ossia, o_x all'osservazione t contiene la deviazione
che, in senso stretto, corrisponde al periodo t - 1). Questo comportamento
è coerente con quello delle differenze prime: viene persa la prima
osservazione di ogni serie, non l'ultima.

# outfile Printing

Varianti:   outfile nomefile
            outfile --buffer=varstr
            outfile --tempfile=varstr
Opzioni:    --append (aggiunge al file)
            --quiet (vedi sotto)
            --buffer (vedi sotto)
            --tempfile (vedi sotto)
Esempi:     outfile regress.txt
            end outfile

Il comando outfile inizia un blocco in cui tutto l'output stampato viene
deviato a un file o a un buffer (o, volendo, semplicemnte buttato via). Tale
blocco è chiuso dal comando "end outfile", dopodiché l'output viene
mandato di nuovo allo stream predefinito.

Reindirizzamento a un file

La prima variante manda l'output a un file il cui nome è dato come
argomento nomefile. Di default, viene creato un file nuovo (sovrascrivendo
il file dello stesso nome, se esiste). L'output verrà scritto nella
corrente "workdir", a meno che il nomefile non contenga un percorso
completo. Se invece di sovrascrivere si vuole aggiungere in coda, va usata
l'opzione --append.

Tre varianti speciali del comando sono disponibili. Se si utilizza la parola
chiave null al posto del vero nome del file l'effetto prodotto sarà quello
di sopprimere tutti gli output fino alla istruzione successiva. Se una delle
due parole chiave, tra stdout o stderr, è data al posto dello standard nome
di file l'effetto che si produrrà sarà quello di reindirizzare l'output
sull'output standard o sullo standard errors.

Quello che segue è un semplice esempio, in cui l'ouput di una regressione
viene scritto su un file.

    open data4-10
    outfile regress.txt
    ols ENROLL 0 CATHOL INCOME COLLEGE
    end outfile

Reindirizzamento a un buffer

L'opzione --buffer serve a mandare l'ouput a una variabile stringa. Il
parametro per questa opzione dev'essere il nome di una variabile stringa
preesistente, il cuni contenuto sarà sovrascritto. Quello che segue è lo
stesso esempio fatto appena sopra, a parte che l'output va ad una stringa.
In questo caso stampando model_out si vedrà l'output reindirizzato.

    open data4-10
    string model_out = ""
    outfile --buffer=model_out
    ols ENROLL 0 CATHOL INCOME COLLEGE
    end outfile
    print model_out

Reindirizzamento a un file temporaneo

L'opzione --tempfile serve a mandare l'output a un file temporaneo, con un
nome costruito automaticamente per assicurarne l'unicità, nella directory
"di servizio". Così come nel caso del buffer, il parametro dell'opzione
dev'essere il nome di una variabile stringa, che viene riempita col nome del
file temporaneo. Nota bene: i file scritti sulla directory di servizio
vengono cancellati quando si esce dal programma: non usate questa forma se
volete che il file sia conservato.

Ripetiamo l'esempio fatto sopra, con un paio di linee in più per illustrare
il punto che varstr dice dove l'output è andato, e volendo lo si può
leggere usando la funzione "readfile".

    open data4-10
    string mytemp
    outfile --tempfile=mytemp
    ols ENROLL 0 CATHOL INCOME COLLEGE
    end outfile
    printf "Output went to %s\n", mytemp
    printf "The output was:\n%s\n", readfile(mytemp)

L'opzione quiet

L'effetto dell'opzione --quiet è quello di disattivare la stampa dei
comandi e dei messaggi ausiliari nel frattempo che l'output viene
reindirizzato. È l'equivalente di fare:

    set echo off
    set messages off

se non per il fatto che al termine della ridirezione i valori originali di
echo e messages vengono ripristinati. Quest'opzione è disponibile in tutti
i casi.

Livelli di ridirezione

In un dato punto del codice, ci può essere solo un file aperto con questa
tecnica; quindi, le chiamate a questo comando non possono essere annidate.
Ciononostante, questo comando è consentito nelle funzioni scritte
dall'utente (purché il file di output venga chiuso nella stessa funzione),
cosicché l'output può essere ridiretto temporaneamente e poi riassegnato
al file di output originale. Ad esempio, il codice

    function void f (string s)
        outfile inner.txt
	    print s
        end outfile
    end function

    outfile outer.txt --quiet
    print "Fuori"
    f("Dentro")
    print "Ancora fuori"
    end outfile

produrrà un file di nome "outer.txt" contenente le due linee

    Fuori
    Ancora fuori

e un file di nome "inner.txt" contenente la linea

    Dentro

# panel Estimation

Argomenti:  variabile dipendente variabili indipendenti
Opzioni:    --vcv (mostra la matrice di covarianza)
            --fixed-effects (stima con effetti di gruppo fissi)
            --random-effects (effetti casuali o modello GLS)
            --nerlove (usa la transformazione di Nerlove)
            --pooled (stima un modello OLS pooled)
            --between (stima il modello tra i gruppi)
            --robust (errori standard robusti, si veda oltre)
            --time-dummies (include variabili dummy temporali)
            --unit-weights (minimi quadrati ponderati)
            --iterate (stima iterativa)
            --matrix-diff (esegue un test di Hausman con differenza fra
	matrici)
            --unbalanced=metodo (solamente per random effects, si veda oltre)
            --quiet (mostra meno risultati)
            --verbose (mostra più risultati)
Esempi:     penngrow.inp

Stima un modello panel, per impostazione predefinita usando lo stimatore a
effetti fissi; la stima è implementata sottraendo le medie di gruppo o
delle unità dai dati originali.

Se l'opzione --random-effects è data allora verrano eseguite le stime del
modello ad effetti random, utilizzando di default il metodo descritto da
Swamy e Arora (1972). In questo caso solamente l'opzione --matrix-diff
consente l'utilizzo forzato del metodo della differenza fra matrici
(anziché il metodo della regressione), in modo tale da consentire
l'utilizzo del test di Hausman per la consistenza dei stimatori ad effetti
random. Altra specifica allo stimatore ad effetti random è data
dall'utilizzo del comando --nerlove, il quale utilizza il metodo di Nerlove
(1971) invece del metodo di Swamy e Arora.

In alternativa, con l'opzione --unit-weights, il modello viene stimato con i
minimi quadrati ponderati, con i pesi costruiti a partire dalla varianza
residua per le rispettive unità cross section nel campione. Solo in questo
caso, è possibile usare l'opzione --iterate per produrre stime iterative:
nel caso di convergenza, le stime sono di massima verosimiglianza.

Come ulteriore alternativa, se si usa l'opzione --between, viene stimato il
modello tra i gruppi, ossia una regressione OLS usando le medie dei gruppi.

Il metodo predefinito per calcolare errori standard robusti in modelli con
dati panel è descritto dallo stimatore HAC di Arellano, ma può essere
utilizzato anche lo stimatore di Beck-Katz per "panel standard errors
corretti" attraverso il comando set pcse on. Quando è specificata l'opzione
--robust il test F viene eseguito sullo stimatore ad effetti fissi
utilizzando il metodo robusto di Welch (1951).

L'opzione --unbalanced è disponibile solo per modelli random effects: può
essere utilizzato per scegliere un metodo ANOVA da usare con panel non
bilanciati. Per default, gretl utilizza il metodo di Swamy-Arora come per i
panel bilanciati, eccezion fatta per l'utilizzo di una media armonica delle
singole lunghezze temporali al posto di una T comune. Con quest'opzione è
possibile specificare sia bc, per usare il metodo di Baltagi e Chang (1994),
o stata, per emulare l'opzione sa per il comando xtreg in Stata.

Per maggiori dettagli sulla stima panel, si veda la guida all'uso di gretl
(il capitolo 23).

Accesso dal menù:    /Modello/Panel

# panplot Graphs

Argomento:  variabile
Opzioni:    --means (medie per gruppo attraverso il tempo)
            --overlay (unità mescolate, N <= 130)
            --sequence (unità in sequenza, N <= 130)
            --grid (unità su griglia, N <= 16)
            --stack (unità sovrapposte verticalmente, N <= 6)
            --boxplots (boxplot per unità, in sequenza, N <= 150)
            --boxplot (boxplot per tutte le unità)
            --output=nomefile (ridireziona l'output)
Esempi:     panplot x --overlay
            panplot x --means --output=display

Comando grafico specifico per dati panel: la serie variabile viene graficata
a seconda delle opzioni specificate.

A parte le opzioni --means e --boxplot quel che viene graficato è la
variazione della serie sia sotto il profilo longitudinale che quello
temporale. Questo tipo di grafici è limitato dal numero di unità nel
dataset in uso. Ad esempio, l'opzione --overlay, che mostra una serie
storica per ciascuna unità, è disponibile soltanto se il numero di unità
N è minore o uguale a 130. (In caso contrario, il grafico diventa troppo
denso per essere informativo.) Se un dataset è troppo grande da permettere
l'applicazione del comando, va selezionato preventivamente un sottocampione
di unità, come ad esempio

      smpl 1 100 --unit
      panplot x --overlay
      smpl full

L'opzione --output=filename è usata per controllare forma e destinazione
dell'output; per dettagli, vedi il comando "gnuplot".

Accesso alternativo: Main window pop-up menu (single selection)

# panspec Tests

Opzioni:    --nerlove (usa il metodo di Nervole per effetti casuali)
            --matrix_diff (usa il metodo di differenze tra matrici per il test di Hausman)

Questo test è disponibile solo dopo aver stimato un modello OLS su dati
panel (si veda anche "setobs"). Testa il semplice modello "pooled" (con
tutte le osservazioni mescolate indistintamente) contro le principali
alternative: il modello a effetti fissi e quello a effetti casuali.

Il modello a effetti fissi permette all'intercetta della regressione di
variare per ogni unità cross section. Viene eseguito un test F per
l'ipotesi nulla che le intercette non differiscano tra loro. Il modello a
effetti casuali scompone la varianza dei residui in due parti: una specifica
alle unità cross section e una specifica all'osservazione particolare (la
stima può essere eseguita solo se il numero delle unità cross section nel
dataset è maggiore del numero dei parametri da stimare). La statistica LM
di Breusch-Pagan testa l'ipotesi nulla che il modello pooled OLS sia
adeguato contro l'alternativo modello a effetti casuali.

Può accadere che il modello pooled OLS sia rifiutato nei confronti di
entrambe le alternative, a effetti fissi o casuali. A patto che gli errori
specifici di unità o di gruppo siano non correlati con le variabili
indipendenti, lo stimatore a effetti casuali è più efficiente dello
stimatore a effetti fissi; nel caso contrario lo stimatore a effetti casuali
non è consistente e deve essergli preferito lo stimatore a effetti fissi.
L'ipotesi nulla per il test di Hausman è che l'errore specifico di gruppo
non sia correlato con le variabili indipendenti (e quindi che il modello a
effetti casuali sia preferibile). Un basso p-value per questo test
suggerisce di rifiutare il modello a effetti casuali in favore del modello a
effetti fissi.

Le due opzioni per questo comando riguardano il modello ad effetti casuali.
Di default viene utilizzato il metodo di Swamy e Arora ed il test di Hausman
viene calcolato usando il metodo di regressione. Le opzioni di cui sopra
consentono di abilitare, in alternativa, il metodo di Nerlove per effetti
casuali e/o l'approccio di differenza tra matrici per il calcolo del test di
Hausman.

Accesso dal menù:    Finestra del modello, /Test/HAUSMAN - Diagnosi panel

# pca Statistics

Argomento:  lista-variabili
Opzioni:    --covariance (usa la matrice di covarianza)
            --save[=n] (salva le componenti principali)
            --save-all (salva tutte le componenti)
            --quiet (non stampa i risultati)

Analisi delle Componenti Principali. A meno che l'opzione --quiet non sia
presente, stampa gli autovalori associati alla matrice di correlazione (o
matrice di covarianze se è specificata l'opzione --covariance) per le
variabili inserite nella lista-variabili, con allegate proporzioni della
varianza totale spiegata dalle singole compenenti. Stampa anche i
corrispondenti autovettori, o "pesi delle componenti".

Se si dà l'opzione --save-all allora tutte le componenti verranno salvate
nel dataset come variabili denominate PC1, PC2 e così via. Queste variabili
artificiali sono definite come la la combinazione lineare delle X_i
standardizzate (dove X_i è l'i-esima variabile della lista-variabili) con i
pesi.

Se si dà l'opzione --save senza un parametro specificato le componenti con
autovalori maggiori della media (il che significa maggiori di 1.0 se
l'analisi è basata sulla matrice di correlazione) sono salvati nel dataset
come nuove variabili, come descritto sopra. Se invece si dà un valore per
n, con quest'opzione allora le n più importanti componenti vengono salvate.

Si veda anche la function "princomp".

Accesso dal menù:    /Visualizza/Componenti principali
Accesso alternativo: Pop-up nella finestra principale (selezione multipla)

# pergm Statistics

Argomenti:  nome-variabile [ banda ]
Opzioni:    --bartlett (usa la finestra di Bartlett)
            --log (usa una scala logaritmica)
            --radians (mostra la frequenza in radianti)
            --degrees (mostra la frequenza in gradi)
            --plot=modalità o nome del file (si veda oltre)

Calcola e mostra (graficamente se non si è in modalità batch) lo spettro
della variabile specificata. Per impostazione predefinita viene mostrato il
periodogramma nel campione, mentre usando l'opzione --bartlett, lo spettro
viene stimato usando una finestra di Bartlett per i ritardi (si veda ad
esempio Econometric Analysis di Greene per una discussione su questo
argomento). L'ampiezza predefinita della finestra di Bartlett è pari a due
volte la radice quadrata dell'ampiezza campionaria, ma questo valore può
essere impostato manualmente usando il parametro banda, fino a un massimo
pari a metà dell'ampiezza campionaria.

Usando l'opzione --log, lo spettro viene rappresentato su una scala
logaritmica.

Le due opzioni (mutualmente escludibili) --radians e --degrees condizionano
la tipologia dell'asse di frequenza quando il periodogramma viene
rappresentato. Da impostazione predefinita, la frequenza è scalata per il
numero di osservazioni nel campione; tuttavia, queste opzioni comportano che
l'asse di frequenza possa venire ridenominato da 0 a pi radianti o da 0 a
180degrees, rispettivamente.

Di default, se il programma non è in modalità batch, viene mostrato il
periodogramma a video. Questo comportamento è modificabile attraverso
l'opzione --plot. I parametri accettabili nel caso sono none (sopprime il
grafico); display (per mostrare a video il grafico anche se il programma è
in batch mode); oppure un nome di file. L'effetto di dare un nome di file è
quello descritto per l'opzione --output del comando "gnuplot".

Quando viene mostrato il periodogramma del campione, vengono mostrati anche
due test per l'integrazione frazionale ("memoria lunga") della serie, ossia
il test di Geweke e Porter-Hudak (GPH), e lo stimatore locale di Whittle.
L'ipotesi nulla in entrambi i casi è che l'ordine di integrazione sia zero.
Per impostazione predefinita, l'ordine per questi test è il valore minore
tra T/2 e T^0.6; anche questo valore può essere modificato con il parametro
di banda.

Accesso dal menù:    /Variabile/Spettro
Accesso alternativo: Menù pop-up nella finestra principale (selezione singola)

# pkg Utilities

Argomenti:  azione nomepacchetto
Opzioni:    --local (installa da file in locale)
            --quiet (vedi sotto)
            --verbose (vedi sotto)
Esempi:     pkg install armax
            pkg install /path/to/myfile.gfn --local
            pkg query ghosts
            pkg unload armax

Comando per installare, rimuovere dalla memoria e disinstallare pacchetti di
funzioni (file gfn o zip). Il parametro azione deve essere uno fra install,
query, unload, remove o index.

install: Nella sua forma più semplice, senza opzioni e con l'argomento
pkgname che corrisponde al nome "semplice" di un pacchetto (come nel primo
esempio), il pacchetto stesso verrà scaricato dal server di gretl (a meno
che nomepacchetto non cominci con http://) e installato in locale. In questo
caso, indicare l'estensione è superfluo. Se viene data l'opzione --local,
l'argomento nomepacchetto deve essere il percorso completo di un file di
pacchetto sulla macchina locale, completo di estensione (.gfn o .zip).
L'azione conseguente al comando è di copiarlo (se gfn), o espanderlo (se
zip) nel posto giusto, ossia dove il comando "include" sia in grado poi di
trovarlo.

query: L'effetto di default effect è di stampare alcune informazioni di
base sul pacchetto (autore, versione, ecc.). Selezionando l'opzione --quiet
però non viene stampato nulla; le informazioni, invece, vengono salvate in
un bundle, accessibile via "$result".

unload: l'argomento pkgname deve essere dato in forma semplice, senza
percorso o suffisso (come nell'ultimo esempio). L'effetto è scaricare il
pacchetto dalla memoria e rimuoverlo, anche dal menu GUI a cui sia
eventualmente attaccato.

remove: come unload, ma in aggiunta cancella anche dal disco i file di
pacchetto.

index: è un caso particolare, in cui il nome del pacchetto deve essere
sostituito dalla stringa "addons": l'effetto è quello di aggiornare
l'indice dei pacchetti standard, anche noti come "addons". Quest'operazione
viene svolta in automatico di tanto in tanto, ma in certi casi la si
potrebbe voler fare a mano. in tal caso, l'opzione --verbose produce un
report di ciò che viene cercato e trovato. Ad esempio:

      pkg index addons --verbose

Accesso dal menù:    /Strumenti/Pacchetti/Sul server

# plot Graphs

Argomento:  data
Opzioni:    --with-lines[=varspec] (usa linee, non punto)
            --with-lp[=varspec] (usa linee e punti)
            --with-impulses[=varspec] (usa linee verticali)
            --with-steps[=varspec] (usa linee verticali ed orizzontali)
            --time-series (mostra il grafico rispetto al tempo)
            --single-yaxis (forza all'uso di un solo asse delle ordinate)
            --dummy (si veda oltre)
            --fit=fitspec (si veda oltre)
            --band=bandspec (si veda oltre)
            --band-style=stile (si veda oltre)
            --output=nomefile (reindirizza l'output ad un file specifico)
Esempi:     nile.inp

Il blocco plot offre un'alternativa al comando "gnuplot", che potrebbe
essere più efficace per produrre grafici particolarmente elaborati (con
diverse opzioni e/o comandi gnuplot inseriti). Oltre alla spiegazione
seguente, si possono trovare altri esempi consultando la guida all'uso di
gretl (il capitolo 6).

Un blocco plot comincia col comando plot seguito dall'argomento data, che
indica i dati da usare: quest'ultimo dev'essere il nome di una lista, una
matrice, o una serie singola. Se l'argomento data non viene specificato
allora il blocco deve obbligatoriamente contere almeno una funzione
analitica da graficare; queste funzioni posso essere scritte tramite righe
literal o printf (si veda oltre).

Se viene fornita una lista o una matrice, l'ultimo elemento (se lista) o
l'ultima colonna (se matrice) è preso come asse delle ascisse e le altre
come ordinata, a meno che non venga usata l'opzione --time-series, nel qual
caso tutte le variabili vanno in ordinata.

L'opzione di fornire il nome di una singola serie è ristretta solo ai dati
temporali, nel qual caso si assume che si voglia ricevere un grafico
time-series; altrimenti verrà riportato un errore.

La linea iniziale può essere dotata del prefisso "nome <-" per salvare il
grafico come icona nel programma GUI. Il blocco si chiude con end plot.

All'interno del blocco si possono avere zero o più linee di questo tipo,
identificate da una delle seguenti parole chiave:

  option: specifica una singola opzione.

  options: specifica più di una opzione per una singola riga, sono separate
  da spazi.

  literal: un comando da passare a gnuplot senza modifiche.

  printf: una comando printf il cui risultato verrà passato a gnuplot senza
  modifiche.

Si noti che, quando si specifica un'opzione attraverso i comandi option o
options, il solito -- va omesso. Per ulteriori dettagli sugli effetti delle
varie opzioni si veda "gnuplot" (ma vedi anche sotto su alcune specificità
dell'opzione --band nel contesto plot).

L'uso del blocco plot è illustrato al meglio tramite un esempio:

      string title = "My title"
      string xname = "My x-variable"
      plot plotmat
      options with-lines fit=none
      literal set linetype 3 lc rgb "#0000ff"
      literal set nokey
      printf "set title \"%s\"", title
      printf "set xlabel \"%s\"", xname
      end plot --output=display

Questo esempio ipotizza che plotmat sia un nome di una matrice avente almeno
2 colonne (o di una lista avente almeno 2 membri). Si noti che è
considerata buona pratica quella di utilizzare l'opzione --output
(solamente) nell'ultima linea del blocco.

Disegnare una banda usando una matrice

Le opzioni --band e --band-style funzionano principalmente come descritto
nell'help del comando gnuplot, con le seguenti eccezioni: quando i dati sono
passati in forma di matrice, il primo parametro per --band deve essere dato
come il nome di una matrice con 2 colonne (contenenti, rispettivamente, il
centro e l'ampiezza della banda). Questo parametro prende il posto dei due
valori richiesti dalla versione gnuplot di questa opzione (nome della serie
o ID numerico o colonne della matrice). Per esempio:

      scalar n = 100
      matrix x = seq(1,n)'
      matrix y = x + filter(mnormal(n,1), 1, {1.8, -0.9})
      matrix B = y ~ muniform(n,1)
      plot y
      options time-series with-lines
      options band=B,10 band-style=fill
      end plot --output=display

Disegnare senza dati

Il seguente esempio mostra un semplice caso di come si specifica un grafico
senza l'utilizzo di una sorgente dati.

      plot
      literal set title 'CRRA utility'
      literal set xlabel 'c'
      literal set ylabel 'u(c)'
      literal set xrange[1:3]
      literal set key top left
      literal crra(x,s) = (x**(1-s) - 1)/(1-s)
      printf "plot crra(x, 0) t 'sigma=0', \\"
      printf " log(x) t 'sigma=1', \\"
      printf " crra(x,3) t 'sigma=3"
      end plot --output=display

# poisson Estimation

Argomenti:  variabile-dipendente variabili-indipendenti [ ; offset ]
Opzioni:    --robust (errori standard robusti)
            --cluster=clustvar (vedi "logit" per una spiegazione)
            --vcv (stampa la matrice di covarianze)
            --verbose (stampa i dettagli delle iterazioni)
            --quiet (non stampa i risultati)
Esempi:     poisson y 0 x1 x2
            poisson y 0 x1 x2 ; S
            Vedi anche camtriv.inp

Stima una regressione di Poisson, in cui la variabile dipendente rappresenta
le occorrenze di un qualche tipo di evento e può assumere solo valori
interi non negativi.

Se una variabile casuale discreta Y segue la distribuzione di Poisson,

  Pr(Y = y) = exp(-v) * v^y / y!

per y = 0, 1, 2,.... La media e la varianza della distribuzione sono
entrambe uguali a v. Nel modello di regressione di Poisson, il parametro v
è rappresentato da una funzione di una o più varabili indipendenti. La
versione più comune del modello (e l'unica supportata da gretl) ha

  v = exp(b0 + b1*x1 + b2*x2 + ...)

ossia il logaritmo di v è una funzione lineare delle variabili
indipendenti.

Opzionalmente è possibile aggiungere una variabile "offset" alla
specificazione, ossia una variabile di scala, il cui logaritmo viene
aggiunto alla funzione di regressione lineare (con un coefficiente implicito
di 1.0). Ciò ha senso se si ipotizza che il numero di occorrenze
dell'evento in questione sia proporzionale a qualche fattore noto, a parità
di altre condizioni. Ad esempio, il numero di incidenti stradali può essere
ipotizzato proporzionale al volume del traffico, che potrebbe essere
specificato come una variabile di "offset" in un modello di Poisson per il
tasso di incidenti. La variabile di offset dev'essere strettamente positiva.

Da impostazione predefinita gli errori standard sono calcolati usando la
matrice Hessiana. Se viene data l'opzione --robust allora gli errori
standard vengono calcolati secondo il metodo o di Huber-White o QML. In
questo particolare caso la matrice di covarianze stimata è il prodotto del
"sandwich" tra l'Hessiana inversa (negativa) ed il prodotto esterno del
gradiente.

Si veda anche la voce "negbin".

Accesso dal menù:    /Modello/Modelli non lineari/Poisson

# print Printing

Varianti:   print lista-variabili
            print
            print nomi-oggetto
            print stringa
Opzioni:    --byobs (per osservazione)
            --no-dates (usa i numeri delle osservazioni)
            --range=inizio:fine (vedi sotto)
            --midas (vedi sotto)
            --tree (specifico per bundle; vedi sotto)
Esempi:     print x1 x2 --byobs
            print my_matrix
            print "Questa è una stringa"
            print my_array --range=3:6
            print hflist --midas

Si noti che print è un comando relativamente "rozzo" (principalmente
rivolto alla stampa di serie); per alternative più avanzate e meno
restrittive, si vedano i comandi "printf" e "eval".

Nella prima variante mostrata sopra (vedia anche il primo esempio), lista
dev'essere una lista di serie (sia come variabile predefinita che come lista
di nomi o numeri ID separati da spazi). In tal caso, il comando stampa i
valori delle variabili specificate. Per default, la stampa avviene "per
variabile", ma con l'opzione --byobs i dati vengono stampati per
osservazione. Nel secondo caso, il comportamento predefinito è quello di
mostrare la data (per serie storiche) o il marcatore (se esiste) all'inizio
di ogni riga. L'opzione --no-dates sopprime la visualizzazione delle date o
dei marcatori: viene mostrato solo un semplice numero di osservazione. Si
veda l'ultimo paragrafo di questa voce per l'effetto in questo contesto
dell'opzione --midas (che si applica solo a liste predefinite).

Se al comando non vengono forniti argomenti (la seconda variante mostrata
all'inizio), l'azione è simile a quella appena descritta, con tanto di
opzioni aggiuntive. La sola differenza è che vengono stampate tutte le
serie nel dataset aperto.

La terza variante (con l'argomento nomi-oggetto; vedi il secondo esempio)
funziona con una lista di nomi (separati da spazi) di variabili diversi da
serie: scalari, matrici, stringhe, bundle, array. Di questi oggetti, vengono
mostrati i valori. Nel caso dei bundle, gli elementi vengono ordinati per
tipo e alfabeticamente.

Nella quarta forma (terzo esempio), stringa dev'essere una stringa racchiusa
da virgolette doppie (senza che vi sia nient'altro dopo). La stringa viene
stampata, seguita da un "a capo".

L'opzione --range è usata per controllare la quantità di informazione
stampata. I valori (interi) inizio e fine fanno riferimento alle
osservazioni per serie e liste, alle rghe per le matrici, agli elementi per
gli array, e alle linee di testo per le stringhe. In tutti i casi, il valore
minimo per inizio è 1 e il massimo stop è la dimensione "per riga"
dell'oggetto in questione. Valori negativi per questi indici sono
interpretati come valori a partire dal fondo. Gli indici possono avere la
forma di numeri o di variabili scalari predefinite. Se inizio viene omesso,
si intende 1 e se viene omesso fine si intende "fino in fondo". Si noti che
nel caso di serie e liste, gli indici sono relativi al sottocampione in uso.

L'opzione --tree è specifica alla stampa di un bundle: essa fa sì che
venga stampato anche il contenuto degli eventuali altri bundle contenuti in
quello specificato (anche come array di bundle). Altrimenti, vengono
elencati solo gli elementi di livello più alto.

L'opzione --midas è specifica alla stampa di una lista di serie; in
particolare, è usata per quei dataset che contengono una o più serie ad
alta frequenza, ognuna rappresentata da una "MIDAS list". Se viene passata
come argomento una lista di questo tipo, verrà stampata (per osservazione)
la serie alla sua frequenza "nativa".

Accesso dal menù:    /Dati/Mostra valori

# printf Printing

Argomenti:  formato , argomenti

Stampa valori scalari, serie, matrici o stringhe formattandoli secondo le
indicazioni di una stringa di formato (che supporta un piccolo sottoinsieme
del comando printf() del linguaggio di programmazione C). I formati numerici
riconosciuti sono %e, %E, %f, %g, %G, %d, e %x, con i vari modificatori
disponibili in C. Esempi: la stringa di formato %.10g stampa un valore con
10 cifre significative; %12.6f stampa un valore con 6 cifre decimali e una
larghezza di 12 caratteri. Si noti comunque che in gretl il formato %g è
una buona scelta di default per tutti i valori numerici; non c'è bisogno di
andare troppo sul complicato. Il formato %s è consigliato qualora si lavori
con le stringhe.

La stringa di formato deve essere racchiusa tra virgolette doppie, i valori
da stampare devono seguire la stringa di formato, separati da virgole. I
valori possono avere tre forme: a) nomi di variabili; b) espressioni valide
per il comando "genr"; c) le funzioni speciali varname() o date(). L'esempio
seguente stampa i valori di due variabili e quello di un'espressione
calcolata:

  ols 1 0 2 3
  genr b = $coeff(2)
  genr se_b = $stderr(2)
  printf "b = %.8g, standard error %.8g, t = %.4f\n", b, se_b, b/se_b

Le prossime righe mostrano l'uso delle funzioni varname e date, che mostrano
rispettivamente il nome di una variabile dato il suo numero identificativo,
e una stringa data, dato un numero di osservazione.

  printf "Il nome della variabile %d è %s\n", i, varname(i)
  printf "La data dell'osservazione %d è %s\n", j, date(j)

Se si usa un argomento matrice insieme a un formato numerico, l'intera
matrice verrà stampata usando per ogni elemento il formato numerico
indicato. La stessa cosa vale per le serie, tranne per il fatto che
l'intervallo di valori stampato è controllato dall'impostazione del
campione corrente.

La lunghezza massima di una stringa di formato è di 127 caratteri. Vengono
riconosciute le sequenze di escape \n (newline), \t (tab), \v (tab
verticale) e \\ (barra inversa). Per stampare un segno di percentuale, si
usi %%.

Come in C, i valori numerici che fanno parte del formato (larghezza e
precisione) possono essere dati direttamente come numeri, come in %10.4f, o
come variabili. Nell'ultimo caso, si inseriscono asterischi nella stringa di
formato e si forniscono nell'ordine gli argomenti corrispondenti. Ad
esempio:

  scalar larghezza = 12
  scalar precisione = 6
  printf "x = %*.*f\n", larghezza, precisione, x

# probit Estimation

Argomenti:  variabile-dipendente variabili-indipendenti
Opzioni:    --robust (errori standard robusti)
            --cluster=clustvar (si veda "logit" per una spiegazione)
            --vcv (mostra la matrice di covarianza)
            --verbose (mostra i dettagli delle iterazioni)
            --quiet (non stampa i risultati)
            --p-values (mostra i p-value invece degli effetti
	marginali)
            --random-effects (stima un modello panel a effetti casuali (RE))
            --quadpoints=k (numero di punti di quadratura per la stima RE)
Esempi:     ooballot.inp, oprobit.inp, reprobit.inp

Se la variabile dipendente è binaria (tutti i suoi valori sono 0 o 1),
esegue una stima di massima verosimiglianza dei coefficienti delle
variabili-indipendenti con il metodo Newton-Raphson. Visto che il modello è
nonlineare, gli effetti marginali (pendenze) dipendono dai valori delle
variabili indipendenti: per impostazione predefinita, al posto dei p-value
vengono mostrate le pendenze rispetto ad ognuna delle variabili
indipendenti, calcolate in corrispondenza della media della variabile.
Questo comportamento può essere soppresso usando l'opzione --p-values. La
statistica chi-quadro testa l'ipotesi nulla che tutti i coefficienti tranne
la costante siano pari a zero.

In modalità predefinita, gli errori standard sono calcolati tramite
l'inversa negativa della matrice Hessiana. Se si usa l'opzione --robust,
verranno calcolati gli errori standard con il metodo QML o con quello di
Huber-White. In questo caso, la matrice di covarianza stimata è un
"sandwich" dell'inversa dell'Hessiana stimata e del prodotto esterno del
gradiente. Per i dettagli, si veda Davidson e MacKinnon 2004, cap. 10.

Se la variabile dipendente non è binaria ma è discreta allora si
otterranno delle stime Ordered Probit. (Se la variabile selezionata come
dipendente non è nemmeno discreta allora viene segnalato un errore.)

Probit per dati panel

Con l'opzione --random-effects, il termine di errore è composto per ipotesi
da due componenti gaussiane: una specifica per l'unità cross-sezionale e
invariante nel tempo (nota come "effetto individuale") e l'altra specifica
per quella particolare osservazione.

Il calcolo della log-verosimiglianza per questo modello viene effettuato
tramite la quadratura di Gauss-Hermite per approssimare il valore di valori
attesi di funzioni di variabili casuali normali. Il numero di punti di
quadratura usati si può scegliere tramite l'opzione --quadpoints (il
default è 32). Un numero elevato di questi aumenta l'accuratezza dei
risultati, ma al costo di tempi di calcolo più lunghi; in questo caso la
stima può richiedere molto tempo con dataset grandi.

Oltre ai parametri standard (e statistiche associate) relativi alle
variabili esplicative, dopo la stima di questo tipo di modello vengono
presentati alcuni risultati aggiuntivi:

  lnsigma2: la stima ML del logaritmo della varianza dell'effetto
  individuale;

  sigma_u: la stima dell'errore quadratico medio dell'effetto individuale;

  rho: la quota stima dell'effetto individuale sulla varianza totale del
  termine di errore composito (anche nota come correlazione intra-classe).

Il test LR per l'ipotesi nulla rho=0 consente di stabilire se la
specificazione a effetti random è davvero necessaria. Sotto la nulla, una
semplice specificazione probit è del tutto adeguata. Se la nulla non viene
rigettata allora questo suggerirà che una semplice specificazione pooled
per il modello probit risulta più che adeguata.

Il probit per l'analisi delle proporzioni non è ancora stato implementato
in gretl.

Accesso dal menù:    /Modello/Modelli non lineari/Probit

# pvalue Utilities

Argomenti:  distribuzione [ parametri ] valore-x
Esempi:     pvalue z zscore
            pvalue t 25 3.0
            pvalue X 3 5.6
            pvalue F 4 58 fval
            pvalue G shape scale x
            pvalue B bprob 10 6
            pvalue P lambda x
            pvalue W shape scale x
            Vedi anche mrw.inp, restrict.inp

Calcola l'area alla destra del valore-x nella distribuzione indicata (z per
la Gaussiana, t per la t di Student, X per la chi-quadro, F per la F, G per
la gamma, B per la binomiale, P per la Poisson, exp per l'esponenziale
negativa e W per la Weibull).

A seconda della distribuzione, occorre fornire le seguenti informazioni,
prima del valore-x: per le distribuzioni t e chi-quadro occorre indicare i
gradi di libertà; per la F sono richiesti i gradi di libertà al numeratore
e al denominatore; per la gamma sono richiesti il parametro di forma e
quello di scala; per la binomiale sono richieste la probabilità di
"successo" e il numero di prove; per la distribuzione di Poisson va indicato
il parametro lambda (che rappresenta sia la media che la varianza); per
l'esponenziale, il parametro di scala; per la distribuzione Weibull, i
parametri di forma e scala. Come si vede dagli esempi precedenti, gli
argomenti numerici possono essere indicati sotto forma di numero o come nomi
di variabili.

Si noti che talvolta la distribuzione gamma viene caratterizzata dai
parametri di media e varianza, invece che da quelli di forma e scala. La
media è il prodotto di forma e scala, mentre la varianza è il prodotto tra
la forma e il quadrato della scala. Quindi la scala si può ottenere come la
varianza divisa per la media, mentre la forma come la media divisa per la
scala.

Accesso dal menù:    /Strumenti/Calcola p-value

# qlrtest Tests

Opzioni:    --limit-to=lista (limita il test a una parte delle variabili esplicative)
            --plot=mode-or-filename (si veda sotto)
            --quiet (non mostra l'output)

Per un modello stimato con OLS su serie storiche, esegue il test del
rapporto di verosimiglianza di Quandt (QLR) per un break strutturale in un
punto incognito del campione, escludendo il 15% delle osservazioni
all'inizio e ella fine del campione.

Per ogni possibile punto di rottura compreso nel 70% centrale delle
osservazioni, viene eseguito un test di Chow (si veda "chow"); come per il
test di Chow vero e proprio, questo è un test di Wald robusto se il modello
originale è stato stimato con l'opzione --robust. La statistica del test
QLR è il massimo dei valori F di questi test e segue una distribuzione non
standard.

Il p-value asintotico è ottenuto usando il metodo di Bruce Hansen (1997).

Oltre agli accessori standard "$test" e "$pvalue", questo comando genera
anche "$qlrbreak", che restituisce l'indice dell'ossservazione alla quale la
statistica test è massima.

L'opzione --limit-to serve a limitare le interazioni con la dummy di
divisione del campione nei test di Chow a un sottoinsieme dei regressori
originali. Il parametro dev'essere una lista predefinita che non può
contenere la costante; gli elementi della lista devono essere tutti scelti
fra i regressori originali.

Quando questo comando viene eseguito interattivamente, di default verrà
mostrato un grafico delle statistiche del test di Chow. Questo comportamento
si può modificare con l'opzione --plot. I parametri consentiti sono none
(per fare a meno del grafico); display (per mostrare il grafico anche quando
non si è in modo interattivo), oppure un nome di file. Per la descrizione
dell'effetto di quest'ultima scelta, si veda l'opzione --output del comando
"gnuplot".

Accesso dal menù:    Finestra del modello, /Test/QLR

# qqplot Graphs

Varianti:   qqplot y
            qqplot y x
Opzioni:    --z-scores (v. oltre)
            --raw (v. oltre)
            --output=nomefile (manda il grafico ad un file specificato)

Con una sola serie come argomento, mostra un grafico della distribuzione
empirica della serie stessa (indicata col nome o con il suo numero ID)
contro i quantili della normale. La serie deve includere almeno 20 valori
validi nel campione selezionato al momento. Per impostazione predefinita, i
quantili empirici vengono disegnati contro quelli della normale avente media
e varianza uguali a quelli campionari della serie, ma sono disponibili due
alternative: con l'opzione --z-scores, i dati vengono standardizzati prima,
oppure, con l'opzione --raw, i quantili empirici possono essere disegnati
contro quelli della normale standardizzata.

Tramite l'opzione --output si invia il grafico al file desiderato; usare
"display" per forzare l'output allo schermo, ad esempio nel contesto di un
loop. si veda il comando "gnuplot" per maggiori dettagli in merito a
quest'opzione.

Con due argomenti, y and x, mostra un grafico dei quantili empirici di y
contro quelli di x. I dati non vengono standardizzati.

Accesso dal menù:    /Variabile/Q-Q normale
Accesso dal menù:    /Visualizza/Grafico/Q-Q

# quantreg Estimation

Argomenti:  tau variabile-dipendente variabili-indipendenti
Opzioni:    --robust (errori standard robusti)
            --intervals[=level] (calcola gli intervalli di confidenza)
            --vcv (mostra la matrice di covarianza)
            --quiet (sopprime la stampa dei risultati)
Esempi:     quantreg 0.25 y 0 xlist
            quantreg 0.5 y 0 xlist --intervals
            quantreg 0.5 y 0 xlist --intervals=.95
            quantreg tauvec y 0 xlist --robust
            Vedi anche mrw_qr.inp

Regressione quantile. Il primo argomento, tau, è il quantile condizionale
per cui si desiderano le stime. Può essere un valore numerico o il nome di
una variabile scalare predefinita; il valore deve essere compreso
nell'intervallo da 0.01 a 0.99 (in alternativa, può essere indicato un
vettore di valori, si veda sotto per i dettagli). Gli argomenti dal secondo
in poi compongono un elenco di regressori sul modello di quello usato in
"ols".

Senza l'opzione --intervals, vengono mostrati gli errori standard per le
stime quantili; per impostazione predefinita questi sono calcolati con la
formula asintotica di Koenker e Bassett (1978), ma se si usa l'opzione
--robust, verrà usata la variante robusta per l'eteroschedasticità
utilizzando il metodo di Koenker e Zhao (1994).

Se si usa l'opzione --intervals, gretl calcolerà gli intervalli di
confidenza invece degli errori standard. Questi intervalli sono calcolati
col metodo dell'inversione del rango e in generale sono asimmetrici rispetto
alle stime puntuali dei parametri. Se non si usa l'opzione "--robust", gli
intervalli sono calcolati nell'ipotesi di errori IID (Koenker, 1994), mentre
se viene indicata sono calcolati con lo stimatore robusto sviluppato Koenker
e Machado (1999).

Per impostazione predefinita vengono prodotti intervalli di confidenza al
90%. È possibile specificare un altro livello di confidenza (sotto forma di
frazione decimale), aggiungendolo all'opzione, come in --intervals=0.95.

Invece di indicare tau come uno scalare, è possibile usare un vettore,
indicando il nome di una matrice predefinita. In questo caso le stime
vengono eseguite per tutti i valori di tau, e i risultati mostrano la
sequenza delle stime quantili per ognuno dei regressori.

Accesso dal menù:    /Modello/Stima robusta/Regressione quantile

# quit Utilities

Esce dalla modalità corrente di gretl.

  Quando il comando è in uno script, l'esecuzione dello script viene
  interrotta. Se il contesto è gretlcli (il client testuale) in modalità
  batch, terminerà gretlcli stesso; altrimenti, il programma tornerà in
  modalità interattiva.

  Quando il comando viene eseguito nel terminale GUI, il terminale si
  chiuderà.

  Quando il comando viene eseguito in modo interattivo, il programma esce.

Si noti che questo comando non può essere eseguito all'interno di funzioni
o di loop.

In comando quit non provoca l'uscita dal programma GUI in alcun caso. Per
uscire, si può usare la voce Esci del menu File, o Ctrl+Q, o cliccando sul
pulsante di chiusura della barra della finestra.

# rename Dataset

Argomenti:  serie nuovo-nome
Opzione:    --quiet (sopprime la stampa dell'output)

Cambia il nome di una serie (identificata da un nome o da un numero
identificativo) con un nuovo-nome. Il nuovo nome deve essere di massimo 31
caratteri, deve iniziare con una lettera e deve essere composto da una
combinazione di sole lettere, cifre e trattini. In aggiunta il nuovo nome
non deve essere già ad appartenente a nessun oggetto di nessun tipo del
dataset.

Accesso dal menù:    /Variabile/Modifica attributi
Accesso alternativo: Menù pop-up nella finestra principale (selezione
    singola)

# reset Tests

Opzioni:    --quiet (non mostra la regressione ausiliaria)
            --silent (non mostra nulla)
            --squares-only (calcola il test coi soli quadrati)
            --cubes-only (calcola il test coi soli cubi)

Deve seguire la stima di un modello OLS. Esegue il test RESET di Ramsey per
la specificazione del modello (non-linearità) aggiungendo alla regressione
i quadrati e/o cubi dei valori stimati, e calcola la statistica F per
l'ipotesi nulla sotto la quale i coefficienti beta delle variabili aggiunte
siano uguali a zero.

Sia i quadrati che i cubi vengono aggiunti al modello in maniera predefinita
a meno che non vengano specificate le opzioni --squares-only o --cubes-only.

L'opzione --silent può essere usata se si intendono utilizzare solo gli
accessori "$test" o "$pvalue" per disporre direttamente dei risultati del
test.

Accesso dal menù:    Finestra del modello, /Test/RESET - Ramsey

# restrict Tests

Opzioni:    --quiet (non stampare le stime vincolate)
            --silent (non stampare niente)
            --wald (solo per stimatori di sistema - vedi sotto)
            --bootstrap (se possibile, effettuare il bootstrap del test)
            --full (solo OLS e VECM, vedi sotto)
Esempi:     hamilton.inp, restrict.inp

Impone un insieme di vincoli (solitamente lineari) su (a) l'ultimo modello
stimato o (b) su un sistema di equazioni definito in precedenza. In entrambi
i casi, l'insieme di vincoli deve essere racchiuso tra i comandi "restrict"
e "end restrict".

Nel caso di una equazione singola, i vincoli sono applicati implicitamente
all'ultimo modello e vengono valutati appena viene terminato il comando
"restrict".

Nel caso di un sistema (definito attraverso il comando "system"), il comando
iniziale "restrict" può essere seguito dal nome di un sistema di equazioni
definito in precedenza; altrimenti, le restrizioni si applicheranno
all'ultimo modello stimato. I vincoli vengono valutati nella successiva
stima del sistema effettuata con il comando "estimate". Tuttavia, se viene
usata l'opzione --wald, il vincolo viene testato immediatamente per mezzo di
un test chi quadro di Wald usando la matrice di covarianze stimata. Si noti
che questa opzione produrrà un errore se il sistema è stato definito, ma
non ancora stimato.

A seconda del contesto, i vincoli possono essere espressi in diversi modi.
Quello più semplice è di esprimere ogni vincolo come equazione, con una
combinazione lineare dei parametri a sinistra e uno scalare a destra del
segno di uguale (una costante o, volendo, il nome di una variabile scalare).

Nel caso della singola equazione, i parametri sono indicati con la sintassi
b[i], dove i rappresenta la posizione nella lista dei regressori, a partire
da uno, oppure con b[variabile], dove variabile è il nome del regressore in
questione. Nel caso di sistemi, i parametri vengono indicati con la sintassi
b seguita da due numeri tra parentesi quadre. Il primo numero rappresenta la
posizione dell'equazione all'interno del sistema, mentre il secondo indica
la posizione nella lista dei regressori. Ad esempio b[2,1] indica il primo
parametro della seconda equazione, mentre b[3,2] il secondo parametro della
terza equazione. I termini b nell'equazione che rappresenta un vincolo
possono essere prefissati da un moltiplicatore numerico, usando il segno *
per indicare la moltiplicazione, ad esempio 3.5*b[4].

Ecco un esempio di un insieme di vincoli per un modello stimato in
precedenza:

	  restrict
	  b[1] = 0
	  b[2] - b[3] = 0
	  b[4] + 2*b[5] = 1
	  end restrict

Ed ecco un esempio di un insieme di vincoli da applicare a un sistema (se il
nome del sistema non contiene spazi, è possibile tralasciare le
virgolette).

	  restrict "Sistema 1"
	  b[1,1] = 0
	  b[1,2] - b[2,2] = 0
	  b[3,4] + 2*b[3,5] = 1
	  end restrict

Nel caso di una equazione singola le restrizioni sono valutate, per default,
tramite un test di Wald, che utilizza la matrice di covarianze del modello
in questione. Se il modello originale è stato stimato via OLS allora
vengono mostrati i coefficienti vincolati stimati, a meno che non si
utilizzi l'opzione --quiet all'inizio del comando restrict. Come alternativa
al test di Wald è possibile dare usare l'opzione --bootstrap affinchè
venga eseguito un test sulla restrizione attraverso tale metodo; ciò è
consentito solamente per modelli stimati attraverso OLS o WLS.

Nel caso di un sistema, la statistica test dipende dallo stimatore scelto:
un test del rapporto di verosimiglianza nel caso di un sistema stimato con
un metodo di massima verosimiglianza, o un test F asintotico negli altri
casi.

Esistono due alternative alla rappresentazione dei vincoli discussa sopra.
Una sfrutta la possibilità di esprimere g restrizioni lineari su un vettore
di kparametri, beta, atraverso l'espressione Rbeta - q = 0, dove R è una
matrice g x k e q è un vettore a g elementi. Le restrizioni possono essere
date usando i nomi di matrici predefinite e conformabili da usare come R e
q, come ad esempio in

	  restrict
	  R = Rmat
	  q = qvec
	  end restrict

Se si deve testare un vincolo non lineare (possibilità al momento prevista
solo per i modelli ad equazione singola) bisogna dare al vincolo in nome di
una funzione, preceduto da "rfunc = ", come ad esempio in

	  restrict
	  rfunc = myfunction
	  end restrict

La funzione vincolo deve avere, come unico argomento, una const matrix, che
verrà automaticamente riempita col vettore dei parametri. La funzione deve
ritornare un vettore zero sotto lipotesi nulla e non-zero altrimenti. La
lunghezza del vettore è il numero di vincoli. Questa funzione è usata come
"callback" dalla routine interna di calcolo dello jacobiano, che calcola un
test di Wald per mezzo del "delta method".

Quello che segue è un semplice esempio di funzione atta allo scopo di
testare una restrizione non-lineare, cioè che due coppie di parametri
stiano nello stesso rapporto fra loro.

	  function matrix restr (const matrix b)
	  matrix v = b[1]/b[2] - b[4]/b[5]
	  return v
	  end function

Se il comando restrict va a buon fine, gli accessori "$test" e "$pvalue"
restituiscono la statistica test ed il suo relativo p-value.

Quando si testano delle restrizioni su un modello ad equazione singola
stimato via OLS, o su una VECM, l'opzione --full può essere usata per
impostare le stime vincolate come "ultimo modello" di riferimento, allo
scopo di compiere ulteriori test o di utilizzare eventuali accessori del
tipo $coeff e vcv. Si noti che alcune considerazioni particolari
sopraggiungono nel caso in cui si testino delle restrizioni su modelli VECM.
Per maggiori dettagli si consiglia la lettura della guida all'uso di gretl
(il capitolo 33).

Accesso dal menù:    Modello, /Test/Vincoli lineari

# rmplot Graphs

Argomento:  nome-variabile
Opzioni:    --trim (si veda oltre)
            --quiet (non mostra l'output)
            --output=nomefile (si veda oltre)

Grafici range-mean: questo comando crea un semplice grafico che aiuta a
capire se una serie storica y(t) ha varianza costante o no. L'intero
campione t=1,...,T viene diviso in piccoli sotto-campioni di dimensione
arbitraria k. Il primo sotto-campione è formato da y(1), ... ,y(k), il
secondo da y(k+1), ... , y(2k), e così via. Per ogni sotto-campione,
vengono calcolati la media e il campo di variazione (range: il valore
massimo meno quello minimo) e viene costruito un grafico con le medie
sull'asse orizzontale e i campi di variazione su quello verticale, in modo
che ogni sotto-campione sia rappresentato da un punto sul piano. Se la
varianza della serie è costante, ci si aspetta che il campo di variazione
del sotto-campione sia indipendente dalla media del sotto-campione; se i
punti si dispongono su una linea crescente, la varianza della serie cresce
al crescere della media, viceversa se i punti si dispongono su una linea
decrescente.

Oltre al grafico, gretl mostra anche le medie e i campi di variazione per
ogni sotto-campione, insieme al coefficiente di pendenza della regressione
OLS del campo di variazione sulla media e il p-value per l'ipotesi nulla che
la pendenza sia zero. Se il coefficiente di pendenza è significativo al
livello del 10 per cento, viene mostrata sul grafico la linea stimata della
regressione del campo di variazione sulla media. La statistica t per
l'ipotesi nulla, e il corrispondente p-value, vengono registrati e possono
venire richiamati attraverso gli accessori "$test" e "$pvalue".

Se l'opzione --trim è presente il valore minimo ed il valore massimo di
ogni sotto-campione vengono scartati prima che la media ed il campo di
variazione siano calcolati. Questo rende ancor più marginale la presenza di
eventuali outlier che potrebbero distorcere i risultati dell'analisi.

Se l'opzione --quiet è data nessun grafico viene mostrato e nessun output
viene stampato; solamente la statistica t ed il corrispondente p-value
vengono registrati. Altrimenti il formato del grafico può venire
controllato attraverso l'opzione --output; quest'ultima funziona esattamente
come descritto nel comando "gnuplot".

Accesso dal menù:    /Variabile/Grafico range-mean

# run Programming

Argomento:  file-input

Esegue i comandi nel file-input e restituisce il controllo al prompt
interattivo. Questo comando si intende usato con il programma a riga di
comando gretlcli, o con il "terminale di gretl" nel programma con
interfaccia grafica.

Si veda anche "include".

Accesso dal menù:    Icona Esegui nella finestra comandi

# runs Tests

Argomento:  nome-variabile
Opzioni:    --difference (usa la differenza prima della variabile)
            --equal (i valori positivi e negativi sono equiprobabili)

Esegue il test non parametrico "delle successioni" per la casualità della
variabile specificata, dove le successioni sono definite come sequenze di
valori consecutivi positivi o negativi. Ad esempio, per testare la
casualità delle deviazioni dalla mediana per una variabile chiamata x1, con
una mediana diversa da zero, eseguire i comandi seguenti:

	  genr signx1 = x1 - median(x1)
	  runs signx1

Se si usa l'opzione --difference, la variabile viene differenziata prima
dell'analisi, quindi le successioni sono interpretabili come sequenze di
incrementi o decrementi consecutivi nel valore della variabile.

Se si usa l'opzione --equal, l'ipotesi nulla incorpora l'assunzione che i
valori positivi e negativi siano equiprobabili, altrimenti la statistica
test è invariante rispetto all'"equilibrio" del processo che genera la
sequenza, focalizzandosi solo sull'indipendenza.

Accesso dal menù:    /Strumenti/Test non parametrici

# scatters Graphs

Argomenti:  variabile-y ; lista-variabili-x  o lista-variabili-y ; variabile-x
Opzioni:    --with-lines (crea grafici lineari)
            --matrix=nome (mostra le colonne della matrice)
            --output=noemfile (manda l'output al file specificato)
Esempi:     scatters 1 ; 2 3 4 5
            scatters 1 2 3 4 5 6 ; 7
            scatters y1 y2 y3 ; x --with-lines

Produce grafici della variabile-y rispetto ad ognuna delle variabili nella
lista-variabili-x, oppure di tutte le variabili nella lista-variabili-y
rispetto alla variabile-x. Il primo esempio visto sopra assegna la variabile
1 all'asse y e produce quattro grafici, il primo con la variabile 2
sull'asse x, il secondo con la variabile 3 sull'asse x, e così via. Il
secondo esempio rappresenta ognuna delle variabili da 1 a 6 rispetto alla
variabile 7 sull'asse x. Questi gruppi di grafici sono utili nell'analisi
esplorativa dei dati. È possibile creare fino a sei grafici alla volta,
eventuali variabili in sovrappiù saranno ignorate.

Per impostazione predefinita vengono prodotti dei classici grafici a
dispersione, ma se si usa l'opzione --with-lines vengono mostrate anche le
linee di collegamento tra i punti del grafico.

Per una spiegazione dell'opzione --output, si veda il comando "gnuplot"
command.

Se la fonte dei dati è una matrice, le liste x e y devono contenere in
numeri di colonna; se non vengono dati, tuttle le colonne sono graficate
rispetto al tempo o ad una variabile indice.

Se il dataset è temporale, la seconda sotto-lista può essere omessa, nel
qual caso si intende che le serie saranno graficate rispetto al tempo in
sotto-grafici separati.

Accesso dal menù:    /Visualizza/Grafici multipli

# sdiff Transformations

Argomento:  lista-variabili

Calcola la differenza stagionale di ogni variabile della lista-variabili e
salva il risultato in una nuova variabile con il prefisso sd_. Il comando è
disponibile solo per serie storiche stagionali.

Accesso dal menù:    /Aggiungi/Differenze stagionali

# set Programming

Varianti:   set variabile valore
            set --to-file=filename
            set --from-file=filename
            set stopwatch
            set
Esempi:     set svd on
            set csv_delim tab
            set horizon 10
            set --to-file=mysettings.inp

L'uso più comune di questo comando è quello mostrato nella prima variante
qui sopra, dove viene fissato il valore di un certo parametro. Più avanti,
questo aspetto sarà analizzato in dettaglio. Gli altri usi sono: con
--from-file per leggere un file di script contenente certe impostazioni e
applicarle alla sessione corrente; con --stopwatch, per azzerare il
"cronometro" della CPU di gretl (si veda lo help per l'accessore
"$stopwatch"). Se il comando "set" è usato senza parametri, vengono
mostrate le impostazioni attuali per tutti i parametri rilevanti.

Il valore impostato rimane in vigore per la durata della sessione di gretl,
a meno di non essere modificato da un ulteriore esecuzione del comando
"set". I parametri che possono essere impostati in questo modo sono elencati
di seguito. Si noti che le impostazioni di hac_lag, hc_version e hac_kernel
sono usate quando viene data l'opzione --robust a un comando di stima.

Le impostazioni disponibili sono raggruppate in categorie: interazione col
programma, metodi numerici, generazione di numeri casuali, stima robusta,
filtri, stima di modelli per serie storiche e interazione con R.

Interazione con il programma

Queste impostazioni servono per controllare vari aspetti del modo in cui
gretl interagisce con l'utente.

  workdir: path. Stabilisce la directory di default per la lettura/scrittura
  dei file, ogni qual volta non si specifichino percorsi completi.

  use_cwd: on oppure off (il default). Regola l'inizializzazione automatica
  di workdir: se on, essa viene ereditata dalla shell, altrimenti viene
  fissata al valore che aveva nella sessione gretl precedente.

  echo: off o on (valore predefinito). Sopprime o ripristina l'indicazione
  dei comandi eseguiti nell'output dei risultati.

  messages: off o on (valore predefinito). Sopprime o ripristina
  l'indicazione dei messaggi informativi associati a vari comandi, ad
  esempio quando viene generata una nuova variabile o viene modificato
  l'intervallo del campione.

  verbose: off oppure on (valore predefinito). Funziona come "interruttore
  doppio" per echo e messages (vedi sopra), ponendoli ambedue accesi o
  spenti.

  warnings: off oppure on (valore predefinito). Sopprime o ripristina i
  messaggi cautelativi, emessi quando certe operazioni aritmetiche producono
  valori non finiti.

  csv_delim: comma (virgola, valore predefinito), space (spazio), o tab.
  Imposta il delimitatore di colonna usato nel salvataggio di dati su file
  in formato CSV.

  csv_write_na: la stringa usata per rappresentare i valori mancanti quando
  si esportano dati in formato CSV. Massimo 7 caratteri; il default è NA.

  csv_read_na: la stringa usata per rappresentare i valori mancanti quando
  si esportano dati in formato CSV. Massimo 7 caratteri; il default dipende
  se una colonna di dati contiene dati numerici (o per lo più tali) o
  stringa. Per dati numerici, i valori seguenti sono tutti sinomimi di "dato
  mancant": una cella vuota, or una qualunque delle stringhe NA, N.A., na,
  n.a., N/A, #N/A, NaN, .NaN, ., .., -999, and -9999. Per valori stringa, si
  conta come mancante una cella vuota o una contenente una stringa vuota.
  Questi valori di default possono essere reimpostati dando default come
  valore per csv_read_na. Per specificare che siano considerate mancanti
  solo celle vuote, va dato un valore di "". Si noti comunque che celle
  vuote vengono lette come valori mancanti indipendentemente da questo
  settaggio.

  csv_digits: un intero positivo contenente il numero di cifre significative
  da usare quando si salva in formato CSV. Di default, si usano fino a 15
  cifre (a seconda della precisione dei dati originali). Si noti che
  l'output in CSV usa la funzione fprintf della libreria C con la
  conversione "%g", il che implica che gli zeri in fondi non vengono
  stampati.

  display_digits: un intero da 3 a 6, specificante il numero di cifre
  significative da usare nell'output di coefficienti di regressione e
  corrispondenti errori standard (il default è 6). Questo settaggio è
  anche attivo sul numero di cifre usato dal comando "summary"; in questo
  caso, il default (che è anche il massimo) è 5, o 4 con l'opzione
  --simple.

  mwrite_g: on or off (the default). When writing a matrix to file as text,
  gretl by default uses scientific notation with 18-digit precision, hence
  ensuring that the stored values are a faithful representation of the
  numbers in memory. When writing primary data with no more than 6 digits of
  precision it may be preferable to use %g format for a more compact and
  human-readable file; you can make this switch via set mwrite_g on.

  force_decpoint: on o off (valore predefinito). Forza gretl a usare il
  carattere punto come separatore decimale, in un ambiente in cui il
  separatore standard è un altro carattere (tipicamente la virgola).

  loop_maxiter: un valore intero non negativo. Imposta il numero massimo di
  iterazioni consentite prima che un loop di tipo while si fermi (si veda
  "loop"). Si noti che questa impostazione riguarda solo la variante while,
  visto che lo scopo è quello di interrompere possibili cicli infiniti. Il
  valore speciale 0 viene usato per rendere tali cicli potenzialmente
  infiniti, visto che non viene fatto alcun controllo sul numero di
  iterazioni. Usare con cautela.

  max_verbose: on o off (valore predefinito). Attiva l'output aggiuntivo per
  la funzione BFGSmax (si veda la Guida all'uso per i dettagli).

  debug: 1, 2 o 0 (valore predefinito). Da usare per le funzioni definite
  dall'utente. Impostare debug a 1 equivale a impostare messages in tutte
  queste funzioni; impostando la variabile a 2 ha l'effetto aggiuntivo di
  impostare max_verbose in tutte le funzioni.

  shell_ok: on o off (valore predefinito). Abilita l'esecuzione di programmi
  esterni da gretl attraverso la shell di sistema. Per motivi di sicurezza,
  la funzione è disabilitata per impostazione predefinita; inoltre è
  possibile abilitarla solo tramite l'interfaccia grafica
  (Strumenti/Preferenze/Generali). Una volta abilitata, l'impostazione
  rimarrà attiva per le successive sessioni, fino a che non sarà
  disabilitata esplicitamente.

  bfgs_verbskip: un intero. Questo parametro regola l'effetto dell'opzione
  --verbose per quei comandi che usano BFGS come algoritmo di
  ottimizzazione, e serve a rendere l'output più compatto. Se bfgs_verbskip
  è, ad esempio, 3, allora l'opzione --verbose farà si che vengano
  stampate solo le iterazioni 3, 6, 9 e così via.

  skip_missing: on (il default) oppure off. Controlla ciò che gretl fa
  quando si costruisce una matrice da una o più serie: il default è di
  saltare le righe che contengono almeno un valore mancante, ma impostando
  questo parametro a off i valori mancanti vengono convertiti in NaNs.

  matrix_mask: il nome di una serie, o la parola null. Questo parametro
  permette di costruire matrici da serie con maggiore flessibilità rispetto
  a skip_missing: le righe che andranno nella matrice sono quelle per cui la
  serie specificata presenta valori validi non-zero. Questo settaggio resta
  in vigore finché non viene specificata una serie diversa, o rimosso
  usando la parola null.

  huge: un numero grande positivo (di default, 1.0E100). Questo settaggio
  controlla il valore ritornato dall'accessore "$huge".

  assert: off (default), warn oppure stop. Controlla cosa succede se la
  funzione "assert" fallisce, ossia ritorna 0.

  datacols: un intero da 1 a 15, con valore di default 5. Fissa il massimo
  numero di serie mostrate fianco a fianco quando i dati sono mostrati per
  osservazione.

  plot_collection: on, auto o off. Questo parametro determina il modo in cui
  i grafici sono mostrati durante l'uso interattivo. Quando è on, grafici
  della stessa dimensione (in termini di pixel) sono raggruppati in una
  "collezione", ossia una finestra unica nella quale si può scorrere avanti
  e indietro per visualizzare i diversi grafici. Quando è off, invece,
  verrà generata una finestra per grafico, come nelle versioni precedenti
  di gretl. Infine, il valore auto fa sì che la collezione venga abilitata
  solo per grafici che sono generati con un intervallo inferiore agli 1.25
  secondi l'uno dall'altro (ad esempio, quando il comando di generazione
  grafico fa parte di un loop).

Metodi numerici

Queste impostazioni vengono usate per controllare gli algoritmi numerici
usati da gretl per la stima.

  optimizer: auto (il default), BFGS oppure newton. Seleziona il metodo di
  ottimizzazione usato in vari stimatori ML, quando sono applicabili sia
  BFGS che Newton-Raphson. Il settaggio di default è di usare
  Newton-Raphson quando sia disponibile l'hessiana analitica, e se no BFGS.

  bhhh_maxiter: un intero. Imposta il massimo numero di iterazioni per la
  routine BHHH, che è usata dal comando "arma". Se non viene raggiunta la
  convergenza dopo bhhh_maxiter, il programma segnala un errore. Il valore
  predefinito è 500.

  bhhh_toler: un valore a virgola mobile, oppure la stringa default. Viene
  usato dalla routine BHHH di gretl per controllare se viene raggiunta la
  convergenza. L'algoritmo di calcolo ferma le iterazioni non appena
  l'incremento nella log-verosimiglianza tra le iterazioni è minore di
  bhhh_toler. Il valore predefinito è 1.0E-06; questo valore può essere
  reimpostato usando la stringa default invece di un valore numerico.

  bfgs_maxiter: un valore intero. Rappresenta il massimo numero di
  iterazioni per la routine BFGS di gretl, usata da "mle", "gmm" e altri
  stimatori. Se non si raggiunge la convergenza nel numero specificato di
  iterazioni, il programma produce un messaggio di errore. Il valore
  predefinito dipende dal contesto, ma tipicamente è nell'ordine delle 500
  iterazioni.

  bfgs_toler: un valore in virgola mobile, o la stringa default. Viene usato
  nella routine BFGS di gretl per controllare se si è raggiunta la
  convergenza. L'algoritmo si ferma appena l'incremento relativo nella
  funzione obiettivo tra un'iterazione e l'altra è minore di bfgs_toler. Il
  valore predefinito è pari alla precisione della macchina elevata alla
  potenza 3/4; questo valore può essere re-impostato usando la stringa
  default invece di un valore numerico.

  bfgs_maxgrad: one floating point value. This is used in gretl's BFGS
  routine to check if the norm of the gradient is reasonably close to zero
  when the bfgs_toler criterion is met. A warning is printed if the norm of
  the gradient exceeds 1; an error is flagged if the norm exceeds
  bfgs_maxgrad. At present the default is the permissive value of 5.0.

  bfgs_richardson: on or off (the default). Use Richardson extrapolation
  when computing numerical derivatives in the context of BFGS maximization.

  initvals: una matrice pre-specificata. Permette di inizializzare il
  vettore dei parametri per certi comandi che usano algoritmi di
  ottimizzazione numerica (arma, garch, logit e probit, tobit e intreg,
  biprobit, duration), nonché quando vengono imposte certe restrizioni
  associate ai VECM. A differenza di altri settaggi, initvals non è
  persistente: dopo, l'uso, viene automaticamente resettato. Per i dettagli
  legati alla stima di modelli ARMA, si veda la guida all'uso di gretl (il
  capitolo 31).

  lbfgs: on o off (valore predefinito). Usa la versione a memoria limitata
  di BFGS, al posto dell'algoritmo standard. Può essere vantaggioso quando
  la funzione da massimizzare non è globalmente concava.

  lbfgs_mem: un intero da 3 a 20 (il default è 8). Determina il numero di
  correzioni usate nella matrice di memoria limitata quando si usa il metodo
  L-BFGS-B.

  nls_toler: un valore in virgola mobile (il valore predefinito è pari alla
  precisione della macchina elevata alla potenza 3/4). Imposta la tolleranza
  usata per stabilire se è stata raggiunta la convergenza nelle procedure
  iterative di stima con i minimi quadrati non lineari usate dal comando
  "nls".

  svd: on o off (valore predefinito). Usa la decomposizione SVD invece di
  quella di Cholesky o della QR nel calcolo delle stime OLS. Questa opzione
  si applica alla funzione mols e a vari altri calcoli eseguiti
  internamente, ma non al comando "ols".

  force_qr: on or off (the default). This applies to the "ols" command. By
  default this command computes OLS estimates using Cholesky decomposition
  (the fastest method), with a fallback to QR if the data seem too
  ill-conditioned. You can use force_qr to skip the Cholesky step; in
  "doubtful" cases this may ensure greater accuracy.

  fcp: on o off (valore predefinito). Usa l'algoritmo di Fiorentini,
  Calzolari e Panattoni al posto del codice interno di gretl per calcolare
  le stime GARCH.

  gmm_maxiter: un intero, il numero massimo di iterazioni per il comando
  "gmm" con l'opzione --iterate. Il default è 250.

  nadarwat_trim: un intero, il parametro di taglio usato dalla funzione
  "nadarwat".

  fdjac_quality: un intero fra 0 e 2, corrsipondente all'algoritmo usato
  nella funzione "fdjac".

  quantile_type: una stringa ("Q6", "Q7" o "Q8"), corrispondente al metodo
  usato per calcolare i quantili campionari secondo la classificazione di
  Hyndman e Fan (1996). Il default è "Q6".

Generazione di numeri casuali

  seed: un intero senza segno. Imposta il seme per il generatore di numeri
  pseudo-casuali. Di solito il seme viene impostato a partire dall'ora di
  sistema, ma se si intende generare sequenze ripetibili di numeri casuali
  occorre impostare il seme manualmente.

Stima robusta

  bootrep: un intero. Imposta il numero di replicazioni per il comando
  "restrict" con l'opzione --bootstrap.

  garch_vcv: unset, hessian, im (matrice di informazione) , op (matrice dei
  prodotti esterni), qml (stimatore QML), bw (Bollerslev-Wooldridge).
  Specifica la variante da usare per stimare la matrice di covarianza dei
  coefficienti nei modelli GARCH. Se si usa unset (valore predefinito),
  viene usata l'Hessiana, a meno di usare l'opzione "robust" col comando
  garch, nel qual caso viene usato QML.

  arma_vcv: hessian (predefinito) o op (prodotto esterno). Specifica la
  variante da usare per calcolare la matrice di covarianza per i modelli
  ARIMA.

  force_hc: off (predefinito) o on. Lo stimatore HAC viene usato in modo
  predefinito con dati serie storiche e quando si usa l'opzione --robust di
  ols. Impostando invece force_hc a "on", si forza l'uso della matrice di
  covarianza coerente con l'eteroschedasticità (che non tiene conto
  dell'autocorrelazione). Si noti che i VAR costituiscono un caso
  particolare: con l'opzione --robust il metodo di default è lo HCCM, ma si
  può forzare l'uso di uno stimatore HAC con l'opzione --robust-hac.

  robust_z: off (the default) or on. This controls the distribution used
  when calculating p-values based on robust standard errors in the context
  of least-squares estimators. By default gretl uses the Student t
  distribution but if robust_z is turned on the normal distribution is used.

  hac_lag: nw1 (valore predefinito), nw2, nw3, o un intero. Imposta il
  massimo valore di ritardo, o la larghezza di banda, p, usato nel calcolo
  degli errori standard HAC (Heteroskedasticity and Autocorrelation
  Consistent) con l'approccio Newey-West, per le serie storiche. nw1 e nw2
  rappresentano due varianti di calcolo automatico basate sulla dimensione
  del campione, T: per nw1, p = 0.75 * T^(1/3), e per nw2, p = 4 *
  (T/100)^(2/9). nw3 permette di selezionare la larghezza di banda basandosi
  sui dati. Si veda anche qs_bandwidth e hac_prewhiten.

  hac_kernel: bartlett (valore predefinito), parzen, o qs (Quadratic
  Spectral). Imposta il kernel, o struttura di pesi, usato nel calcolo degli
  errori standard HAC.

  hac_prewhiten: on o off (valore predefinito). Usa le procedure di
  "prewhitening" e "re-coloring" di Andrews-Monahan nel calcolo degli errori
  standard HAC. Questo comporta anche la selezione della larghezza di banda
  basata sui dati.

  hc_version: 0 (valore predefinito), 1, 2, 3 o 3a. Imposta la variante da
  usare nel calcolo degli errori standard HAC (Heteroskedasticity and
  Autocorrelation Consistent) con dati di tipo cross section. Le prime 4
  opzioni corrispondono alle HC0, HC1, HC2 e HC3 discusse da Davidson e
  MacKinnon nel capitolo 5 di Econometric Theory and Methods. HC0 produce
  quelli che di solito vengono chiamati "errori standard di White". La
  variante 3a è la procedura "jackknife" di MacKinnon-White.

  pcse: off (impostazione predefinita) o on. Di solito, quando si stima un
  modello con pooled OLS su dati panel usando l'opzione --robust, viene
  usato lo stimatore di Arellano per la matrice di covarianza. Se si imposta
  pcse a "on", verranno usati i Panel Corrected Standard Errors (PCSE) di
  Beck e Katz, che non tengono conto dell'autocorrelazione.

  qs_bandwidth: larghezza di banda per la stima HAC nel caso in cui si
  scelga il kernel "Quadratic Spectral" (a differenza dei kernel Bartlett e
  Parzen, la larghezza di banda QS non deve essere necessariamente un
  intero).

Serie storiche

  horizon: un intero (il valore predefinito dipende dalla frequenza dei
  dati). Imposta l'orizzonte per le funzioni impulso-risposta e per la
  decomposizione della varianza nel contesto delle autoregressioni
  vettoriali.

  vecm_norm: phillips (valore predefinito), diag, first o none. Usato nel
  contesto della stima VECM, attraverso il comando "vecm" per identificare i
  vettori di cointegrazione. Si veda la Guida all'uso per i dettagli.

Interazione con R

  R_lib: on (the default) or off. When sending instructions to be executed
  by R, use the R shared library by preference to the R executable, if the
  library is available.

  R_functions: off (il default) oppure on. Riconosce funzioni di Rcome se
  fossero funzioni gretl (premettendo il prefisso "R."). Si veda la guida
  all'uso di gretl (il capitolo 44) per dettagli su questo punto e sul
  precedente.

Varie

  mpi_use_smt: on oppure off (default). Questo settaggio influisce sul
  numero di processi eseguiti in un blocco mpi presente in uno script. Se è
  off, il numero di processi di default è uguale al numero di core fisici
  sulla macchina locale; se invece è on, il default sarà dato dal numero
  massimo di thread, ossia il doppio dei core fisici se essi supportano lo
  standard SMT (Simultaneous MultiThreading, anche noto come
  Hyper-Threading). Il settaggio si applica solo al caso in cui l'utente non
  ha specificato il numero di processi, n modo diretto o indiretto,
  attraverso il file hosts.

  graph_theme: una stringa fra altpoints, classic, dark2 (il default
  attuale), ethan, iwanthue o sober. Imposta il "tema" ustao per i grafici
  prodotti da gretl. Con l'opzione classic si avrà il tema usato fino alla
  versione 2020b.

# setinfo Dataset

Argomento:  nome-variabile
Opzioni:    --description=stringa (imposta la descrizione)
            --graph-name=stringa (imposta il nome per i grafici)
            --discrete (marca la variabile come discreta)
            --continuous (marca la variabile come continua)
            --coded (mark come codifica)
            --numeric (marca come numerica)
            --midas (mark come componente di dati ad alta frequenza)
Esempi:     setinfo x1 --description "Descrizione di x1"
            setinfo y --graph-name="Nome nei grafici"
            setinfo z --discrete

Se sono usate le opzioni --description o --graph-name l'argomento deve
essere una serie singola. Altrimenti, può essere una lista, nel qual caso
il comando opera su ognuna delle variabile. Questo comando imposta fino a
quattro attributi, come segue.

Usando l'opzione --description seguita da una stringa tra virgolette doppie,
la stringa verrà usata come etichetta descrittiva per la variabile
indicata, che viene mostrata dal comando "labels" e anche nella finestra
principale del programma.

Usando l'opzione --graph-name seguita da una stringa tra virgolette doppie,
la stringa verrà usata nei grafici al posto del nome della variabile.

Usando una delle opzioni --discrete o --continuous, viene impostato il
carattere numerico della variabile. In modalità predefinita, tutte le
variabili sono considerate come continue; marcando una variabile come
discreta, essa viene trattata in modo speciale in certi comandi e funzioni,
come ad esempio "freq" o "dummify" .

Se viene data una fra le opzioni --coded o --numeric,lo stato della serie è
impostato di conseguenza. L'impostazione di default è di trattare tutti i
valori numerici come tali, per lo meno in un senso ordinale; se una
variabile viene impostata come coded, i valori numerici sono considerati una
codifica arbitraria di qualche caratteristica qualitativa.

L'opzione --midas imposta l'indicazione che una data serie contiene dati a
frequenza più alta di quella base del dataset; per esempio, il dataset è
trimestrale e la serie contiene valori per il mese 1, 2 o 3 del trimestre.
(MIDAS = Mixed Data Sampling.)

Accesso dal menù:    /Variabile/Modifica attributi
Accesso alternativo: Menù pop-up nella finestra principale

# setmiss Dataset

Argomenti:  valore [ lista-variabili ]
Esempi:     setmiss -1
            setmiss 100 x2

Imposta il programma in modo da interpretare un dato valore numerico (il
primo parametro indicato al comando) come codice per i "valori mancanti" nei
dati importati. Se questo valore è l'unico parametro fornito, come nel
primo degli esempi precedenti, l'interpretazione verrà applicata a tutte le
serie del dataset. Se "valore" è seguito da una lista di variabili,
indicate per nome o numero, l'interpretazione è limitata solo alle
variabili specificate. Così, nel secondo esempio, il valore 100 è
interpretato come codice per "mancante", ma solo per la variabile x2.

Accesso dal menù:    /Campione/Imposta codice valori mancanti

# setobs Dataset

Varianti:   setobs periodicità oss-iniziale
            setobs variabile-unità variabile-periodi
Opzioni:    --cross-section (interpreta come cross section)
            --time-series (interpreta come serie storiche)
            --special-time-series (vedi sotto)
            --stacked-cross-section (interpreta come panel)
            --stacked-time-series (interpreta come panel)
            --panel-vars (usa variabili indice (si veda oltre))
Esempi:     setobs 4 1990:1 --time-series
            setobs 12 1978:03
            setobs 1 1 --cross-section
            setobs 20 1:1 --stacked-time-series
            setobs unita anno --panel-vars

Forza il programma a interpretare il dataset in uso secondo la struttura
specificata.

Nella prima forma del comando, la periodicità, che deve essere un valore
intero, nel caso delle serie storiche rappresenta la frequenza delle
osservazioni (1 = annuale; 4 = trimestrale; 12 = mensile; 52 = settimanale;
5, 6, o 7 = giornaliera; 24 = oraria). Nel caso di dati panel, la
periodicità è il numero di righe per ogni blocco di dati, ossia il numero
di unità cross section se i dati sono organizzati come pila di dati cross
section, o il numero di periodi se i dati sono organizzati come pila di
serie storiche. Nel caso di semplici dati cross section, la periodicità
dev'essere impostata a 1.

L'osservazione iniziale rappresenta la data iniziale nel caso delle serie
storiche. Gli anni possono essere indicati con due o quattro cifre, mentre i
sotto-periodi (ad esempio i trimestri o i mesi) devono essere separati dagli
anni con un carattere "due punti". Nel caso di dati panel, l'osservazione
iniziale va indicata come 1:1, mentre nel caso di dati cross section come 1.
L'osservazione iniziale per i dati giornalieri o settimanali va indicata
nella forma AA/MM/GG o AAAA/MM/GG (oppure semplicemente 1 per i dati non
datati).

Alcune periodicità temporali hanno interpretazioni convenzionali; ad
esempio, 12 = mensile e 4 = trimestrale. Se questa interpretazione non si
applica alle vostre serie storiche,si può usare l'opzione
--special-time-series. In tal caso, gretl si asterrà dall'indicare come (ad
esempio) mensile una periodicità pari a 12.

Se non viene data alcuna opzione esplicita per indicare la struttura dei
dati, il programma tenterà di desumerla dalle informazioni in suo possesso.

La seconda forma del comando (che richiede l'uso dell'opzione --panel-vars)
può essere usata per imporre un'interpretazione panel dei dati, quando il
dataset contiene variabili che identificano in modo univoco le unità cross
section e i periodi. Il dataset verrà ordinato come pila di serie storiche,
per valori crescenti della variabile che rappresenta le unità,
variabile-unità.

Opzioni specifiche per dati panel

Le opzioni --panel-time e --panel-groups possono essere usate solo con
dataset già impostati come panel.

La funzione di --panel-time è di stabilire informazioni extra sulla
dimesnione temporale del panel. Essa deve essere indicata sul modello della
proma forma di setobs (vedi sopra). Ad esempio, il compando seguente indica
che la dimensione temporale del panel è trimestrale, e comincia nel primo
trimestre 1990.

  setobs 4 1990:1 --panel-time

La funzione di --panel-groups è di creare una serie con valori stringa
contentent i nomi delle unità longitudinal inel panel. (Quest'informazione
verrà, eventualmente, usata nei grafici.) Con quest'opzione vanno indicati
uno o due argomenti, come segue.

Caso uno: l'unico argomento è il nome di una serie a valori stringa. Se il
numero di stringhe diverse eguaglia il numero di unità nel panel, allora
questi vengono usati come nomi dei gruppi. Se necessario, il contenuto
numerico della serie sarà aggiustato per far sì che i valori siano tutti 1
per la prima unità, 2 per la seconda eccetera. Se il numero di valori
stringa non corrisponde a quello delle unità, il programma segnala un
errore.

Caso due: il primo argomento è il nome di una serie e il secondo è una
stringa (o il nome di una variabile stringa) con etichette per ciascuna
unità. Se la serie non esiste, verrà creata al momento. Nel secondo
argomento, i nomi delle unità vanno separati da spazi; se il nome stesso
include degli spazi, allora va racchiuso fra virgolette doppie. Se no, il
secondo argomento può essere un array di stringhe.

Ad esempio, il codice seguente creerò una serie di nome paese in cui i nomi
npaesi sono ripetuti ognuno T volte, dove T è l'ampiezza temporale del
panel.

  string npaesi = sprintf("Francia Germania Italia \"Regno Unito\"")
  setobs paese npaesi --panel-groups

Accesso dal menù:    Dati/Struttura dataset

# setopt Programming

Argomenti:  command [ action ] options
Esempi:     setopt mle --hessian
            setopt ols persist --quiet
            setopt ols clear

Questo comando abilita la preselezione di opzioni per un dato comando. Di
solito questo non è necessario, ma potrebbe essere utile per chi scrive
funzioni in hansl, quando certe opzioni devono essere rese condizionali a un
argomento fornito dal livello chiamante.

Ad esempio, se una funnzione prevede un argomento booleano "quiet", il cui
effetto è sopprimere la stampa dei risultati di una regressione eseguita
dentro la funzione, si può usare "setopt" come segue:

      if quiet
      setopt ols --quiet
      endif
      ols ...

L'opzione --quiet verrà applicata al comando ols seguente se e solo se la
variabile quiet è non-zero.

Di default, le opzioni specificate in questo modo si applicano solo alla
prima invocazione del comando a cui si riferiscono; non sono persistenti.
Tuttavia, usando persist come valore per action, le opzioni scelte saranno
attive fino a nuovo ordine. L'antidoto a persist è clear, che ha l'effetto
di cancellare tutte le opzioni stabilite in precedenza.

Si noti che le opzioni fissate con setopt si sommano a qualsiasi altra
opzione data al comando direttamente. Per esempio, si può dare l'opzione
--hessian a un comando mle incondizionatamente e allo stesso tempo usare
setopt per aggiungere --quiet condizionalmente.

# shell Utilities

Argomento:  comando-shell
Esempi:     ! ls -al
            ! notepad
            launch notepad

Un "!", o la parola chiave "launch", all'inizio di una riga di comando è
interpretato come passaggio all'interprete di comandi (shell) usato
dall'utente nel sistema operativo. In questo modo è possibile eseguire
comandi shell arbitrari dall'interno di gretl. Quando si usa "!", il comando
esterno viene eseguito in modalità sincrona, ossia gretl aspetta il termine
della sua esecuzione prima di procedere. Se invece si vuole avviare un altro
programma da dentro gretl senza aspettare che abbia completato la sua
esecuzione (modalità asincrona), occorre usare "launch".

Per motivi di sicurezza, questa funzionalità è disabilitata in modalità
predefinita. Per attivarla, occorre selezionare la casella "Abilita comandi
shell" nel menù File, Preferenze. In questo modo si renderanno disponibili
i comandi shell anche nella modalità a riga di comando di gretl (questo è
l'unico modo per farlo).

# smpl Dataset

Varianti:   smpl oss-iniziale oss-finale
            smpl +i -j
            smpl variabile-dummy --dummy
            smpl condizione --restrict
            smpl --no-missing [ lista-variabili ]
            smpl --no-all-missing [ lista-variabili ]
            smpl --contiguous [ lista-variabili ]
            smpl n --random
            smpl full
Opzioni:    --dummy (l'argomento è una variabile dummy)
            --restrict (applica una restrizione booleana)
            --replace (rimpiazza tutte le restrizioni booleane preesistenti)
            --no-missing (restringi il campione alle osservazioni valide)
            --no-all-missing (ometti le osservazioni vuote (vedi oltre))
            --contiguous (vedi oltre)
            --random (forma un sottocampione casuale)
            --permanent (vedi oltre)
            --balanced (dati panel: mantieni, ove possibile, un campione bilanciato)
Esempi:     smpl 3 10
            smpl 1960:2 1982:4
            smpl +1 -1
            smpl x > 3000 --restrict
            smpl y > 3000 --restrict --replace
            smpl 100 --random

Reimposta l'intervallo del campione. Il nuovo intervallo può essere
definito in vari modi. Nel primo modo (corrispondente ai primi due esempi
precedenti) oss-iniziale e oss-finale devono essere coerenti con la
periodicità dei dati. Una delle due può essere sostituita da un punto e
virgola per lasciare intatto il valore attuale. Nel secondo modo, gli interi
i e j (che possono essere positivi o negativi e vanno indicati con il segno)
sono presi come spostamenti relativi ai punti iniziale e finale del campione
in uso. Nel terzo modo, variabile-dummy deve essere una variabile
indicatrice che assume solo valori 0 o 1 e il campione verrà ristretto alle
osservazioni per cui la variabile dummy vale 1. Il quarto modo, che usa
--restrict, limita il campione alle osservazioni che soddisfano la
condizione Booleana specificata secondo la sintassi del comando "genr".

Le opzioni no-missing e no-all-missing possono essere usate per escludere
dal campione dati mancanti. La prima variante esclude le osservazioni in cui
almeno una variabile è mancante, mentre la seconda esclude solo le
osservazioni per cui tutte le variabili hanno valori validi (non mancanti).
In ambedue i casi, il test è limitato alle variabili in lista-variabili se
l'opzione ha un argomento; se no, viene applicato a tutte le serie nel
dataset; a parte che nel caso --no-all-missing senza un'esplicita
lista-variabili, le variaili generiche index e time vengono ignorate.

La forma --contiguous viene usata nei dataset di serie storiche. L'effetto
è quello di tagliare il campione all'inizio e alla fine finché vengano
trovate osservazioni con valori mancanti (per la lista specificata, o per
tutte le serie se lista-variabili non è specificata). Dopodiché viene
effettuato un controllo per vedere se nel sottocampione risultante rimangono
valori mancanti, nel qual caso, viene segnalato un errore.

Con la forma --random, viene estratto casualmente dal dataset il numero
indicato di osservazioni. Per essere in grado di replicare questa selezione,
occorre per prima cosa impostare il seme del generatore di numeri casuali
(si veda il comando "set").

La forma finale, smpl full, ripristina l'intervallo completo del campione.

Si noti che i vincoli sul campione di solito sono cumulativi: il valore di
riferimento di ogni comando smpl è il campione attuale, così che ogni
vincolo si aggiunge a quelli già impostati. Se si vuole che il comando
funzioni sostituendo i vincoli esistenti, occorre usare l'opzione --replace
alla fine del comando.

La variabile interna obs può essere usata con la forma --restrict di smpl
per escludere particolari osservazioni dal campione. Ad esempio,

	    smpl obs!=4 --restrict

scarterà la quarta osservazione. Se le osservazioni sono identificate da
etichette,

            smpl obs!="USA" --restrict

scarterà l'osservazione a cui è associata l'etichetta "USA".

Per le forme --dummy, --restrict e --no-missing di smpl, occore tenere
presente che tutte le informazioni "strutturali" contenute nel file dei dati
(a proposito della struttura di serie storiche o di panel dei dati) vengono
perse. È possibile reimpostare la struttura originale con il comando
"setobs". Un'opzione rilevante, per l'uso coi dati panel, è l'opzione
--balanced: quest'opzione serve a fare in modo che vengsa ricostituito un
campione bilanciato dopo il sottocampionamento, per mezzo dell'inserimento
di "righe mancanti" se necessario. Si noti, tuttavia, che non sempre è
possibile onorare questa richiesta.

Di default, le restrizioni sul campione attivo sono reversibili: col comando
smpl full si ritorna al dataset completo. Tuttavia, con l'opzione
--permanent il dataset ridotto rimpiazza quello originale. Quest'opzione è
disponibile per le opzioni --restrict, --dummy, --no-missing,
--no-all-missing o --random.

Si veda la guida all'uso di gretl (il capitolo 5) per ulteriori dettagli.

Accesso dal menù:    /Campione

# spearman Statistics

Argomenti:  x y
Opzione:    --verbose (mostra i dati ordinati)

Mostra il coefficiente di correlazione di rango di Spearman per le variabili
x e y. Le variabili non devono essere state ordinate manualmente in
precedenza, se ne occupa la funzione.

L'ordinamento automatico è dal massimo al minimo (ossia il valore massimo
nei dati assume il rango 1). Se occorre invertire l'ordinamento, creare una
variabile che è il negativo della variabile originale, ad esempio:

      genr altx = -x
      spearman altx y

Accesso dal menù:    /Modello/Stima robusta/SPEARMAN - Correlazione di rango

# sprintf Printing

Questo comando è obsoleto: al suo posto, usare la funzione "sprintf".

# square Transformations

Argomento:  lista-variabili
Opzione:    --cross (genera anche i prodotti incrociati, oltre ai quadrati)

Genera nuove variabili che sono i quadrati delle variabili nella
lista-variabili (con anche i prodotti incrociati, se si usa l'opzione
--cross). Ad esempio, "square x y" genera sq_x = x al quadrato, sq_y = y al
quadrato e (opzionalmente) x_y = x per y. Se una particolare variabile è
una dummy, non ne viene fatto il quadrato, visto che si otterrebbe la stessa
variabile.

Accesso dal menù:    /Aggiungi/Quadrati delle variabili selezionate

# stdize Transformations

Argomento:  varlist
Opzioni:    --no-df-corr (non effettua correzioni per gradi di libertà)
            --center-only (non divide per lo sqm)

Per impostazione predefinita, questo comando aggiunge al dataset come nuove
serie la versione standardizzata di quelle originali, col prefisso s_. Ad
esempio, "stdize x y" crea le nuove serie s_x e s_y, s_x ognuna delle quali
viene formata sottraendo la rispettiva media, dopodiché il risultato viene
diviso per il suo scarto quadratico medio (con una correzione per gradi di
libertà pari a 1).

Con l'opzione --no-df-corr non si ha la correzione per gradi di libertà, e
si usa il cosiddetto stimatore ML. Con l'opzione --center-only verranno
prodotte serie che sono soltanto centrate (la media viene sottratta ma i
dati non vengono scalati). In questo caso, il prefisso sarà c_ anziché s_.

La funzione "stdize" produce lo stesso risultato, ma la sua sintassi è un
po' più flessibile.

Accesso dal menù:    /Aggiungi/Standardizza le variabili selezionate

# store Dataset

Argomenti:  file-dati [ lista-variabili ]
Opzioni:    --omit-obs (si veda oltre, a proposito del formato CSV)
            --no-header (si veda oltre, a proposito del formato CSV)
            --gnu-octave (usa il formato GNU Octave)
            --gnu-R (usa il formato GNU R)
            --gzipped[=livello] (comprime con gzip)
            --jmulti (usa il formato ASCII di JMulti)
            --dat (usa il formato ASCII di PcGive)
            --decimal-comma (usa la virgola come separatore decimale)
            --database (usa il formato database di gretl)
            --overwrite (cfr oltre, a proposito del formato dei database)
            --comment=string (vedi sotto)
            --matrix=nome-matrice (vedi sotto)
            --compat (compatibilità gdtb, vedi sotto)

Salva i dati nel file filename. Per default, vengono salvate tutte le serie
attualmente definite, ma usando l'argomento opzionale varlist è possibile
salvarne solo una parte. Se il dataset è sottocampionato, verranno salvate
solo le osservazioni attualmente attive.

Il file di output verrà scritto nella directory corrispondente al valore
corrente di "workdir", a meno che il nome di file contenga un percorso
completo.

Il comando store funziona in modo speciale se è compreso in un "progressive
loop". Vedi la guida all'uso di gretl (il capitolo 13) per dettagli.

Formati nativi

Se file-dati ha estensione .gdt o .gtdb, il salvataggio avverrà in uno dei
formati nativi di gretl. Se non viene specificata alcuna estensione, si dà
.gdt come scelta implicita e il suffisso viene aggiunto automaticamente. Il
formato gdt è XML, con compressione gzip opzionale, mentre il formato gdtb
è binario. Il primo è la scelta tipica per dati di dimensione moderata
(fino a qualche centinaio di kilobyte); per dataset grandi, il formato
binario è molto più efficiente.

A partire dalla versione 2021a, il formato gdtb è stato modificato in modo
da velocizzare la lettura e scrittura di file molto grandi. Per salvare col
vecchio formato, così che il file sia leggibile con versioni precedenti di
gretl, si deve usare l'opzione --compat.

Quando si salva in formato nativo, l'opzione --gzipped abilita la
compressione, cosa che può essere utile per grandi dataset. Pewr questa
opzione, il parametro opzione controla il livello di compressione (da 0 a
9): livelli più alti producono file più piccoli, ma in tempi più lunghi.
Il valore di default è 1; col livello 0 non c'è alcuna compressione.

Altri formati

Il formato in cui i dati vengono salvati è controllato, in primo luogo
dall'estensione di filename, come segue:

  .csv: testo separato da virgole (CSV).

  .txt o .asc: testo separato da spazi.

  .m: formato GNU Octave.

  .dta: formato Stata (version 113).

Le opzioni di formato mostrate sopra possono essere usate per forzare un
certo formato indipendentemente dall'estensione data al file, o per generare
un file di formato PcGive o JMulTi

Le opzioni --omit-obs e --no-header sono applicabile solo quando si salvano
dati in formato CSV. In modalità predefinita, se i dati sono serie storiche
o panel, o se il dataset include marcatori per osservazioni specifiche, il
file CSV comprende una prima colonna che identifica le osservazioni (ad
esempio per data). Se si usa --omit-obs, questa colonna verrà omessa e
verranno salvati solo i dati effettivi. L'opzione --no-header fa sì che
venga omessa la stampa dei nomi di variabile in cima al file.

L'opzione --decimal-comma è anch'essa specifica al salvgataggio in formato
CSV, e fa sì che venga usata la virgola come separatore decimale e il punto
e virgola come separatore di campo.

Salvataggio in formato database

L'opzione di salvataggio in formato database di gretl è indicata se occorre
costruire dei grandi dataset di serie, magari con frequenze diverse e
diversi intervalli di osservazioni. Al momento questa opzione è disponibile
solo per dati annuali, trimestrali o mensili. Salvando su un file che esiste
già, il comportamento predefinito è quello di accodare le nuove serie al
contenuto del database preesistente. In questo contesto, se una o più delle
variabili da salvare hanno lo stesso nome di una delle variabili già
presenti nel database si otterrà un messaggio di errore. L'opzione
--overwrite permette invece di sovrascrivere eventuali variabili del dataset
che hanno lo stesso nome delle nuove variabili, in modo che queste ultime
rimpiazzino le variabili preesistenti.

L'opzione --comment è disponibile quando si salva come database o come CSV.
Il parametro richiesto consta du una linea, racchiusa da virgolette doppie,
passata all'opzone dopo un segno di uguale. Tale stringa verrà inserita
come commento nel file indice del database o all'inizio del file CSV.

Salvare una matrice come dataset

L'opzione --matrix richiede, come parametro, il nome di una matrice non
vuota. L'effetto del comando store sarà quello di trasformare la matrice in
un dataset "dietro le quinte" e salvarlo su file come tale. Le colonne della
matrice diventano serie, e i loro nomi sono dati dai nomi di colonn, se
presenti; altrimenti, saranno dati da v1, v2 e così via. Se la matrice ha
nomi di riga, questi verranno convertiti in "etichette di osservazione".

Si noti che la funzione "mwrite" permette di salvare su file matrici in
quanto tali, ma a volte può essere più utile salvarle come dataset.

Accesso dal menù:    /File/Salva dati; /File/Esporta dati

# summary Statistics

Varianti:   summary [ lista ]
            summary --matrix=nomematrice
Opzioni:    --simple (solo statistiche di base)
            --weight=wvar (variabile peso)
            --by=byvar (vedi sotto)
Esempi:     frontier.inp

Nella prima forma, mostra le statistiche descrittive per le variabili nella
lista-variabili, o per tutte le variabili nel dataset, se non si indica una
lista-variabili. L'output comprende media, scarto quadratico medio,
coefficiente di variazione (= scarto quadratico medio / media), mediana,
minimo, massimo, coefficiente di asimmetria, curtosi in eccesso. Dando
l'opzione --simple, si avranno soltanto media, minimo, massimo e scarto
quadratico medio.

L'opzione --by (dove il parametro byvar dev'essere il nome di una variabile
discreta), provoca la stampa delle statistiche per sottocampioni definiti
dai diversi valori di byvar. Ad esempio, se byvar è una variabile binaria
(dummy), verranno riportate separatamente le statistiche relative ai
sottocampioni definitia dai due casi byvar = 0 e byvar = 1. Nota: al
momento, questa opzione è incompatibile con l'altra opzione --weight.

Se si usa la forma alternativa in cui il parametro è una matrice, allora le
statistiche descrittive sono calcolate per le colonne della matrice.
L'opzione --by non è disponibile per questo caso.

La tavola prodotta dal comando summary è disponibile sotto forma di matrice
con l'accessore "$result".

Accesso dal menù:    /Visualizza/Statistiche descrittive
Accesso alternativo: Menù pop-up nella finestra principale

# system Estimation

Varianti:   system method=stimatore
            nome-sistema <- system
Esempi:     "Klein Model 1" <- system
            system method=sur
            system method=3sls
            Vedi anche klein.inp, kmenta.inp, greene14_2.inp

Inizia un sistema di equazioni. Esistono due versioni del comando, a seconda
che si voglia salvare il sistema per poterlo stimare in più modi diversi,
oppure stimare il sistema una volta sola.

Per salvare il sistema occorre dargli un nome, come nel primo esempio
proposto (se il nome contiene spazi, occorre racchiuderlo tra virgolette).
In questo caso, è possibile stimare il sistema con il comando "estimate".
Una volta che il sistema è stato salvato, è possibile imporre dei vincoli
su di esso (compresi vincoli incrociati tra equazioni) usando il comando
"restrict".

In alternativa, è possibile indicare uno stimatore per il sistema usando
method= seguito da una stringa che identifica uno degli stimatori
supportati: "ols" (ordinary least squares - minimi quadrati ordinari),
"tsls" (two-stage least squares - minimi quadrati a due stadi), "sur"
(seemingly unrelated regressions - regressioni apparentemente non
collegate), "3sls" (three-stage least squares - minimi quadrati a tre
stadi), "fiml" (full information maximum likelihood - massima
verosimiglianza con informazione completa) o "liml" (limited information
maximum likelihood - massima verosimiglianza con informazione limitata). In
questo caso, il sistema viene stimato appena completata la sua definizione.

Un sistema di equazioni termina con la riga "end system". All'interno del
sistema possono essere definiti i quattro tipi di istruzioni seguenti.

  "equation": specifica un'equazione del sistema. Occorre indicarne almeno
  due.

  "instr": per i sistemi da stimare con i minimi quadrati a tre stadi,
  indica la lista degli strumenti (indicati dal nome o dal numero della
  variabile). In alternativa, è possibile fornire questa informazione nella
  riga "equation" usando la stessa sintassi accettata dal comando "tsls".

  "endog": per i sistemi di equazioni simultanee, indica la lista delle
  variabili endogene. È indicato principalmente per la stima FIML, ma può
  essere usato anche nella stima minimi quadrati a tre stadi al posto
  dell'istruzione "instr": in questo modo tutte le variabili non
  identificate come endogene verranno usate come strumenti.

  "identity": per la stima FIML, un'identità che collega due o più
  variabili del sistema. Questo tipo di istruzione è ignorata se viene
  usato uno stimatore diverso da FIML.

Dopo la stima eseguita con i comandi "system" o "estimate" è possibile
recuperare informazioni aggiuntive dalle seguenti variabili accessorie:

  "$uhat": la matrice dei residui, una colonna per equazione.

  "$yhat": la matrice dei valori stimati, una colonna per equazione.

  "$coeff": il vettore colonna dei coefficienti (tutti i coefficienti della
  prima equazione, seguiti da quelli della seconda equazione, e così via).

  "$vcv": la matrice di covarianza dei coefficienti. Se il vettore "$coeff"
  ha k elementi, questa matrice ha dimensione k per k.

  "$sigma": la matrice di covarianza dei residui incrociata tra equazioni.

  "$sysGamma", "$sysA" e "$sysB": matrici dei coefficienti in forma
  strutturale (si veda oltre).

Se si vuole salvare i residui o i valori stimati per una specifica equazione
come serie di dati, basta selezionare la colonna dalla matrice "$uhat" o
"$yhat" e assegnarla a una serie, come in

	series uh1 = $uhat[,1]

Le matrici in forma strutturale corrispondono alla seguente rappresentazione
di un modello ad equazioni simultanee:

  Gamma y(t) = A y(t-1) + B x(t) + e(t)

Se ci sono n variabili endogene e k variabili esogene, Gamma è una matrice
n x n e B è n x k. Se il sistema non contiene ritardi delle variabili
endogene, la matrice A non è presente. Se il massimo ritardo di un
regressore endogeno è p, la matrice A è n x np.

Accesso dal menù:    /Modello/Equazioni simultanee

# tabprint Printing

Opzioni:    --format="f1|f2|f3|f4" (Specifica un formato personalizzato)
            --output=filename (invia l'output al file specificato)

Va eseguito dopo la stima di un modello. Stampa il modello stimato sotto
forma di tabella, in formato LaTeX o in formato RTF o CSV, se viene usata
l'opzione corrispondente. Se viene specificato un nome di file dopo
l'opzione --output, l'output viene scritto nel file, altrimenti viene
scritto in un file col nome model_N.tex (o model_N.rtf), dove N è il numero
dei modelli stimati finora nella sessione in corso.

Il file di output verrà scritto nella directory corrispondente al valore
corrente di "workdir", a meno che il nome di file contenga un percorso
completo.

Selezionando il formato CSV, i valori sono separati da virgole, a meno che
il delimitatore decimale non sia esso stesso la virgola, nel qual caso viene
usato il punto e virgola. Si noti che l'output in CSV potrebbe essere meno
completo degli altri formati.

Le opzioni illustrate di seguito sono disponibili solo per il formato LaTeX.

Usando l'opzione --complete, il file LaTeX è un documento completo, pronto
per essere processato; altrimenti il file va incluso in un documento.

Se si intende modificare lo stile del formato tabulare, è possibile
specificare un formato personalizzato usando l'opzione --format, seguita da
una stringa di formato. La stringa di formato va inclusa tra virgolette
doppie e deve essere unita all'opzione con un segno di uguale. La
composizione della stringa di formato è la seguente: ci sono quattro campi,
che rappresentano il coefficiente, l'errore standard, il rapporto t e il
p-value. Questi campi vanno separati usando barre verticali e possono
contenere una specificazione di formato per valori numerici nello stile
della funzione printf, oppure possono essere lasciati in bianco, in modo da
sopprimere la visualizzazione del campo nella rispettiva colonna dela
tabella (con l'unico vincolo che non è possibile lasciare in bianco tutti i
campi). Ecco alcuni esempi:

      --format="%.4f|%.4f|%.4f|%.4f"
      --format="%.4f|%.4f|%.3f|"
      --format="%.5f|%.4f||%.4f"
      --format="%.8g|%.8g||%.4f"

La prima specificazione stampa i valori di tutte le colonne usando 4 cifre
decimali. La seconda sopprime il p-value e mostra il rapporto t con 3 cifre
decimali. La terza omette il rapporto t, mentre l'ultima omette il rapporto
t e mostra sia il coefficiente che l'errore standard con 8 cifre
significative.

Una volta che si imposta un formato in questo modo, esso viene ricordato e
usato per tutta la sessione di lavoro. Per tornare ad usare il formato
predefinito, basta usare la parola chiave --format=default.

Accesso dal menù:    Finestra del modello, /LaTeX

# textplot Graphs

Argomento:  lista-variabili
Opzioni:    --time-series (disegna per osservazione)
            --one-scale (forza l'uso di un'unica scala)
            --tall (usa 40 linee)

Grafica ASCII nuda e cruda. Senza l'opzione --time-series, varlist deve
contenere almeno due serie, l'ultima delle quali va sull'asse delle ascisse,
e verrà prodotto un diagramma a dispersione. In questo caso, si può usare
l'opzione --tall per produrre un grafico in cui l'asse y è rappresentato da
40 righe di caratteri (il default è 20 righe).

Con l'opzione --time-series, viene prodotto un grafico per osservazione. In
questo caso, l'opzione --one-scale forza l'uso di una scala singola;
altrimenti, se varlist contiene più di una serie i dati potrebbero essere
riscalati. Ogni riga rappresenta un'osservazione, con i dati disegnati
orizzontalmente.

Vedi anche "gnuplot".

# tobit Estimation

Argomenti:  variabile-dipendente variabili-indipendenti
Opzioni:    --llimit=lval (specifica il limite sinistro)
            --rlimit=rval (specifica il limite destro)
            --vcv (mostra la matrice di covarianza)
            --robust (standard error robusti)
            --opg (vedi sotto)
            --cluster=clustvar (vedi "logit" per una spiegazione)
            --verbose (mostra i dettagli delle iterazioni)

Stima un modello Tobit. Il modello può essere appropriato quando la
variabile dipendente è "censurata". Ad esempio, vengono osservati valori
positivi o nulli della spesa dei consumatori per beni durevoli, ma non
valori negativi; tuttavia le decisioni di spesa possono essere pensate come
derivanti da una propensione al consumo, sottostante e non osservata, che
può anche essere negativa in alcuni casi.

Si assume, di default, che la variabile dipendente si censurata a 0 sulla
sinistra e non censurata a destra. Tuttavia, usando le opzioni --llimit e
--rlimit si può specificare uno schema di censura diverso. Se si specifica
soltanto un limite destro, si assume che la variabile dipendente sia non
limitata a sinistra.

Il modello Tobit è un caso particolare della regressione ad intervallo. Si
veda la documentazione del comando "intreg" per una descrizione delle
opzioni --robust e --opg.

Accesso dal menù:    /Modello/Modelli non lineari/Tobit

# tsls Estimation

Argomenti:  variabile-dipendente variabili-indipendenti ; strumenti
Opzioni:    --no-tests (omette i test diagnostici)
            --vcv (mostra la matrice di covarianza)
            --quiet (non stampare i risultati)
            --no-df-corr (omette la correzione per gradi di libertà)
            --robust (errori standard robusti)
            --cluster=clustvar (standard error clusterizzati)
            --liml (usa massima verosimiglianza a informazione limitata)
            --gmm (usa il metodo generalizzato dei momenti)
Esempi:     tsls y1 0 y2 y3 x1 x2 ; 0 x1 x2 x3 x4 x5 x6
            Vedi anche penngrow.inp

Calcola le stime con variabili strumentali, per impostazione predefinita
usando i minimi quadrati a due stadi (TSLS), ma è possibile scegliere altre
opzioni. Occorre specificare la variabile-dipendente, la lista di
variabili-indipendenti (che si intende includere alcuni regressori
endogeni), e infine gli strumenti, la lista completa delle variabili esogene
e predeterminate. Se la lista degli strumenti non è lunga almeno quanto
quella delle variabili-indipendenti, il modello non è identificato.

Nell'esempio precedente, le y sono le variabili endogene e le x sono le
variabili esogene e predeterminate. Si noti che eventuali regressori esogeni
devono essere inclusi in entrambe le liste.

L'output delle stime TSLS comprende il test di Hausman e, se il modello è
sovra-identificato, il test di Sargan per la sovra-identificazione. Nel test
di Hausman, l'ipotesi nulla è che le stime OLS siano consistenti, o in
altre parole che non sia richiesta la stima per mezzo di variabili
strumentali. Un modello di questo tipo è sovra-identificato se ci sono più
strumenti di quelli strettamente necessari. Il test di Sargan è basato su
una regressione ausiliaria dei residui del modello minimi quadrati a due
stadi sull'intera lista degli strumenti. L'ipotesi nulla è che tutti gli
strumenti siano validi, cosa di cui si dovrebbe dubitare se la regressione
ausiliaria ha un significativo potere esplicativo. Davidson e MacKinnon
(2004) al capitolo 8 forniscono un'eccellente spiegazione di entrambi i
test.

Per gli stimatori TSLS e LIML, viene mostrata una statistica aggiuntiva se
il modello è stimato senza l'opzione --robust, che riguarda la presenza di
strumenti deboli. Con sttrumenti deboli, possono esserci seri problemi
inferenziali: stime distorte e/o livelli di significatività sbagliati per
le statistiche test basate sulla matrice di covarianze, con tassi di rifiuto
ben più grandi del livello di significatività nominale (Stock, Wright and
Yogo, 2002). La statistica è la F di primo stadio se il modello contiene un
solo regressore endogeno, o il più piccolo autovalore della matrice
corrispondente in caso contrario. Quando disponibili, sono mostrati i valori
critici derivati dall'analisi di Monte Carlo contenuta in Stock e Yogo
(2003).

Il valore R-quadro mostrato i modelli stimati con i minimi quadrati a due
stadi è il quadrato della correlazione tra la variabile dipendente e i
valori stimati.

Per dettagli sull'effetto delle opzioni --robust e --cluster si veda la
documentazione per il comando "ols".

In alternativa al metodo TSLS, il modello può essere stimato usando la
massima verosimiglianza a informazione limitata (opzione --liml) o il metodo
generalizzato dei momenti (opzione --gmm). Si noti che se il modello è
esattamente identificato, questi metodi dovrebbero produrre gli stessi
risultati del metodo TSLS, ma se il modello è sovraidentificato, i
risultati saranno in genere diversi.

Se si usa la stima GMM, è possibile usare le seguenti opzioni aggiuntive:

  --two-step: esegue la stima GMM in due passi, invece che in un passo solo.

  --iterate: itera il GMM fino alla convergenza.

  --weights=Pesi: specifica una matrice quadrata di pesi da usare nel
  calcolo della funzione criterio del GMM. La dimensione di questa matrice
  deve essere pari al numero di strumenti. L'impostazione predefinita
  consiste nell'usare una matrice identità di dimensione opportuna.

Accesso dal menù:    /Modello/TSLS - Minimi quadrati a due stadi

# var Estimation

Argomenti:  ordine lista-variabili [ ; lista-esogene ]
Opzioni:    --nc (non include una costante)
            --trend (include un trend)
            --seasonals (include variabili dummy stagionali)
            --robust (errori standard robusti)
            --robust-hac (errori standard HAC)
            --quiet (omette l'output delle singole equazioni)
            --silent (non stampa nulla)
            --impulse-responses (mostra le risposte di impulse)
            --variance-decomp (mostra scomposizioni della varianza)
            --lagselect (mostra i criteri di informazione per la selezione dei ritardi)
            --minlag=ritardo minimo (solo per la selezione dei ritardi, vedi sotto)
Esempi:     var 4 x1 x2 x3 ; time mydum
            var 4 x1 x2 x3 --seasonals
            var 12 x1 x2 x3 --lagselect
            Vedi anche sw_ch14.inp

Imposta e stima (usando OLS) un'autoregressione vettoriale (VAR). Il primo
argomento specifica l'ordine di ritardo (o il massimo ordine di ritardi se
è stata usata l'opzione --lagselect). L'ordine può essere indicato
numericamente o con il nome di una variabile scalare preesistente. Quindi
segue l'impostazione della prima equazione. Non occorre includere i ritardi
tra gli elementi della lista-variabili: verranno aggiunti automaticamente.
Il punto e virgola separa le variabili stocastiche, per cui verrà incluso
un numero di ritardi pari a ordine, dai termini deterministici o esogeni
presenti nella lista-esogene. Si noti che viene inclusa automaticamente una
costante, a meno che non si usi l'opzione --nc; inoltre è possibile
aggiungere un trend con l'opzione --trend e variabili dummy stagionali con
l'opzione --seasonals.

Benché normalmente un VAR comprenda tutti i ritardi da 1 a un dato ordine,
è possibile selezionare un set di ritardi specifico. Per farlo, occorre
sostituire l'argomento scalare order col nome di un vettore predefinito o
con una lista di ritardi separati da virgole, racchiusi da parentesi graffe.
Qui di seguito, mostriamo due modi per specificare un VAR contenente i
ritardi 1, 2 e 4 (ma non il 3):

	var {1,2,4} ylist
	matrix p = {1,2,4}
	var p ylist

Viene stampata una regressione separata per ognuna delle variabili nella
lista-variabili. Il risultato di ogni equazione include i test F per i
vincoli di uguaglianza a zero su tutti i ritardi delle variabili, un test F
per la significatività del ritardo massimo e, se è stata usata l'opzione
--impulse-responses, la scomposizione della varianza della previsione e le
funzioni di impulso-risposta.

Le scomposizioni della varianza della previsione e le funzioni di risposta
di impulso sono basate sulla decomposizione di Cholesky della matrice di
covarianza contemporanea, e in questo contesto l'ordine in cui vengono date
le variabili stocastiche conta. La prima variabile nella lista viene
considerata come la "più esogena" all'interno del periodo. L'orizzonte per
le decomposizioni della varianza e le funzioni di impulso-risposta può
essere impostato usando il comando "set". Per salvare una specifica risposta
di impulso sotto forma di matrice, si veda la funzione "irf".

Con l'opzione --robust gli errori standard sono corretti per
l'eteroschedsasticità. In alternativa, l'opzione --robust-hac produce
errori standard HAC, cioè robusti tanto all'eteroschedasticità che
all'autocorrelazione. In generale, la seconda opzione non dovrebbe essere
necessaria se il modello include abbastanza ritardi.

Se si usa l'opzione --lagselect, il primo parametro del comando var viene
interpretato come il massimo ordine di ritardo. In questo caso, il comando
produce una tabella che mostra i valori dei criteri di informazione di
Akaike (AIC), Schwartz (BIC) e Hannan-Quinn (HQC) calcolati per VAR
dall'ordine 1 fino all'ordine massimo indicato. Questa opzione viene usata
per scegliere l'ordine del VAR più appropriato, e l'output consueto del VAR
non viene mostrato. La tavola coi criteri di informazione è recuperabile
sotto forma di matrice tramite l'accessore "$test". In questo contesto,
l'opzione --minlag serve a stabilire l'ordine minimo. Usando il valore 0 si
ammette la possibilità che il ritardo ottimale sia nullo, e che in realtà
il modello non sia affatto un VAR. Al contrario, se si dà per scontato che
l'ordine minimo sia 4, con --minlag=4 si risparmia qualche millisecondo.

Accesso dal menù:    /Modello/Serie storiche/VAR - Autoregressione vettoriale

# varlist Dataset

Opzione:    --type=nometipo (tipo di oggetto mostrato)

Di default, mostra un elenco delle variabili disponibili nel dataset. "list"
e "ls" sono sinonimi.

L'opzione --type deve essere seguita dal segno di uguale e da una delle
seguenti parole chiave: series, scalar, matrix, list, string, bundle or
accessor. L'effetto è di stampare i nomi di tutti gli oggetti di quel certo
tipo attualmente definiti.

Un caso particolare è dato quando il tipo è accessor: in questo caso,
verrà stampato l'elenco delle variabili interne di tipo "accessore", come
ad esempio "$nobs" e "$uhat" (indipendentemente dal tipo).

# vartest Tests

Argomenti:  var1 var2

Calcola la statistica F per l'ipotesi nulla che le varianze della
popolazione per le variabili var1 e var2 siano uguali e mostra il p-value.
La statistica test e il p-value sono disponibili tramite gli accessori
"$test" e "$pvalue". Il codice seguente

      	open AWM18.gdt
	vartest EEN EXR
	eval $test
	eval $pvalue

calcola il test e mostra come usare gli accessori:

	Equality of variances test

	EEN: Number of observations = 192
	EXR: Number of observations = 188
	Ratio of sample variances = 3.70707
	Null hypothesis: The two population variances are equal
	Test statistic: F(191,187) = 3.70707
	p-value (two-tailed) = 1.94866e-18

	3.7070716
	1.9486605e-18

Accesso dal menù:    /Modello/Modelli bivariati/Differenza delle varianze

# vecm Estimation

Argomenti:  ordine rango lista-y [ ; lista-x ] [ ; lista-rx ]
Opzioni:    --nc (senza costante)
            --rc (costante vincolata)
            --uc (costante non vincolata)
            --crt (costante e trend vincolato)
            --ct (costante e trend non vincolato)
            --seasonals (include dummy stagionali centrate)
            --quiet (omette l'output delle singole equazioni)
            --silent (non stampa nulla)
            --impulse-responses (mostra impulso-risposta)
            --variance-decomp (mostra decomposizioni della varianza delle previsioni)
Esempi:     vecm 4 1 Y1 Y2 Y3
            vecm 3 2 Y1 Y2 Y3 --rc
            vecm 3 2 Y1 Y2 Y3 ; X1 --rc
            Vedi anche denmark.inp, hamilton.inp

Un VECM è un tipo di autoregressione vettoriale, o VAR (si veda "var"),
applicabile quando le variabili del modello sono individualmente integrate
di ordine 1 (ossia, sono "random walk" con o senza deriva), ma esibiscono
cointegrazione. Questo comando è strettamente connesso al test di Johansen
per la cointegrazione (si veda "johansen").

Il parametro ordine rappresenta l'ordine di ritardo del sistema VAR. Il
numero di ritardi nel VECM (dove la variabile dipendente è data da una
differenza prima) è pari a ordine meno uno.

Il parametro rango rappresenta il rango di cointegrazione, o in altre parole
il numero di vettori di cointegrazione. Questo deve essere maggiore di zero
e minore o uguale (in genere minore) al numero di variabili endogene
contenute nella lista-y.

La lista-y rappresenta l'elenco delle variabili endogene, nei livelli.
L'inclusione di trend deterministici nel modello è controllata dalle
opzioni del comando. Se non si indica alcuna opzione, viene inclusa una
"costante non vincolata", che permette la presenza di un'intercetta diversa
da zero nelle relazioni di cointegrazione e di un trend nei livelli delle
variabili endogene. Nella letteratura originata dal lavoro di Johansen (si
veda ad esempio il suo libro del 1995), si fa riferimento a questo come al
"caso 3". Le prime quattro opzioni mostrate sopra, che sono mutualmente
esclusive, producono rispettivamente i casi 1, 2, 4 e 5. Il significato di
questi casi e i criteri per scegliere tra di essi sono spiegati nella guida
all'uso di gretl (il capitolo 33).

Le liste opzionali xlist e rxlist permottoni di specificare delle variabili
esogene che entrano nel modello senza vincoli (xlist) o solo nello spazio di
cointegrazione (rxlist). Queste liste sono separate da ylist e fra loro
tramite punto e virgola.

L'opzione --seasonals, che può accompagnare una qualsiasi delle altre
opzioni, specifica l'inclusione di un gruppo di variabili dummy stagionali
centrate. Questa opzione è disponibile solo per dati trimestrali o mensili.

Il primo degli esempi mostrati sopra specifica un VECM con ordine di ritardo
pari a 4 e un unico vettore di cointegrazione. Le variabili endogene sono
Y1, Y2 e Y3. Il secondo esempio usa le stesse variabili ma specifica un
ritardo di ordine 3 e due vettori di cointegrazione, oltre a specificare una
"costante vincolata", che è appropriata se i vettori di cointegrazione
possono avere un'intercetta diversa da zero, ma le variabili Y non hanno
trend.

Dopo la stima di un VECM sono disponibili alcuni accessori specializzati:
$jalpha, $jbeta e $jvbeta contengono, rispettivamente, le matrici α e beta
e la varianza stimata di beta. Per accedere a una specifica funzione di
risposta di impulso in forma matriciale, si veda la funzione "irf".

Accesso dal menù:    /Modello/Serie storiche/VECM

# vif Tests

Opzione:    --quiet (soppprime la stampa dei risultati)
Esempi:     longley.inp

Deve seguire la stima di un modello che includa almeno due variabili
indipendenti. Calcola e mostra i informazioni diagnostiche relative alla
collinearità

Il VIF per il regressore j è definito come

  1/(1 - Rj^2)

dove R_j è il coefficiente di correlazione multipla tra il regressore j e
gli altri regressori. Il fattore ha un valore minimo di 1.0 quando la
variabile in questione è ortogonale alle altre variabili indipendenti.
Neter, Wasserman, e Kutner (1990) suggeriscono di usare il VIF maggiore come
test diagnostico per la collinearità; un valore superiore a 10 è in genere
considerato indice di un grado di collinearità problematico.

Dopo l'esecusione di questo comando, l'accessore "$result" conterrà un
vetttore colonna con glil indici VIF. Per un approccio più sofisticato alla
diagnosi della collinearità, si vedia il comando "bkw".

Accesso dal menù:    Finestra del modello, /Test/collinearità

# wls Estimation

Argomenti:  variabile-pesi variabile-dipendente variabili-indipendenti
Opzioni:    --vcv (mostra la matrice di covarianza)
            --robust (errori standard robusti)
            --quiet (non mostra i risultati)
            --allow-zeros (vedi sotto)

Calcola stime con minimi quadrati ponderati (WLS - Weighted Least Squares),
prendendo i pesi da variabile-pesi. In pratica, detta w la radice quadrata
positiva della variabile-pesi, viene calcolata una regressione OLS di w *
variabile-dipendente rispetto a w * variabili-indipendenti. L'R-quadro,
comunque, è calcolato in un modo speciale, ossia come

  R^2 = 1 - ESS / WTSS

dove ESS è la somma dei quadrati degli residui dalla regressione ponderata,
mentre WTSS denota la "somma totale ponderata dei quadrati", che è pari
alla somma dei quadrati dei residui della regressione della variabile
dipendente ponderata sulla sola costante ponderata.

Nel caso particolare in cui variabile-pesi sia una variabile dummy, la stima
WLS equivale a una stima OLS in cui tutte le osservazioni per cui essa vale
zero sono eliminate. In tutti gli altri casi, la presenza di zeri nella
variabile di ponderazione è considerata un errore, ma se per qualche motivo
si desidera ponderare per una variabile che contenga degli zeri, si può
disattivare tale errore usando l'opzione --allow-zeros.

Per la stima con minimi quadrati ponderati in un contesto panel, in cui i
pesi sono basati sulle varianze delle unità longitudinali, si veda il
comando "panel" con l'opzione --unit-weights option.

Accesso dal menù:    /Modello/Altri modelli lineari/WLS - Minimi quadrati ponderati

# xcorrgm Statistics

Argomenti:  var1 var2 [ maxlag ]
Opzioni:    --plot=mode-or-filename (vedi sotto)
            --quiet (non produrre il grafico)
Esempio:    xcorrgm x y 12

Mostra il correlogramma incrociato per le variabili var1 e var2, che possono
essere specificate per nome o per numero. I valori sono i coefficienti di
correlazione campionari tra il valore presente di var1 e i valori ritardati
e anticipati di var2.

Se si indica un valore maxlag, la lunghezza del correlogramma è limitata al
numero di ritardi e anticipi indicati, altrimenti è determinata
automaticamente in funzione della frequenza dei dati e del numero di
osservazioni.

Di default, viene prodotto un grafico del correlogramma incrociato: un
grafico gnuplot in modo interattivo o un grafico ASCII in modalità batch.
Questo comportamento può essere aggiustato con l'opzione --plot. Per essa,
i valori accettabili dei parametri sono none (pr sopprimere il grafico);
ascii (per produrre un grafico testuale anche se in modo interattivo);
display (per produrre un grafico gnuplot anche se in modo batch), o il nome
di un file. L'effetto di quest'ultima scelta è identico a quello descritto
sotto l'opzione --output del comando "gnuplot".

Accesso dal menù:    /Visualizza/Correlogramma
Accesso alternativo: Menù pop-up nella finestra principale (selezione multipla)

# xtab Statistics

Argomenti:  lista-y [ ; lista-x ]
Opzioni:    --row (mostra le percentuali per riga)
            --column (mostra le percentuali per colonna)
            --zeros (mostra i valori pari a zero)
            --no-totals (elimina la stampa delle marginali)
            --matrix=matname (usa le frequenze da una matrice)
            --quiet (vedi il caso bivariato più sotto)
            --tex[=nomefile] (produce output LaTeX)
            --equal (vedi il caso LaTeX più sotto)
Esempi:     xtab 1 2
            xtab 1 ; 2 3 4
            xtab --matrix=A
            xtab 1 2 --tex="xtab.tex"

Mostra la tabella di contingenza, o la tabulazione incrociata, tra ogni
combinazione delle variabili della lista-y; se si indica anche una seconda
lista, lista-x, ogni variabile della lista-y viene tabulata (per riga)
rispetto ad ogni variabile della lista-x (per colonna). Le variabili in
queste liste possono essere referenziate per nome o per numero, e devono
essere state marcate come discrete. Alternativamente, con l'opzione
--matrix, la matrice specificata verrà trattata come un insieme di
frequenze già calcolate e il comando si limiterà a stamparla col formato
appropriato (vedi anche la funzione "mxtab"). In questo caso, gli argomenti
di tipo lista vanno omessi.

Per impostazione predefinita le celle indicano la frequenza assoluta. Le
opzioni --row e --column (che sono mutualmente esclusive) sostituiscono la
frequenza assoluta con le frequenze in percentuale relativamente a ciascuna
riga o colonna. Le celle con valore di frequenza nullo sono lasciate vuote,
a meno che non venga usata l'opzione --zeros, che mostra esplicitamente i
valori pari a zero; questa opzione può essere comoda se occorre importare
la tabella in un altro programma, come un foglio di calcolo.

Il test chi quadro di Pearson per l'indipendenza viene mostrato se la
frequenza attesa nell'ipotesi di indipendenza è pari almeno a 1.0e-7 per
tutte le celle. Una regola approssimativa usata spesso nel giudicare la
validità di questa statistica richiede che la frequenza attesa sia
superiore a 5 per almeno l'80 per cento delle celle; se questa condizione
non viene soddisfatta viene mostrato un messaggio di avvertimento.

Se la tabella di contingenza è 2 x 2, viene calcolato il test esatto di
Fisher per l'indipendenza. Si noti che questo test si basa sull'ipotesi che
i totali per riga e colonna siano fissi; questo può essere appropriato o
meno a seconda di come sono stati generati i dati. Il p-value sinistro va
usato nel caso in cui l'ipotesi alternativa a quella di indipendenza sia
quella dell'associazione negativa (ossia i valori tendono ad accumularsi
nelle celle che non appartengono alla diagonale della tabella), mentre il
p-value destro va usato nell'ipotesi alternativa di associazione positiva.
Il p-value a due code di questo test è calcolato seguendo il metodo (b)
descritto in Agresti (1992), (capitolo 2.1): esso è la somma delle
probabilità di tutte le possibili tabelle che hanno i totali per riga e per
colonna pari a quelli della tabella data e che hanno una probabilità minore
o uguale a quella della tabella data.

Il caso bivariato

Nel caso base di una semplice tabella a doppia entrata si possono usare gli
accessori "$test" e "$pvalue" per il test chi-quadro di Pearson ed il
p-value corrispondente, a patto che sia rispettata la condizione sul valore
atteso minimo. In questo contesto, l'opzione --quiet fa sì che la tavola
non venga stampata.

LaTeX output

Dando l'opzione --tex, la tabella a doppia entrata viene stampata sotto
forma di un ambiente tabular di LaTeX. L'output verrà prodotto direttamente
(così da poterlo copincollare) o, se viene specificato il parametro
nomefile, nel file corrispondente. (Se nomefile non contiene un percorso
completo, il file sarà scritto nella locazione "workdir" attuale). la
statistica test non viene calcolata. L'opzione addizionale --equal viene
usata per far sì che venganp stampati in grassetto gli elementi della
tabella per cui le variabili riga e colonna hanno lo stesso valore numerico.
Quest'opzione è ignorata a se non è presente anche l'opzione --tex o
quando una delle due variabili sia di tipo stringa.

Salvare la tavola come matrice

Quando l'argomento del comando è dato da una sola lista, la tavola di
contingenza può essere salvata come matrice attraverso l'accessore
"$result".