MIA NIPOTE - UN CAPITOLO DELLA SUA TESI - ECONOMETRIA - ROBA ANCHE BANCARIA -. MA MIA NIPOTE NON STA IN BANCA - FA IL LAVORO CHE LE PIACE - SENZA RACCOMANDAZIONE ALCUNA - E' UNA TAVERNA PERDINCI!
CAPITOLO 2
(Laura Taverna)
IL MODELLO A CORREZIONE DELL’ERRORE
2.1. I MODELLI ADL
Poiché i dati economici sono il risultato di processi di scelta dinamici da parte dei singoli agenti economici, i cui comportamenti e le cui aspettative individuali determinano, a livello aggregato, le fluttuazioni dinamiche dell’intero sistema economico, il tempo rappresenta una dimensione necessaria nell’analisi econometrica. Pertanto, l’esigenza di giungere ad una migliore comprensione del funzionamento del sistema economico, in relazione alle ipotesi di teoria economica che lo caratterizzano (ciò rende interessante differenziare il comportamento di breve periodo dal comportamento di lungo periodo) e la necessità di poter disporre di un modello che abbia caratteristiche idonee a produrre buone previsioni legittimano la specificazione dinamica dei modelli econometrici.
Caratteristica preminente del modello dinamico è che la variabile dipendente è funzione di un insieme di variabili esplicative osservate in periodi diversi di tempo, producendo relazioni non solo istantanee tra variabili, ma anche differite nel tempo.
Nell’analisi econometrica l’esplicitazione della dinamica avviene o attraverso l’operatore ritardo oppure mediante l’introduzione di polinomi nell’operatore ritardo. L’operatore ritardo, solitamente indicato con L (dall’inglese Lag), è una funzione che permette di traslare nel tempo un processo stocastico. Tale operatore associa a la variabile ritardata . Applicando l’operatore L, ad una variabile, un numero k di volte, la variabile viene traslata di k periodi, cioè .
I polinomi nell’operatore ritardo L, indicati con a(L), sono definiti dall’espressione . I ritardi polinomiali del tipo a(L) vengono utilizzati molto spesso in econometria, principalmente per la scrittura compatta di due tipi di modelli:
• i modelli autoregressivi di ordine m, indicati sinteticamente con AR(m), che sono del tipo:
a(L) , con ~N(0, )
e si caratterizzano per il fatto che la variabile y evolve in funzione della propria storia passata.
• i modelli a ritardi distribuiti finiti di ordine m:
in cui si suppone, anche qui, distribuito normalmente con media 0 e varianza .
In questa seconda categoria di modelli la y dipende invece dai valori presenti e passati di altre variabili.
Una classe più ampia di modelli che raggruppa le due tipologie anzidette è rappresentata dai modelli di tipo autoregressivo e a ritardi distribuiti, rispettivamente di ordine m ed n, che vengono indicati con ADL(m,n) (dall’inglese Autoregressive–Distributed Lag) e che sono genericamente espressi dall’equazione:
con ~N(0, )
in cui è la componente autoregressiva, mentre la componente cosiddetta di «ritardo distribuito» è rappresentata da e . Facendo ricorso all’operatore ritardo, il modello ADL(m,n) può scriversi in modo compatto nella forma:
.
Il modello ADL(m,n) presenta delle proprietà importanti:
1. è “stabile” se le radici dell’equazione (indicate con λ) sono superiori all’unità in valore assoluto, ossia ;
2. presenta “fattori comuni” se alcune delle radici del polinomio a(L) sono uguali alla radici del polinomio b(L).
Questa categoria di modelli gode inoltre di importanti proprietà di lungo periodo, che rendono i modelli stessi estremamente interessanti poiché consentono di creare, anche per tale via, un collegamento tra la specificazione econometrica e la teoria economica (spesso la teoria economica è abbastanza esplicita sul comportamento di lungo periodo, fino al punto che in talune circostanze test sulla teoria economica possono essere condotti direttamente sulle proprietà di lungo periodo della stessa).
Un caso semplicistico, ma denso di elementi indispensabili per gli studi economici, dei modelli ADL si ha sotto la condizione , ossia quando esiste un solo ritardo per ogni variabile. Il modello ADL(1,1), generalmente, si scrive:
.
Questo modello, è un caso particolare della classe, già di per sé ristretta, dei modelli lineari dinamici di una singola equazione. Tuttavia i modelli ADL(1,1) sono molto utilizzati nelle analisi empiriche perché godono di una caratteristica importante: ogni tipo di modello di singola equazione in econometria è un caso particolare di ADL(1,1).
Hendry sostiene, infatti, una modellizzazione estremamente interessante, detta «dal generale al particolare» che consiste nel porre delle restrizioni al modello generale per poter esprimere nel modo più congeniale il singolo problema economico avvalendosi di un modello semplificato rispetto a quello generale. I modelli ADL(1,1) godono di una particolare caratteristica che vale in qualsiasi caso di modellizzazione e non solo in quello dal generale al particolare: “se un membro di questa classe di modelli viene considerato come un modello che ha generato i dati osservati, ciò ha come conseguenza l’accettazione congiunta di ogni altro modello della classe meno ristretto rispetto a quello considerato, unitamente alle restrizioni necessarie a ricondurre il modello generale a quello particolare prescelto” .
2.2. IL MODELLO CON IL MECCANISMO A CORREZIONE DELL’ERRORE
Il modello dinamico generale del tipo ADL(1,1) può essere riparametrizzato in modo da essere espresso in una forma che si è rilevata di particolare interesse sia per la performance empirica che per le sue proprietà teoriche.
Dato il modello ADL(1,1) espresso nella forma tipica:
dove ~N(0, ) e con in cui si assume che l’errore sia normalmente distribuito con media 0 e varianza , sottraendo ad entrambi i membri , l’espressione anzidetta viene così trasformata:
e aggiungendo e sottraendo a destra di quest’ultima la quantità l’espressione viene ulteriormente modificata in tal senso:
.
Ponendo , , e ordinando opportunamente i termini si perviene all’espressione:
(1)
che rappresenta la forma tipica secondo cui si presenta un modello con meccanismo a correzione dell’errore (in cui, qualora per semplicità, si ometta il termine noto lasciando invariato il significato del modello rimanga invariato).
La peculiarità dei modelli con MCE consiste nel fatto che essi permettono di combinare una certa flessibilità nella specificazione dinamica, con proprietà interessanti nel comportamento di lungo periodo; sostanzialmente il modello con MCE consente di catturare la dinamica del sistema e, contemporaneamente, di incorporare le proprietà di equilibrio suggerite dalla teoria economica. Nella formula (1) l’aggiustamento alle variazioni della z avviene in modo proporzionale in base al coefficiente , pertanto il parametro viene detto “coefficiente d’impatto” o “risposta proporzionale” ed esprime la relazione di breve periodo, ossia le variazioni della y in seguito alle variazioni della variabile esplicativa z. Il modello espresso in questa forma incorpora, inoltre, l’equilibrium-correction mechanism, (indicato con ECM), che esprime le deviazioni dall’equilibrio statico e misura l’errore commesso dagli agenti nel periodo precedente; alla luce di tale disequilibrio gli agenti correggono o rivedono le loro decisioni su y, apportando l’opportuna variazione in questa variabile. Infine, il parametro c rappresenta il “coefficiente di lungo periodo” che riflette appunto l’andamento di lungo periodo della serie.
I modelli con MCE presentano svariati vantaggi. Un primo vantaggio di ordine pratico si riscontra nella fase di stima e di inferenza: le variabili (cioè la variazione del periodo corrente) e (cioè la deviazione dell’ultimo periodo dall’equilibrio) non presentano, in genere, un grado di correlazione elevato e quindi i parametri e possono essere stimati con i metodi di stima consueti senza incorrere nel problema della multicollinearità. Inoltre, poiché i modelli ADL(1,1) e i modelli con MCE sono isomorfi, le proprietà di cui godono gli ADL(1,1) valgono anche per i modelli con MCE; infatti, imponendo opportune restrizioni, in adesione alla logica di modellizzazione dal generale al particolare, anche dal modello con MCE si può pervenire a dei modelli estremamente interessanti per gli studi economici (quali: il modello ad aggiustamento parziale, il modello con restrizione a fattor comune; modello nei tassi di crescita).
Un modello ECM gode di tre ulteriori vantaggi che lo rendono un modello di base per la ricerca empirica:
• suggerisce dei collegamenti con la teoria di serie storiche cointegrate;
• può essere interpretato come una regola di controllo o servomeccanismo;
• ha sperimentato successi empirici nei modelli di serie storiche.
Una critica spesso avanzata, dagli analisti delle serie storiche, alla formulazione classica di un modello econometrico ha riguardato la caratteristica della stazionarietà delle variabili utilizzate. Effettivamente, sono molto frequenti i casi di serie storiche caratterizzate da andamenti crescenti o decrescenti al variare del tempo (trend), tali serie sono dette “non stazionarie nei livelli”. La proprietà di stazionarietà permette di considerare il processo omogeneo rispetto al tempo. In letteratura esistono due diverse nozioni di stazionarietà: la stazionarietà forte e quella debole.
La stazionarietà in senso forte fa riferimento a tutta la distribuzione del processo e implica che la distribuzione di probabilità del processo sia invariante rispetto a traslazioni dell’asse dei tempi. La stazionarietà in senso debole invece fa riferimento solo ai momenti primi (valore atteso) e secondi (varianza). La stazionarietà in senso debole si verifica qualora il valore atteso e la varianza siano finite e indipendenti dal tempo, mentre la covarianza dipende esclusivamente dal ritardo.
Si vuole soffermare l’attenzione sul concetto di integrazione. “Una variabile si dice «integrata di ordine d», in simboli ~I(d), se, dopo aver applicato d volte l’operatore differenza , essa può essere rappresentata per mezzo di un processo ARMA stazionario, invertibile e non deterministico” . Da tale definizione discende che una variabile integrata di ordine 0, I(0), è stazionaria nei livelli, mentre una serie integrata di ordine 1 è stazionaria nella differenza prima. Le principali differenze tra i processi integrati di ordine zero e quelli integrati di primo ordine sono stati introdotti da Engle e Granger. In particolar modo essi sostengono che una serie I(0): ha una varianza indipendente dal tempo; ha una memoria riguardo al suo passato che è limitata nel tempo, con la conseguenza che gli effetti derivanti dall’introduzione di un’innovazione sono transitori; le osservazioni tendono a fluttuare intorno alla media; le autocorrelazioni tra osservazioni successive decrescono rapidamente all’aumentare della distanza considerata tra le osservazioni. In una serie I(1), invece: la varianza dipende dal tempo e tende ad aumentare indefinitamente quando t tende ad infinito; il processo ha memoria pressoché infinita e quindi l’innovazione finirà per influire in modo permanente sul processo; presenta un andamento erratico e ad oscillazione ampia; le autocorrelazioni tra osservazioni successive tendono all’unità a prescindere dalla distanza considerata tra le osservazioni.
Alcune critiche sono state mosse ai modelli econometrici costruiti su variabili non rese preventivamente stazionarie e che presentano quindi il pericolo di regressione spuria . Tali critiche sono scaturite da considerazioni di natura prettamente statistica, in quanto l’inferenza effettuata sulla base di variabili non stazionarie, risente in modo negativo della caratteristica di non stazionarietà. Tale problema scaturisce innanzitutto dal fatto che l’utilizzo tale e quale delle variabili impedisce, in larga misura, l’applicazione dell’usuale teoria asintotica all’analisi delle proprietà degli stimatori dei minimi quadrati delle osservazioni non converge al momento secondo della variabile. Inoltre le usuali statistiche utilizzate per la verifica di determinate ipotesi, quali la significatività dei parametri e possibili restrizioni su questi, non possiedono le distribuzioni che correntemente vengono utilizzate per il calcolo dei valori critici dei test. In particolare, le distribuzioni dei test di tipo t di Student e di tipo F divergono all’aumentare della numerosità campionaria e, quindi, non esistono valori critici dei test asintoticamente corretti.
Tali motivazioni inducono a costruire modelli utilizzando le variabili opportunamente trasformate in modo da renderle stazionarie. Esistono svariati metodi per eliminare il trend. Gli effetti del tempo possono essere eliminati eseguendo una regressione rispetto al tempo e calcolando i residui tra la serie iniziale e quella successiva.
Un’altra soluzione più semplice per detrendizzare una serie consiste nel passaggio dai livelli di una generica serie temporale alle rispettive differenze prime; questa metodologia apporta l’effetto basilare di cancellare completamente la componente di trend con l’ onere di perdere una sola osservazione ( passando da T a T-1 dati). Ovviamente anche una serie integrata di ordine d può essere detrendizzata applicando d volte l’operatore , perdendo le informazioni fornite da d osservazioni.
Eppure i modelli basati solo su variabili espresse in differenze prime non soddisfano generalmente le relazioni di lungo periodo indicate dalla teoria economica, e quindi non danno alcuna informazione su queste (semplicemente perché non ne contengono).
Il modello con MCE vanta una caratteristica di rilevante importanza: permette di tener conto delle critiche poc’anzi evidenziate e, nello stesso tempo, di non perdere le informazioni sulle relazioni di lungo periodo fornite dalla teoria economica.
Dato il modello con MCE nella sua forma generale, se si considera noto il parametro c e se le variabili , e sono stazionarie è possibile operare una stima del modello stesso con il metodo dei minimi quadrati ordinari. Se è legittimo supporre che y e z siano entrambe di ordine uno e quindi le differenze sono stazionarie , occorre effettuare qualche precisazione per quanto riguarda il grado di integrazione della variabile .
Generalmente, combinazioni lineari di variabili non stazionarie producono variabili a loro volta non stazionarie, ma talvolta si verifica la condizione di cointegrazione, ossia è possibile che esista una particolare combinazione lineare delle variabili tale da far elidere tra loro i movimenti di lungo periodo della y e della z, divenendo essa stessa stazionaria. La cointegrazione consiste quindi nel far abbassare il grado di integrazione delle serie originarie. Più tecnicamente, si può evocare la definizione fornita da Engle e Granger secondo cui: “le componenti del vettore sono dette cointegrate di ordine d e b, in simboli ~CI(d,b), se:
• le variabili e , che compongono , sono entrambi I(d)
• esiste un vettore tale che la combinazione è I(d-b) con .”
In cui il vettore φ è detto «vettore di cointegrazione».
Il teorema afferma inoltre che se le componenti del vettore sono cointegrate di ordine e , allora il processo generatore dei dati (DGP) della serie è esprimibile nella forma con MCE, cioè:
dove , costituisce il vettore di cointegrazione, d(L) è un polinomio di ordine finito nell’operatore ritardo, e sono congiuntamente white noise e che implica che se le variabili sono cointegrate la deve apparire almeno in una equazione. Ossia nel caso di un modello con due sole variabili il vettore di cointegrazione se esiste è unico perché il numero massimo di vettori di cointegrazione tra n serie è n-1. È bene inoltre precisare che una singola equazione può essere sufficiente per catturare la dinamica di breve periodo attorno all’unica relazione di equilibrio tra due variabili non stazionarie; in tale contesto gli unici problemi che si pongono sono problemi di stima relativi al metodo di individuazione della relazione di lungo periodo.
Affinché le variabili siano cointegrate è necessario che tutte le componenti del vettore abbiano proprietà di lungo periodo tra loro compatibili, ossia le variabili che presentano andamenti tendenziali diversi non possono essere cointegrate.
Una particolarità degli stimatori di serie cointegrate è la cosiddetta «superconsistenza». Date le variabili y e z, entrambe integrate di ordine 1 e per le quali vale la relazione di lungo periodo , se y è cointegrata con z la convergenza in probabilità dello stimatore verso il valore vero di c è più rapida di quanto avviene nel caso di regressione standard tra variabili I(0). A tale risultato si perviene se la variabile y dipende solo dalla variabile z.
La connessione esistente tra la teoria della cointegrazione e il modello dinamico con MCE si manifesta attraverso la relazione ~I(0) ed è formalizzata nel teorema di «rappresentazione» di Granger. Il quale afferma proprio che, se le componenti del vettore , supposto per semplicità composto da due soli componenti, [ ]’ sono cointegrate di ordine e , allora il processo generatore dei dati è esprimibile nella forma con MCE.
Nella specificazione e nella stima del modello bisogna prestare particolare attenzione a determinati fattori: non è possibile includere liberamente in una regressione statica variabili che presentano un diverso ordine di integrazione (cioè caratterizzate da non stazionarietà di tipo diverso); nell’introdurre ritardi nella specificazione dinamica questi devono riguardare tutte le variabili che figurano nella regressione statica e non escluderne a priori alcune.
2.3. I TEST DI STAZIONARIETÁ E DI COINTEGRAZIONE
Condizioni necessarie per l’applicabilità del modello con meccanismo a correzione dell’errore sono quindi che le serie e siano integrate di ordine 1 (da cui discende la condizione di stazionarietà delle loro differenze prime) e che le stesse siano cointegrate di ordine 1.
La stazionarietà di una serie può essere analizzata osservando il trend sottostante la serie stessa. Sia dato il modello:
(1) con ~N(0, )
dove la variabile t indica il tempo. Esso incorpora due diversi tipi di trend alla cui rimozione si può procedere seguendo metodologie diverse.
Ponendo e , il modello appena esposto viene denominato, in letteratura, random walk o «processo stazionario nelle differenze» ed è caratterizzato dalla presenza di un trend stocastico. Infatti, sotto tali condizioni il trend può essere rimosso con l’uso dell’operatore differenza .
Se, invece, si suppone e il modello riproduce un processo «stazionario nel trend», cioè un modello con trend deterministico; in quanto sotto tali valori parametrici il trend viene spiegato dalla componente deterministica δt. In tal caso si suppone che i movimenti di lungo periodo della serie seguano una evoluzione di tipo deterministico e che i movimenti di breve periodo siano essenzialmente spiegati da un modello autoregressivo stazionario.
Data la divergenza del trend a seconda dei valori assunti dai parametri del modello, cui seguono effetti completamenti diversi, i risultati empirici del modello devono essere interpretati con estrema cautela.
Alla luce di quanto appena detto è legittimo supporre che l’accettazione dell’ipotesi nulla e δ=0 è consistente con l’ipotesi di un modello stazionario nelle differenze, mentre rimane ambiguo il caso in cui si rifiuti tale ipotesi nulla. Dickey e Fuller hanno dimostrato che se viene usato un test F per sottoporre a verifica , i valori critici a cui fare riferimento non sono quelli delle tavole standard della F, ma dei valori significativamente diversi.
Eppure in un modello AR(1) del tipo:
(2) con ~N(0, )
la condizione di stazionarietà si verifica quando .
Pertanto è possibile utilizzare un test per sottoporre a verifica la condizione di non stazionarietà , contro l’ipotesi alternativa di stazionarietà . Quando si è sotto l’ipotesi alternativa la stima del parametro può essere ottenuta, come di consueto, mediante lo stimatore dei minimi quadrati ordinari, la cui distribuzione è approssimativamente normale e la statistica-test utilizzata è:
~ .
Quando, invece, la distribuzione della statistica t non è più la t di student con (n-k) gradi di libertà. La verifica della stazionarietà avviene, quindi, mediante un test sulle radici unitarie.
Sfruttando la proprietà di invarianza del metodo OLS a trasformazioni lineari il modello AR(1), come sopra tipizzato, può essere equivalentemente espresso nella forma:
(3) .
Un test per sottoporre a verifica può continuare ad essere basato sul rapporto-t, ma la distribuzione campionaria di tale statistica, sotto non è più la t di Student, ma una distribuzione non standard. Di conseguenza i valori critici della distribuzione t di Student non possono essere utilizzati per definire la regione critica di tale test. Lo studio di tale problematica congiuntamente alla necessità di avvalersi di metodologie adeguate per la verifica della presenza di radici unitarie nelle serie storiche ha indotto la letteratura ad effettuare svariati studi in merito, fra i quali risultano molto interessanti quelli effettuati da Dickey, che ha tabulato la distribuzione della statistica data dal rapporto-t in presenza di radici unitarie, e da Fuller. Qualora si faccia ricorso a tale tabulazione il test viene indicato con τ e viene definito test di Dickey e Fuller (DF) . La distribuzione τ è una distribuzione non standard, fortemente asimmetrica a sinistra e per la quale la distribuzione normale costituisce un’approssimazione molto scadente. I valori critici del test si trovano in corrispondenza di valori negativi significativamente inferiori a meno 2.
Sulla base della regressione (3) è possibile ottenere uno stimatore per , , che permette di sottoporre a verifica l’ipotesi di stazionarietà di e la statistica-test, in questo caso, viene così modificata:
.
A fianco a questi test, gli stessi studiosi hanno introdotto un’altra classe di test, ADF, che possono essere utilizzati in quanto colmano determinate problematiche cui si incorre quando ci si avvale dei test DF. In primo luogo, è bene considerare che qualora si voglia sottoporre a verifica la condizione di stazionarietà di un processo AR di ordine superiore al primo (bisogna cioè sottoporre a verifica la presenza di radice unitaria in un processo AR di ordine superiore al primo) ci si avvale di un test Dickey-Fuller aumentato, ADF (dall’inglese Augmented Dickey Fuller). Infatti, se si suppone di avere un modello del tipo AR(2) nella forma:
che può essere riparametrizzato come: , in cui e , affinchè sia verificata la condizione di stazionarietà è necessario che sia che siano inferiori all’unità in valore assoluto.
La procedura di test proposta da Dickey e Fuller è invariante per trasformazioni lineari o per riparametrizzazioni del modello, con la conseguenza che processi AR di ordine superiore possono facilmente essere utilizzati “aumentando” la regressione mediante l’introduzione di ritardi successivi della differenza prima della variabile dipendente. Infatti la presenza di una radice unitaria in un processo AR(p) corrisponde ad un valore nullo del coefficiente di , e, se la radice unitaria viene imposta, il modello diviene un AR(p-1) in Δ .
Un ulteriore motivo per “aumentare” il modello (3) consiste nel fatto che esso può facilmente produrre residui autocorrelati, con la conseguenza di non poter disporre di uno stimatore efficiente per il coefficiente α. Per evitare tale inconveniente Dickey e Fuller suggerirono di modificare il modello introducendo ritardi successivi della variabile dipendente in numero tale da ottenere residui che siano innovazioni. Si ha, allora:
.
È bene precisare che per tali test l’ipotesi nulla è che la serie sia non stazionaria, pertanto il risultato cui si dovrebbe giungere mediante l’impiego del test τ è di rifiutare l’ipotesi nulla in favore della stazionarietà.
I risultati teorici sviluppati nell’ambito della teoria della cointegrazione e la loro utilizzazione nell’ambito della modellizzazione di breve periodo fanno emergere due tipi di problemi strettamente connessi fra loro: il problema della verifica statistica dell’ipotesi di cointegrazione; la stima del vettore di cointegrazione.
I principali test di verifica della cointegrazione sono stati elaborati da Engle e Granger e da Sargan e Bhargava.
Engle e Granger proposero un test a due stadi. Nel primo stadio si effettua una stima del coefficiente di lungo periodo che può essere ottenuta semplicemente considerando lo stimatore OLS del coefficiente della regressione statica sulla relazione di lungo periodo , avendo verificato che e siano effettivamente cointegrate. Il secondo stadio consiste nella stima e nella modellazione dell’equazione di breve per in funzione di , di valori ritardati di entrambe tali variabili, di altre variabili stazionarie e di .
Sargan e Bhargava propongono invece di utilizzare il test DW per verificare l’ipotesi di cointegrazione. Dalla stima dell’equazione si ottengono i residui e si usa la relazione:
(4)
per sottoporre a verifica l’ipotesi che corrisponde all’ipotesi di assenza di cointegrazione tra le variabili y e z. Ricordando il risultato DW 2(1- ), valori bassi del test DW portano ad accettare l’ipotesi nulla di assenza di cointegrazione.
Un metodo alternativo per sottoporre a verifica l’ipotesi di cointegrazione consiste nell’applicare il test di stazionarietà ai residui ottenuti dalla regressione di cointegrazione (4). L’ipotesi nulla che si sottopone a verifica è quella di assenza di cointegrazione tra due variabili. Con i residui ottenuti dalla (4) si costruisce la regressione nel modello:
(5)
e si effettua il test τ sul coefficiente δ. Se i residui sono stazionari si accetta l’ipotesi di cointegrazione tra le variabili y e z, poiché la loro combinazione, espressa dalla (3), dà luogo a residui che sono stazionari, mentre ciascuna variabile considerata separatamente non lo era. Il rifiuto dell’ipotesi nulla porta ad una stima separata dei coefficienti di lungo periodo e di breve periodo. In altri termini la stima di c ottenuta dall’equazione di cointegrazione viene imposta in una seconda equazione in cui viene specificata la dinamica di breve periodo degli aggiustamenti di y alle modificazioni della variabile z.
La stima del vettore di cointegrazione può essere effettuata attraverso la procedura sopra esposta proposta da Engle e Granger che si articola in due stadi.
CAPITOLO 2
(Laura Taverna)
IL MODELLO A CORREZIONE DELL’ERRORE
2.1. I MODELLI ADL
Poiché i dati economici sono il risultato di processi di scelta dinamici da parte dei singoli agenti economici, i cui comportamenti e le cui aspettative individuali determinano, a livello aggregato, le fluttuazioni dinamiche dell’intero sistema economico, il tempo rappresenta una dimensione necessaria nell’analisi econometrica. Pertanto, l’esigenza di giungere ad una migliore comprensione del funzionamento del sistema economico, in relazione alle ipotesi di teoria economica che lo caratterizzano (ciò rende interessante differenziare il comportamento di breve periodo dal comportamento di lungo periodo) e la necessità di poter disporre di un modello che abbia caratteristiche idonee a produrre buone previsioni legittimano la specificazione dinamica dei modelli econometrici.
Caratteristica preminente del modello dinamico è che la variabile dipendente è funzione di un insieme di variabili esplicative osservate in periodi diversi di tempo, producendo relazioni non solo istantanee tra variabili, ma anche differite nel tempo.
Nell’analisi econometrica l’esplicitazione della dinamica avviene o attraverso l’operatore ritardo oppure mediante l’introduzione di polinomi nell’operatore ritardo. L’operatore ritardo, solitamente indicato con L (dall’inglese Lag), è una funzione che permette di traslare nel tempo un processo stocastico. Tale operatore associa a la variabile ritardata . Applicando l’operatore L, ad una variabile, un numero k di volte, la variabile viene traslata di k periodi, cioè .
I polinomi nell’operatore ritardo L, indicati con a(L), sono definiti dall’espressione . I ritardi polinomiali del tipo a(L) vengono utilizzati molto spesso in econometria, principalmente per la scrittura compatta di due tipi di modelli:
• i modelli autoregressivi di ordine m, indicati sinteticamente con AR(m), che sono del tipo:
a(L) , con ~N(0, )
e si caratterizzano per il fatto che la variabile y evolve in funzione della propria storia passata.
• i modelli a ritardi distribuiti finiti di ordine m:
in cui si suppone, anche qui, distribuito normalmente con media 0 e varianza .
In questa seconda categoria di modelli la y dipende invece dai valori presenti e passati di altre variabili.
Una classe più ampia di modelli che raggruppa le due tipologie anzidette è rappresentata dai modelli di tipo autoregressivo e a ritardi distribuiti, rispettivamente di ordine m ed n, che vengono indicati con ADL(m,n) (dall’inglese Autoregressive–Distributed Lag) e che sono genericamente espressi dall’equazione:
con ~N(0, )
in cui è la componente autoregressiva, mentre la componente cosiddetta di «ritardo distribuito» è rappresentata da e . Facendo ricorso all’operatore ritardo, il modello ADL(m,n) può scriversi in modo compatto nella forma:
.
Il modello ADL(m,n) presenta delle proprietà importanti:
1. è “stabile” se le radici dell’equazione (indicate con λ) sono superiori all’unità in valore assoluto, ossia ;
2. presenta “fattori comuni” se alcune delle radici del polinomio a(L) sono uguali alla radici del polinomio b(L).
Questa categoria di modelli gode inoltre di importanti proprietà di lungo periodo, che rendono i modelli stessi estremamente interessanti poiché consentono di creare, anche per tale via, un collegamento tra la specificazione econometrica e la teoria economica (spesso la teoria economica è abbastanza esplicita sul comportamento di lungo periodo, fino al punto che in talune circostanze test sulla teoria economica possono essere condotti direttamente sulle proprietà di lungo periodo della stessa).
Un caso semplicistico, ma denso di elementi indispensabili per gli studi economici, dei modelli ADL si ha sotto la condizione , ossia quando esiste un solo ritardo per ogni variabile. Il modello ADL(1,1), generalmente, si scrive:
.
Questo modello, è un caso particolare della classe, già di per sé ristretta, dei modelli lineari dinamici di una singola equazione. Tuttavia i modelli ADL(1,1) sono molto utilizzati nelle analisi empiriche perché godono di una caratteristica importante: ogni tipo di modello di singola equazione in econometria è un caso particolare di ADL(1,1).
Hendry sostiene, infatti, una modellizzazione estremamente interessante, detta «dal generale al particolare» che consiste nel porre delle restrizioni al modello generale per poter esprimere nel modo più congeniale il singolo problema economico avvalendosi di un modello semplificato rispetto a quello generale. I modelli ADL(1,1) godono di una particolare caratteristica che vale in qualsiasi caso di modellizzazione e non solo in quello dal generale al particolare: “se un membro di questa classe di modelli viene considerato come un modello che ha generato i dati osservati, ciò ha come conseguenza l’accettazione congiunta di ogni altro modello della classe meno ristretto rispetto a quello considerato, unitamente alle restrizioni necessarie a ricondurre il modello generale a quello particolare prescelto” .
2.2. IL MODELLO CON IL MECCANISMO A CORREZIONE DELL’ERRORE
Il modello dinamico generale del tipo ADL(1,1) può essere riparametrizzato in modo da essere espresso in una forma che si è rilevata di particolare interesse sia per la performance empirica che per le sue proprietà teoriche.
Dato il modello ADL(1,1) espresso nella forma tipica:
dove ~N(0, ) e con in cui si assume che l’errore sia normalmente distribuito con media 0 e varianza , sottraendo ad entrambi i membri , l’espressione anzidetta viene così trasformata:
e aggiungendo e sottraendo a destra di quest’ultima la quantità l’espressione viene ulteriormente modificata in tal senso:
.
Ponendo , , e ordinando opportunamente i termini si perviene all’espressione:
(1)
che rappresenta la forma tipica secondo cui si presenta un modello con meccanismo a correzione dell’errore (in cui, qualora per semplicità, si ometta il termine noto lasciando invariato il significato del modello rimanga invariato).
La peculiarità dei modelli con MCE consiste nel fatto che essi permettono di combinare una certa flessibilità nella specificazione dinamica, con proprietà interessanti nel comportamento di lungo periodo; sostanzialmente il modello con MCE consente di catturare la dinamica del sistema e, contemporaneamente, di incorporare le proprietà di equilibrio suggerite dalla teoria economica. Nella formula (1) l’aggiustamento alle variazioni della z avviene in modo proporzionale in base al coefficiente , pertanto il parametro viene detto “coefficiente d’impatto” o “risposta proporzionale” ed esprime la relazione di breve periodo, ossia le variazioni della y in seguito alle variazioni della variabile esplicativa z. Il modello espresso in questa forma incorpora, inoltre, l’equilibrium-correction mechanism, (indicato con ECM), che esprime le deviazioni dall’equilibrio statico e misura l’errore commesso dagli agenti nel periodo precedente; alla luce di tale disequilibrio gli agenti correggono o rivedono le loro decisioni su y, apportando l’opportuna variazione in questa variabile. Infine, il parametro c rappresenta il “coefficiente di lungo periodo” che riflette appunto l’andamento di lungo periodo della serie.
I modelli con MCE presentano svariati vantaggi. Un primo vantaggio di ordine pratico si riscontra nella fase di stima e di inferenza: le variabili (cioè la variazione del periodo corrente) e (cioè la deviazione dell’ultimo periodo dall’equilibrio) non presentano, in genere, un grado di correlazione elevato e quindi i parametri e possono essere stimati con i metodi di stima consueti senza incorrere nel problema della multicollinearità. Inoltre, poiché i modelli ADL(1,1) e i modelli con MCE sono isomorfi, le proprietà di cui godono gli ADL(1,1) valgono anche per i modelli con MCE; infatti, imponendo opportune restrizioni, in adesione alla logica di modellizzazione dal generale al particolare, anche dal modello con MCE si può pervenire a dei modelli estremamente interessanti per gli studi economici (quali: il modello ad aggiustamento parziale, il modello con restrizione a fattor comune; modello nei tassi di crescita).
Un modello ECM gode di tre ulteriori vantaggi che lo rendono un modello di base per la ricerca empirica:
• suggerisce dei collegamenti con la teoria di serie storiche cointegrate;
• può essere interpretato come una regola di controllo o servomeccanismo;
• ha sperimentato successi empirici nei modelli di serie storiche.
Una critica spesso avanzata, dagli analisti delle serie storiche, alla formulazione classica di un modello econometrico ha riguardato la caratteristica della stazionarietà delle variabili utilizzate. Effettivamente, sono molto frequenti i casi di serie storiche caratterizzate da andamenti crescenti o decrescenti al variare del tempo (trend), tali serie sono dette “non stazionarie nei livelli”. La proprietà di stazionarietà permette di considerare il processo omogeneo rispetto al tempo. In letteratura esistono due diverse nozioni di stazionarietà: la stazionarietà forte e quella debole.
La stazionarietà in senso forte fa riferimento a tutta la distribuzione del processo e implica che la distribuzione di probabilità del processo sia invariante rispetto a traslazioni dell’asse dei tempi. La stazionarietà in senso debole invece fa riferimento solo ai momenti primi (valore atteso) e secondi (varianza). La stazionarietà in senso debole si verifica qualora il valore atteso e la varianza siano finite e indipendenti dal tempo, mentre la covarianza dipende esclusivamente dal ritardo.
Si vuole soffermare l’attenzione sul concetto di integrazione. “Una variabile si dice «integrata di ordine d», in simboli ~I(d), se, dopo aver applicato d volte l’operatore differenza , essa può essere rappresentata per mezzo di un processo ARMA stazionario, invertibile e non deterministico” . Da tale definizione discende che una variabile integrata di ordine 0, I(0), è stazionaria nei livelli, mentre una serie integrata di ordine 1 è stazionaria nella differenza prima. Le principali differenze tra i processi integrati di ordine zero e quelli integrati di primo ordine sono stati introdotti da Engle e Granger. In particolar modo essi sostengono che una serie I(0): ha una varianza indipendente dal tempo; ha una memoria riguardo al suo passato che è limitata nel tempo, con la conseguenza che gli effetti derivanti dall’introduzione di un’innovazione sono transitori; le osservazioni tendono a fluttuare intorno alla media; le autocorrelazioni tra osservazioni successive decrescono rapidamente all’aumentare della distanza considerata tra le osservazioni. In una serie I(1), invece: la varianza dipende dal tempo e tende ad aumentare indefinitamente quando t tende ad infinito; il processo ha memoria pressoché infinita e quindi l’innovazione finirà per influire in modo permanente sul processo; presenta un andamento erratico e ad oscillazione ampia; le autocorrelazioni tra osservazioni successive tendono all’unità a prescindere dalla distanza considerata tra le osservazioni.
Alcune critiche sono state mosse ai modelli econometrici costruiti su variabili non rese preventivamente stazionarie e che presentano quindi il pericolo di regressione spuria . Tali critiche sono scaturite da considerazioni di natura prettamente statistica, in quanto l’inferenza effettuata sulla base di variabili non stazionarie, risente in modo negativo della caratteristica di non stazionarietà. Tale problema scaturisce innanzitutto dal fatto che l’utilizzo tale e quale delle variabili impedisce, in larga misura, l’applicazione dell’usuale teoria asintotica all’analisi delle proprietà degli stimatori dei minimi quadrati delle osservazioni non converge al momento secondo della variabile. Inoltre le usuali statistiche utilizzate per la verifica di determinate ipotesi, quali la significatività dei parametri e possibili restrizioni su questi, non possiedono le distribuzioni che correntemente vengono utilizzate per il calcolo dei valori critici dei test. In particolare, le distribuzioni dei test di tipo t di Student e di tipo F divergono all’aumentare della numerosità campionaria e, quindi, non esistono valori critici dei test asintoticamente corretti.
Tali motivazioni inducono a costruire modelli utilizzando le variabili opportunamente trasformate in modo da renderle stazionarie. Esistono svariati metodi per eliminare il trend. Gli effetti del tempo possono essere eliminati eseguendo una regressione rispetto al tempo e calcolando i residui tra la serie iniziale e quella successiva.
Un’altra soluzione più semplice per detrendizzare una serie consiste nel passaggio dai livelli di una generica serie temporale alle rispettive differenze prime; questa metodologia apporta l’effetto basilare di cancellare completamente la componente di trend con l’ onere di perdere una sola osservazione ( passando da T a T-1 dati). Ovviamente anche una serie integrata di ordine d può essere detrendizzata applicando d volte l’operatore , perdendo le informazioni fornite da d osservazioni.
Eppure i modelli basati solo su variabili espresse in differenze prime non soddisfano generalmente le relazioni di lungo periodo indicate dalla teoria economica, e quindi non danno alcuna informazione su queste (semplicemente perché non ne contengono).
Il modello con MCE vanta una caratteristica di rilevante importanza: permette di tener conto delle critiche poc’anzi evidenziate e, nello stesso tempo, di non perdere le informazioni sulle relazioni di lungo periodo fornite dalla teoria economica.
Dato il modello con MCE nella sua forma generale, se si considera noto il parametro c e se le variabili , e sono stazionarie è possibile operare una stima del modello stesso con il metodo dei minimi quadrati ordinari. Se è legittimo supporre che y e z siano entrambe di ordine uno e quindi le differenze sono stazionarie , occorre effettuare qualche precisazione per quanto riguarda il grado di integrazione della variabile .
Generalmente, combinazioni lineari di variabili non stazionarie producono variabili a loro volta non stazionarie, ma talvolta si verifica la condizione di cointegrazione, ossia è possibile che esista una particolare combinazione lineare delle variabili tale da far elidere tra loro i movimenti di lungo periodo della y e della z, divenendo essa stessa stazionaria. La cointegrazione consiste quindi nel far abbassare il grado di integrazione delle serie originarie. Più tecnicamente, si può evocare la definizione fornita da Engle e Granger secondo cui: “le componenti del vettore sono dette cointegrate di ordine d e b, in simboli ~CI(d,b), se:
• le variabili e , che compongono , sono entrambi I(d)
• esiste un vettore tale che la combinazione è I(d-b) con .”
In cui il vettore φ è detto «vettore di cointegrazione».
Il teorema afferma inoltre che se le componenti del vettore sono cointegrate di ordine e , allora il processo generatore dei dati (DGP) della serie è esprimibile nella forma con MCE, cioè:
dove , costituisce il vettore di cointegrazione, d(L) è un polinomio di ordine finito nell’operatore ritardo, e sono congiuntamente white noise e che implica che se le variabili sono cointegrate la deve apparire almeno in una equazione. Ossia nel caso di un modello con due sole variabili il vettore di cointegrazione se esiste è unico perché il numero massimo di vettori di cointegrazione tra n serie è n-1. È bene inoltre precisare che una singola equazione può essere sufficiente per catturare la dinamica di breve periodo attorno all’unica relazione di equilibrio tra due variabili non stazionarie; in tale contesto gli unici problemi che si pongono sono problemi di stima relativi al metodo di individuazione della relazione di lungo periodo.
Affinché le variabili siano cointegrate è necessario che tutte le componenti del vettore abbiano proprietà di lungo periodo tra loro compatibili, ossia le variabili che presentano andamenti tendenziali diversi non possono essere cointegrate.
Una particolarità degli stimatori di serie cointegrate è la cosiddetta «superconsistenza». Date le variabili y e z, entrambe integrate di ordine 1 e per le quali vale la relazione di lungo periodo , se y è cointegrata con z la convergenza in probabilità dello stimatore verso il valore vero di c è più rapida di quanto avviene nel caso di regressione standard tra variabili I(0). A tale risultato si perviene se la variabile y dipende solo dalla variabile z.
La connessione esistente tra la teoria della cointegrazione e il modello dinamico con MCE si manifesta attraverso la relazione ~I(0) ed è formalizzata nel teorema di «rappresentazione» di Granger. Il quale afferma proprio che, se le componenti del vettore , supposto per semplicità composto da due soli componenti, [ ]’ sono cointegrate di ordine e , allora il processo generatore dei dati è esprimibile nella forma con MCE.
Nella specificazione e nella stima del modello bisogna prestare particolare attenzione a determinati fattori: non è possibile includere liberamente in una regressione statica variabili che presentano un diverso ordine di integrazione (cioè caratterizzate da non stazionarietà di tipo diverso); nell’introdurre ritardi nella specificazione dinamica questi devono riguardare tutte le variabili che figurano nella regressione statica e non escluderne a priori alcune.
2.3. I TEST DI STAZIONARIETÁ E DI COINTEGRAZIONE
Condizioni necessarie per l’applicabilità del modello con meccanismo a correzione dell’errore sono quindi che le serie e siano integrate di ordine 1 (da cui discende la condizione di stazionarietà delle loro differenze prime) e che le stesse siano cointegrate di ordine 1.
La stazionarietà di una serie può essere analizzata osservando il trend sottostante la serie stessa. Sia dato il modello:
(1) con ~N(0, )
dove la variabile t indica il tempo. Esso incorpora due diversi tipi di trend alla cui rimozione si può procedere seguendo metodologie diverse.
Ponendo e , il modello appena esposto viene denominato, in letteratura, random walk o «processo stazionario nelle differenze» ed è caratterizzato dalla presenza di un trend stocastico. Infatti, sotto tali condizioni il trend può essere rimosso con l’uso dell’operatore differenza .
Se, invece, si suppone e il modello riproduce un processo «stazionario nel trend», cioè un modello con trend deterministico; in quanto sotto tali valori parametrici il trend viene spiegato dalla componente deterministica δt. In tal caso si suppone che i movimenti di lungo periodo della serie seguano una evoluzione di tipo deterministico e che i movimenti di breve periodo siano essenzialmente spiegati da un modello autoregressivo stazionario.
Data la divergenza del trend a seconda dei valori assunti dai parametri del modello, cui seguono effetti completamenti diversi, i risultati empirici del modello devono essere interpretati con estrema cautela.
Alla luce di quanto appena detto è legittimo supporre che l’accettazione dell’ipotesi nulla e δ=0 è consistente con l’ipotesi di un modello stazionario nelle differenze, mentre rimane ambiguo il caso in cui si rifiuti tale ipotesi nulla. Dickey e Fuller hanno dimostrato che se viene usato un test F per sottoporre a verifica , i valori critici a cui fare riferimento non sono quelli delle tavole standard della F, ma dei valori significativamente diversi.
Eppure in un modello AR(1) del tipo:
(2) con ~N(0, )
la condizione di stazionarietà si verifica quando .
Pertanto è possibile utilizzare un test per sottoporre a verifica la condizione di non stazionarietà , contro l’ipotesi alternativa di stazionarietà . Quando si è sotto l’ipotesi alternativa la stima del parametro può essere ottenuta, come di consueto, mediante lo stimatore dei minimi quadrati ordinari, la cui distribuzione è approssimativamente normale e la statistica-test utilizzata è:
~ .
Quando, invece, la distribuzione della statistica t non è più la t di student con (n-k) gradi di libertà. La verifica della stazionarietà avviene, quindi, mediante un test sulle radici unitarie.
Sfruttando la proprietà di invarianza del metodo OLS a trasformazioni lineari il modello AR(1), come sopra tipizzato, può essere equivalentemente espresso nella forma:
(3) .
Un test per sottoporre a verifica può continuare ad essere basato sul rapporto-t, ma la distribuzione campionaria di tale statistica, sotto non è più la t di Student, ma una distribuzione non standard. Di conseguenza i valori critici della distribuzione t di Student non possono essere utilizzati per definire la regione critica di tale test. Lo studio di tale problematica congiuntamente alla necessità di avvalersi di metodologie adeguate per la verifica della presenza di radici unitarie nelle serie storiche ha indotto la letteratura ad effettuare svariati studi in merito, fra i quali risultano molto interessanti quelli effettuati da Dickey, che ha tabulato la distribuzione della statistica data dal rapporto-t in presenza di radici unitarie, e da Fuller. Qualora si faccia ricorso a tale tabulazione il test viene indicato con τ e viene definito test di Dickey e Fuller (DF) . La distribuzione τ è una distribuzione non standard, fortemente asimmetrica a sinistra e per la quale la distribuzione normale costituisce un’approssimazione molto scadente. I valori critici del test si trovano in corrispondenza di valori negativi significativamente inferiori a meno 2.
Sulla base della regressione (3) è possibile ottenere uno stimatore per , , che permette di sottoporre a verifica l’ipotesi di stazionarietà di e la statistica-test, in questo caso, viene così modificata:
.
A fianco a questi test, gli stessi studiosi hanno introdotto un’altra classe di test, ADF, che possono essere utilizzati in quanto colmano determinate problematiche cui si incorre quando ci si avvale dei test DF. In primo luogo, è bene considerare che qualora si voglia sottoporre a verifica la condizione di stazionarietà di un processo AR di ordine superiore al primo (bisogna cioè sottoporre a verifica la presenza di radice unitaria in un processo AR di ordine superiore al primo) ci si avvale di un test Dickey-Fuller aumentato, ADF (dall’inglese Augmented Dickey Fuller). Infatti, se si suppone di avere un modello del tipo AR(2) nella forma:
che può essere riparametrizzato come: , in cui e , affinchè sia verificata la condizione di stazionarietà è necessario che sia che siano inferiori all’unità in valore assoluto.
La procedura di test proposta da Dickey e Fuller è invariante per trasformazioni lineari o per riparametrizzazioni del modello, con la conseguenza che processi AR di ordine superiore possono facilmente essere utilizzati “aumentando” la regressione mediante l’introduzione di ritardi successivi della differenza prima della variabile dipendente. Infatti la presenza di una radice unitaria in un processo AR(p) corrisponde ad un valore nullo del coefficiente di , e, se la radice unitaria viene imposta, il modello diviene un AR(p-1) in Δ .
Un ulteriore motivo per “aumentare” il modello (3) consiste nel fatto che esso può facilmente produrre residui autocorrelati, con la conseguenza di non poter disporre di uno stimatore efficiente per il coefficiente α. Per evitare tale inconveniente Dickey e Fuller suggerirono di modificare il modello introducendo ritardi successivi della variabile dipendente in numero tale da ottenere residui che siano innovazioni. Si ha, allora:
.
È bene precisare che per tali test l’ipotesi nulla è che la serie sia non stazionaria, pertanto il risultato cui si dovrebbe giungere mediante l’impiego del test τ è di rifiutare l’ipotesi nulla in favore della stazionarietà.
I risultati teorici sviluppati nell’ambito della teoria della cointegrazione e la loro utilizzazione nell’ambito della modellizzazione di breve periodo fanno emergere due tipi di problemi strettamente connessi fra loro: il problema della verifica statistica dell’ipotesi di cointegrazione; la stima del vettore di cointegrazione.
I principali test di verifica della cointegrazione sono stati elaborati da Engle e Granger e da Sargan e Bhargava.
Engle e Granger proposero un test a due stadi. Nel primo stadio si effettua una stima del coefficiente di lungo periodo che può essere ottenuta semplicemente considerando lo stimatore OLS del coefficiente della regressione statica sulla relazione di lungo periodo , avendo verificato che e siano effettivamente cointegrate. Il secondo stadio consiste nella stima e nella modellazione dell’equazione di breve per in funzione di , di valori ritardati di entrambe tali variabili, di altre variabili stazionarie e di .
Sargan e Bhargava propongono invece di utilizzare il test DW per verificare l’ipotesi di cointegrazione. Dalla stima dell’equazione si ottengono i residui e si usa la relazione:
(4)
per sottoporre a verifica l’ipotesi che corrisponde all’ipotesi di assenza di cointegrazione tra le variabili y e z. Ricordando il risultato DW 2(1- ), valori bassi del test DW portano ad accettare l’ipotesi nulla di assenza di cointegrazione.
Un metodo alternativo per sottoporre a verifica l’ipotesi di cointegrazione consiste nell’applicare il test di stazionarietà ai residui ottenuti dalla regressione di cointegrazione (4). L’ipotesi nulla che si sottopone a verifica è quella di assenza di cointegrazione tra due variabili. Con i residui ottenuti dalla (4) si costruisce la regressione nel modello:
(5)
e si effettua il test τ sul coefficiente δ. Se i residui sono stazionari si accetta l’ipotesi di cointegrazione tra le variabili y e z, poiché la loro combinazione, espressa dalla (3), dà luogo a residui che sono stazionari, mentre ciascuna variabile considerata separatamente non lo era. Il rifiuto dell’ipotesi nulla porta ad una stima separata dei coefficienti di lungo periodo e di breve periodo. In altri termini la stima di c ottenuta dall’equazione di cointegrazione viene imposta in una seconda equazione in cui viene specificata la dinamica di breve periodo degli aggiustamenti di y alle modificazioni della variabile z.
La stima del vettore di cointegrazione può essere effettuata attraverso la procedura sopra esposta proposta da Engle e Granger che si articola in due stadi.
Nessun commento:
Posta un commento