Nestacionarūs panelinių duomenų modeliai Vaidotas Zemlys Matematikos ir Informatikos Fakultetas, Ekonometrinės analizės katedra Vaidotas.Zemlys@maf.vu.lt 2005 m. gegužės 3 d. Nestacionarūs panelinių duomenų modeliai p. 1 iš 18
Panelinių duomenų statistikų asimptotika Dažniausiai panelinių duomenų analizėje sutinkamas procesas yra X n,t = 1 n Y i,t, k n čia Y i,t yra i atžvilgiu nepriklausomi atsitiktiniai vektoriai, ir paprastai, tai standartizuota panelinių duomenų laiko eilučių dalies suma. Jeigu turime paprastą panelinės regresijos modelį su individualias efektais: i=1 y it = α i + βx it + u it tai dažniausiai nagrinėjamas vidinės regresijos OLS β įvertis: N T i=1 t=1 ˆβ = β + (u it ū i. )(x it x i. ) T t=1 (x it x i. ) 2 N i=1 Nestacionarūs panelinių duomenų modeliai p. 2 iš 18
Įvairūs konvergavimai Sekvencinis konvergavimas. Tegu egzistuoja Y i,t ribos Y i. Imant T randamos tarpinės ribos X n = 1 k n Y i. Tada imant n randama X n riba. Gautas ribinis atsitiktinis dydis vadinamas sekvencine riba. Konvergavimas pagal diagonalines trajektorijas. Laikoma, kad T = T (n) ir ieškoma ribos, kai n. Bendras konvergavimas. Netaikomi jokie apribojimai n ir T, ir ieškoma riba, kai n ir T į begalybę artėja kartu. Nestacionarūs panelinių duomenų modeliai p. 3 iš 18
Sekvencinio ir bendro konvergavimo sąryšis Tegu Z i,t = N(0, 1χ{i < t} + iχ{i t 1}), Y i,t = 1 Z T i,t ir X n,t = 1 n. Tada sekvencinė X n,t riba yra N(0, 1), bet kai T. N(0, 1), kai r < 1/2, X T r,t N(0, 4/3), kai r = 1/2, nekonverguoja, kai r > 1/2, Tegu X n,t X n, kai T ir X n X, kai n, tada X n,t X, kai T, n, tada ir tik tada, kai lim sup E(f (X n,t ) f (X )), f C n,t Nestacionarūs panelinių duomenų modeliai p. 4 iš 18
Levin-Lin testai Nagrinėjo modelį y it = ρ i y i,t 1 + z it γ + u it ( T ) Tegu z t = (z 1t,..., z Nt ), h(t, s) = z t t=1 z tz t z s, ũ it = u it T s=1 h(t, s)u is ir ỹ it = y it T s=1 h(t, s)y is. Tada NT (ˆρ 1) = 1 N N i=1 1 T T t=1 ỹi,t 1ũ it 1 N N i=1 1 T 2 T t=1 ỹ 2 i,t 1 t ρ = N (ˆρ 1) T i=1 t=1 ỹ i,t 1 2, s e čia s 2 e = (1/NT ) N i=1 T t=1 ũ2 it Nestacionarūs panelinių duomenų modeliai p. 5 iš 18
Levin ir Lin testų ribiniai pasiskirstymai Esant nulinei hipotezei H 0 : ρ = 1 Levin ir Lin gavo tokius ribinius pasiskirstymus: z it ˆρ f (t ρ ) N(0, 1) 0 NT (ˆρ 1) N(0, 2) tρ 1 NT (ˆρ 1) N(0, 2) tρ µ i NT (ˆρ 1) + 3 N N(0, 51 5 ) 1.25tρ + 1.875N (µ i, t) N(T (ˆρ 1) + 7.5) N(0, 2895 112 ) 488 277 (t ρ + 3.75N) Nestacionarūs panelinių duomenų modeliai p. 6 iš 18
Harris ir Tzavalis (1999) Nagrinėjo atvejį, kai T - fiksuotas. Tada z it ˆρ 0 N(ˆρ 1) N(0, 2 T (T 1) ) ) µ i N (ˆρ 1 + 3 T +1 ) N(0, 3(17T 2 20T +17) 5(T 1)(T +1) 3 (µ i, t) N (ˆρ 1 + 15 2(T +2) ) N(0, 15(193T 2 728T +1147) 112(T +2) 3 (T 2) ) Nestacionarūs panelinių duomenų modeliai p. 7 iš 18
Im, Pesaran ir Shin (1997) testai Modelis p i y it = ρ i y i,t 1 + ϕ ij y i,t j + z it γ + ε it j=1 Pasiūlė suvidurkinti ADF statistikas: N t = 1 N t=1 t ρi Kadangi t ρi t it, kai T, tai centruotas t N(0, 1) pagal CRT, tarus, kad t it yra IID. Nestacionarūs panelinių duomenų modeliai p. 8 iš 18
LL ir IPS testų palyginimas LL testas reikalauja, kad ρ būtų vienodas visoms šalims Abu reikalauja N/T 0. Pažeidus šią sąlygą testų dydis išsikreipia, kai N didelis palyginus su T. Breitung (2000) nagrinėjo LL ir IPS testų lokalią galią, esant lokalių alternatyvų sekai. Jeigu įtraukiami individualūs trendai, tai LL ir IPS testų galia stipriai sumažėja. Monte-Karlo rezultatai rodo, kad LL ir IPS testai labai jautrūs z it parinkimui. Nestacionarūs panelinių duomenų modeliai p. 9 iš 18
Testų p-reikšmių jungimas Tegu G iti yra vienetinės šaknies statistika i-tajai grupei, ir G iti G i. Tegu p i = F Gi (G iti ). Maddala, Wu ir Choi (1999a) pasiūlė naudoti statistiką P = 2 N ln p i Fiksuotiems N, P yra pasiskirsčius, kaip χ 2 su 2N laisvės laipsnių, kai T i. Šios statistikos trūkumas yra tas, kad jos p-reikšmes reikia skaičiuoti su Monte-Karlo simuliacijomis. i=1 Choi (1999) pasiūlė dar dvi panašias statistikas Z = (1/ N) N i=1 Φ 1 (p i ) ir L = N i=1 ln(p i/(1 p i )). Nestacionarūs panelinių duomenų modeliai p. 10 iš 18
Hadri LM testas Modelis čia e it = t j=1 u ij + ε it. Konstruojama statistika: LM = y it = z it γ + e it, 1 N N i=1 1 T T 2 t=1 S2 it ˆσ e 2 Esant nulinei hipotezei, kad modelis yra stacionarus: [ ] LM p E W 2, kai T ir po to N. Nestacionarūs panelinių duomenų modeliai p. 11 iš 18
Moon ir Philips (2000) modelis Nagrinėjo nestacionarų modelį čia β = exp(c/t ). y it = α i0 + α i1 t + yit 0 yit 0 = βy i,t 1 0 + u it, Informacija apie c naudinga analizuojant vienetinės šaknies, kointegravimo testų galią. Parodė, kad kai c 0, naudojant panelinius duomenis galima gauti suderintą c įvertį. Nestacionarūs panelinių duomenų modeliai p. 12 iš 18
Ilgo nuotolio vidutiniai sąryšiai Jei (Y, X ) yra dvimatis normalusis atsitiktinis dydis N(0, Σ) su [ ] Σyy Σ Σ = yx Σ yx Σ xx tai Y nuo X regresijos koeficientas β = Σ yx Σ 1 xx. Klasikiniam regresiniam modelyje Y t = βx t + U t, čia EX t = EU t = 0 ir X t su U t - nekoreliuoti, β = (EY t X t )(EX tx t ) = Σ yxσ 1 xx Nestacionarūs panelinių duomenų modeliai p. 13 iš 18
Tegu Z t = (Y t, X t ) ir Z t = Z t 1 + U t. Tegu egzistuoja ilgo nuotolio kovariacijų matrica Ω = lim T (( 1 E T T i=1 ) ( 1 U t T T U t i=1 )) padalinta šitaip: [ ] Ωyy Ω Ω = yx Ω yx Ω xx Tada β = lim T E ( YT X ) ( T XT X [E )] 1 T = Ω yx Ω 1 xx T T T T nusako ilgo nuotolio sąryšį tarp nestacionarių kintamųjų X t ir Y t. Nestacionarūs panelinių duomenų modeliai p. 14 iš 18
Ilgo nuotolio sąryšiai paneliniams duomenims Laikome, kad turime imtį Z i,t, tokią, kad Ω = EΩ i. Philips ir Moon (1999) nagrinėjo vertino β šiais atvejais 1 Ω i yra teigiamai apibrėžta kiekvienam i. 2 Ω i yra nepilno rango ir kiekvienam i kointegracija skirtinga. 3 Ω i yra nepilno rango ir kiekvienam i kointegracija vienoda. Visiems šiems atvejams OLS β įvertis yra suderintas, kai n, T, bet norint gauti ribinį pasiskirstymą reikia prielaidos n/t. Nestacionarūs panelinių duomenų modeliai p. 15 iš 18
Kao (1999) testai Nagrinėja modelį y it = x it β + z it γ + e it čia x it = x i,t 1 + ε it ir e it I (1). Konstruoja DF testus iš regresijos liekanų: ê it = ρê i,t 1 + ν it Tada kointegruotumo nebuvimas išreiškiamas nuline hipoteze H 0 : ρ = 1. Pasiūlė 4 testus remiantis OLS įverčiu ˆρ ir t ρ, kai z it = µ i, esant stipriai egzogeniškiems arba endogeniniams regresoriams. Nestacionarūs panelinių duomenų modeliai p. 16 iš 18
McCoskey ir Kao (1998) testas Modelis y it = α i + x it β + e it x it = x i,t 1 + ε it e it = γ it + u it γ it = γ i,t 1 + θu it Nulinė kointegruotumo hipotezė yra ekvivalenti θ = 0. Testas apibrėžiamas taip: 1 N N i=1 1 T T LM = 2 t=1 S2 it ˆσ e 2 čia S it = t j=1 êit. Ribinis statistikos pasiskirstymas yra N(LM µν ) N(0, σ 2 ν ), čia µ ν ir σ 2 ν yra Brauno judesio funkcionalai. Nestacionarūs panelinių duomenų modeliai p. 17 iš 18
Kiti testai Kaip ir vienetinės šaknies testų atveju, galima nagrinėti kointegravimo testų p-reikšmių statistikas. Larson, Lyhagen, Löthgren (2001) nagrinėjo LR testus kointegravimo rangui nustatyti. Groen ir Kleibergen (1999) nagrinėjo panelinių duomenų kointegruotumą pastoviam skaičiui VEC (vector error correction) modelių. Hall, Lazarova ir Urga (1999) taikė principinių komponentų analizę vienodų stochastinių trendų skaičiui nustatyti. Nestacionarūs panelinių duomenų modeliai p. 18 iš 18