Spesifikasi data panel

8

Saya mencoba mencari tahu spesifikasi terbaik untuk dataset saya.

Saya mencoba menyelidiki efektivitas zona ekonomi khusus di Polandia dalam arti pertumbuhan ekonomi dalam tiga model panel data yang sama untuk variabel yang dijelaskan: a) tingkat pengangguran terdaftar b) PDB per kapita c) pembentukan modal tetap bruto per kapita . Data untuk sub-wilayah NUTS3. Variabel penjelas adalah: 0-1 untuk keberadaan KEK di sub-wilayah pada tahuntdan beberapa variabel ekonomi; frekuensi tahunan, dataset 2004-2012 untuk 66 sub-wilayah.

Saya sudah mencoba efek yang diperbaiki dan acak. Sedangkan untuk sekarang, saya telah memilih FE, karena signifikansi dan tanda-tanda yang benar secara teoritis. Tetapi ada beberapa masalah yang mencegah saya menerima begitu saja:

  1. Bagaimana cara menguji autokorelasi dan korelasi silang?

  2. Saya tidak tahu cara menguji distribusi istilah kesalahan di Stata, dan lebih jauh lagi jika tidak terdistribusi secara normal, haruskah saya sangat peduli?

  3. Seperti yang saya pahami dari literatur, nilai-nilai koefisien korelasi antara variabel penjelas dan istilah kesalahan mendekati -1 atau 1 tidak buruk sebagai fakta; dalam kasus saya, hampir -1 seperti yang Anda lihat.

  4. Apakah model campuran sesuai untuk dataset saya?

Saya lampirkan hasil untuk model yang menjelaskan tingkat pengangguran.

Kode:

xtreg  st_bezr sse01 wartosc_sr_trw_per_capita zatr_przem_bud podm_gosp_na_10tys_ludn proc_ludn_wiek_prod ludnosc_na_km2, fe

Fixed-effects (within) regression               Number of obs      =       594
Group variable: id                              Number of groups   =        66

R-sq:  within  = 0.4427                         Obs per group: min =         9
       between = 0.3479                                        avg =       9.0
       overall = 0.2365                                        max =         9

                                                F(6,522)           =     69.10
corr(u_i, Xb)  = -0.9961                        Prob > F           =    0.0000

-------------------------------------------------------------------------------------------
                  st_bezr |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
--------------------------+----------------------------------------------------------------
                    sse01 |  -1.406066   .4631984    -3.04   0.003    -2.316028   -.4961045
wartosc_sr_trw_per_capita |  -.0000963   .0000166    -5.79   0.000    -.0001289   -.0000636
           zatr_przem_bud |  -26.11989   4.992198    -5.23   0.000    -35.92716   -16.31263
  podm_gosp_na_10tys_ludn |  -.0201788   .0030788    -6.55   0.000    -.0262273   -.0141304
      proc_ludn_wiek_prod |  -229.1996   16.92631   -13.54   0.000    -262.4516   -195.9475
           ludnosc_na_km2 |   .0790167   .0120865     6.54   0.000     .0552726    .1027609
                    _cons |   161.9786   10.76989    15.04   0.000      140.821    183.1363
--------------------------+----------------------------------------------------------------
                  sigma_u |  53.986519
                  sigma_e |  2.5446248
                      rho |  .99778327   (fraction of variance due to u_i)
-------------------------------------------------------------------------------------------
F test that all u_i=0:     F(65, 522) =    27.09             Prob > F = 0.0000
charlie9207
sumber

Jawaban:

12

Untuk perintah Stata dalam jawaban ini izinkan saya mengumpulkan variabel Anda di lokal:
local xlist sse01 wartosc_sr_trw_per_capita zatr_przem_bud podm_gosp_na_10tys_ludn proc_ludn_wiek_prod ludnosc_na_km2
Jadi sekarang Anda selalu dapat memanggil semua variabel dengan `xlist '

1) Ada dua perintah yang dapat Anda gunakan setelah regresi efek tetap.

  • xttest2melakukan uji Breusch-Pagan LM dengan hipotesis nol tanpa ketergantungan antara residual. Ini adalah tes untuk korelasi kontemporer. Tidak menolak nol berarti bahwa tes tidak mendeteksi adanya ketergantungan cross-sectional dalam residu Anda.
  • xttest3melakukan versi modifikasi dari tes Wald untuk heteroskedastisitas berkelompok. Hipotesis nolnya adalah homoseksualitas.

Anda dapat menginstal kedua perintah dengan mengetik ssc instal xttest2dan ssc instal xttest3. Jika Anda mendeteksi korelasi antara residu Anda, Anda dapat memperbaikinya dengan opsi kuat:
xtreg st_bezr 'xlist', fe robust

Untuk menguji autokorelasi, Anda dapat menerapkan tes Pengganda Lagrange melalui xtserial:
xtserial st_bezr 'xlist'
Hipotesis nol adalah tidak ada korelasi serial. Untuk memperbaiki korelasi serial dan heteroskedastisitas, Anda dapat menggunakan opsi gugus dengan variabel id Anda:
xtreg st_bezr 'xlist', fe cluster(id)

2) Untuk uji normalitas residual: Anda dapat memperoleh residual melalui perintah prediksi predict res, esetelah regresi efek tetap. Untuk inspeksi visual Anda dapat menggunakan:

  • kdensity res, normal (plot distribusi residu dan membandingkannya dengan normal)
  • pnorm res (Memplot plot probabilitas normal standar)
  • qnorm res (plot kuantil residu terhadap kuantil dari distribusi normal)

Dengan pnorm Anda dapat melihat apakah ada ketidaknormalan di tengah distribusi dan qnorm menunjukkan kepada Anda segala ketidaknormalan di bagian ekor. Tes formal dapat diperoleh dengan swilk res. Hipotesis nol adalah bahwa residu terdistribusi normal. Secara umum, ketidaknormalan bukan masalah yang terlalu besar tetapi penting untuk disimpulkan. Anda dapat memperbaiki ini lagi dengan opsi yang kuat.

3) Memiliki corr(u_i, Xb) = -0.9961berarti bahwa efek tetap sangat berkorelasi dengan variabel penjelas Anda, jadi Anda melakukannya dengan baik dengan mengendalikan efek-efek tetap ini. Korelasi yang kuat dari tipe ini biasanya menunjukkan bahwa kumpulan OLS atau efek acak tidak akan cocok untuk tujuan Anda karena kedua model ini mengasumsikan bahwa korelasi antaraui dan Xβ adalah nol.

4) Secara umum ya tetapi itu tergantung pada apa yang ingin Anda perkirakan atau bagaimana Anda dapat memperlakukan data Anda, yaitu apakah variabel Anda adalah variabel acak atau tidak. Berikut adalah penjelasan yang sangat baik untuk perbedaan antara efek campuran dan model data panel oleh @mpiktas yang pasti akan membantu Anda.

Andy
sumber