Ada beberapa suara kuat dalam komunitas Ekonometrik terhadap validitas Ljung-Box -statistic untuk pengujian autokorelasi berdasarkan residu dari model autoregresif (yaitu dengan variabel dependen tertinggal dalam matriks regressor), lihat khususnya Maddala (2001) "Pengantar Ekonometrika (edisi 3d), bab 6.7, dan 13. 5 hal 528. Maddala benar-benar menyesalkan meluasnya penggunaan tes ini, dan sebagai gantinya dianggap pantas sebagai tes" Pengganda Langrange "dari Breusch dan Godfrey.Q
Argumen Maddala terhadap tes Ljung-Box sama dengan yang diajukan terhadap tes autokorelasi lain yang ada di mana-mana, yaitu "Durbin-Watson": dengan variabel dependen tertinggal dalam matriks regressor, tes ini bias dalam mendukung mempertahankan hipotesis nol dari "no-autocorrelation" (hasil Monte-Carlo diperoleh dalam jawaban @javlacalle menyinggung fakta ini). Maddala juga menyebutkan rendahnya daya ujian, lihat misalnya Davies, N., & Newbold, P. (1979). Beberapa studi kekuatan dari uji portmanteau spesifikasi model deret waktu. Biometrika, 66 (1), 153-155 .
Hayashi (2000) , ch. 2.10 "Pengujian Untuk korelasi serial" , menyajikan analisis teoritis terpadu, dan saya percaya, mengklarifikasi masalah ini. Hayashi mulai dari nol: UntukstatistikLjung-Boxakan didistribusikan secara asimptot sebagai chi-square, itu harus menjadi kasus yang memproses(apa pun yangdiwakili), yang sampel autokorelasinya kamike dalam statistik adalah, di bawah hipotesis nol dari tidak ada autokorelasi, urutan perbedaan martingale, yaitu memenuhi{ z t } zQ{zt}z
E(zt∣zt−1,zt−2,...)=0
dan juga menunjukkan homoskedasticity kondisional "sendiri"
E(z2t∣zt−1,zt−2,...)=σ2>0
Dalam kondisi ini, Ljung-Box -statistic (yang merupakan varian sampel yang dikoreksi-untuk-terbatas-sampel dari Box-Pierce Q -statistic), secara asimptotik merupakan distribusi chi-squared, dan penggunaannya memiliki justifikasi asimtotik. QQ
Asumsikan sekarang bahwa kita telah menetapkan model autoregresif (yang mungkin juga termasuk regressor independen selain variabel dependen yang tertinggal), katakanlah
yt= x′tβ+ ϕ ( L ) yt+ ut
di mana adalah polinomial dalam operator lag, dan kami ingin menguji korelasi serial dengan menggunakan residu estimasi. Jadi di sini z t ≡ u t . ϕ ( L )zt≡ kamu^t
Hayashi menunjukkan bahwa agar statistik Ljung-Box berdasarkan pada autokorelasi sampel residu, untuk memiliki distribusi chi-square asimptotik di bawah hipotesis nol tanpa autokorelasi, itu harus menjadi kasus bahwa semua regresor "benar-benar eksogen" " ke istilah kesalahan dalam pengertian berikut:Q
E( xt⋅ kamus) = 0 ,E( yt⋅ kamus) = 0∀t,s
The "untuk semua " adalah persyaratan penting di sini, salah satu yang mencerminkan exogeneity ketat. Dan itu tidak berlaku ketika variabel dependen tertinggal ada dalam matriks regressor. Ini mudah dilihat: set s = t - 1 lalut,ss=t−1
E[ytut−1]=E[(x′tβ+ϕ(L)yt+ut)ut−1]=
E[x′tβ⋅ut−1]+E[ϕ(L)yt⋅ut−1]+E[ut⋅ut−1]≠0
bahkan jika adalah independen dari istilah kesalahan, dan bahkan jika istilah kesalahan tidak memiliki autokorelasi : istilah E [ ϕ ( L ) y t ⋅ u t - 1 ] bukan nol. XE[ϕ(L)yt⋅ut−1]
Tetapi ini membuktikan bahwa statistik Ljung-Box tidak valid dalam model autoregresif, karena tidak dapat dikatakan memiliki distribusi chi-square asimptotik di bawah nol.Q
Asumsikan sekarang bahwa kondisi yang lebih lemah daripada eksogenitas ketat terpenuhi, yaitu itu
E(ut∣xt,xt−1,...,ϕ(L)yt,ut−1,ut - 2, . . . ) = 0
Kekuatan dari kondisi ini adalah "ketidakseimbangan" antara eksogenitas dan ortogonalitas yang ketat. Di bawah nol tanpa autokorelasi dari istilah kesalahan, kondisi ini "secara otomatis" dipenuhi oleh model autoregresif, sehubungan dengan variabel dependen yang tertinggal (untuk itu tentu saja harus diasumsikan secara terpisah).X
Kemudian, ada statistik lain berdasarkan autokorelasi sampel residu, ( bukan Ljung-Box satu), yang memang memiliki distribusi chi-square asimptotik di bawah nol. Statistik lain ini dapat dihitung, sebagai kenyamanan, dengan menggunakan "regresi tambahan" dengan rute: regresi residual pada matriks regressor penuh dan pada residual masa lalu (sampai dengan lag kami telah digunakan di spesifikasi), mendapatkan uncentered R 2 dari regresi auxilliary ini dan kalikan dengan ukuran sampel.{ u^t} R2
Statistik ini digunakan dalam apa yang kita sebut "tes Breusch-Godfrey untuk korelasi serial" .
Tampaknya kemudian, ketika regressor menyertakan variabel dependen yang tertinggal (dan juga dalam semua kasus model autoregresif), uji Ljung-Box harus ditinggalkan demi uji Breusch-Godfrey LM. , bukan karena "berkinerja lebih buruk", tetapi karena tidak memiliki justifikasi asimptotik. Hasil yang cukup mengesankan, terutama dilihat dari keberadaan dan penerapannya di mana-mana.
PEMBARUAN: Menanggapi keraguan yang muncul dalam komentar, apakah semua hal di atas berlaku juga untuk model seri waktu "murni" atau tidak (yaitu tanpa " " -regressor), saya telah memposting pemeriksaan terperinci untuk model AR (1), di https://stats.stackexchange.com/a/205262/28746 .x
Dugaan
Saya tidak tahu tentang studi yang membandingkan tes ini. Saya memiliki kecurigaan bahwa uji Ljung-Box lebih tepat dalam konteks model deret waktu seperti model ARIMA, di mana variabel penjelas adalah kelambatan dari variabel dependen. Tes Breusch-Godfrey bisa lebih sesuai untuk model regresi umum di mana asumsi klasik terpenuhi (khususnya reogen eksogen).
Dugaan saya adalah bahwa distribusi uji Breusch-Godfrey (yang bergantung pada residu dari regresi yang dipasang oleh Ordinary Least Squares), dapat dipengaruhi oleh fakta bahwa variabel penjelas tidak eksogen.
Saya melakukan latihan simulasi kecil untuk memeriksa ini dan hasilnya menunjukkan yang sebaliknya: tes Breusch-Godfrey berkinerja lebih baik daripada tes Ljung-Box ketika menguji autokorelasi dalam residu model autoregresif. Detail dan kode R untuk mereproduksi atau memodifikasi latihan diberikan di bawah ini.
Latihan simulasi kecil
Aplikasi khas dari uji Ljung-Box adalah untuk menguji korelasi serial dalam residu dari model ARIMA yang sesuai. Di sini, saya menghasilkan data dari model AR (3) dan cocok dengan model AR (3).
Residu memenuhi hipotesis nol tanpa autokorelasi, oleh karena itu, kita harapkan nilai-p terdistribusi secara merata. Hipotesis nol harus ditolak dalam persentase kasus yang mendekati tingkat signifikansi yang dipilih, misalnya 5%.
Tes Ljung-Box:
Hasilnya menunjukkan bahwa hipotesis nol ditolak dalam kasus yang sangat jarang. Untuk tingkat 5%, tingkat penolakan jauh lebih rendah dari 5%. Distribusi nilai-p menunjukkan bias terhadap non-penolakan dari nol.
Prinsip Edit Dalam
fitdf=3
harus diatur dalam semua kasus. Ini akan menjelaskan derajat kebebasan yang hilang setelah menyesuaikan model AR (3) untuk mendapatkan residu. Namun, untuk kelambatan pesanan yang lebih rendah dari 4, ini akan mengarah pada kebebasan negatif atau nol derajat, menjadikan tes tidak dapat diterapkan. Menurut dokumentasi?stats::Box.test
: Tes-tes ini kadang-kadang diterapkan pada residu dari kecocokan ARMA (p, q), dalam hal ini referensi menyarankan perkiraan yang lebih baik untuk distribusi hipotesis nol diperoleh dengan pengaturanfitdf = p+q
, asalkan tentu saja itulag > fitdf
.Tes Breusch-Godfrey:
Hasil untuk tes Breusch-Godfrey terlihat lebih masuk akal. Nilai-p terdistribusi secara seragam dan tingkat penolakan lebih dekat ke tingkat signifikansi (seperti yang diharapkan dalam hipotesis nol).
sumber
LB.pvals[i,j]
fitdf=3
lag<fitdf
fitdf=0
di tempatfitdf=3
Anda mungkin menipu diri sendiri.Greene (Analisis Ekonometrik, Edisi 7, hal. 963, bagian 20.7.2):
(Saya tahu bahwa pertanyaan yang diajukan tentang Ljung-Box dan yang di atas mengacu pada Box-Pierce, tetapi yang pertama adalah penyempurnaan sederhana dari yang terakhir dan karenanya setiap perbandingan antara GB dan BP juga akan berlaku untuk perbandingan antara GB dan LB.)
Seperti jawaban lain telah menjelaskan dengan cara yang lebih teliti, Greene juga menyarankan bahwa tidak ada untungnya (selain dari beberapa efisiensi komputasi mungkin) dari menggunakan Ljung-Box versus Godfrey-Breusch tetapi berpotensi banyak kehilangan (validitas tes).
sumber
Tampaknya tes Box-Pierce dan Ljung-Box sebagian besar merupakan tes univariat, tetapi ada beberapa asumsi di balik tes Breusch-Godfrey ketika menguji apakah struktur linear tertinggal pada residu regresi deret waktu (proses MA atau AR).
Inilah tautan ke diskusi:
http://www.stata.com/meeting/new-orleans13/abstracts/materials/nola13-baum.pdf
sumber
Perbedaan utama antara tes adalah sebagai berikut:
Tes Breusch-Godfrey adalah sebagai uji Pengganda Lagrange yang berasal dari fungsi kemungkinan (ditentukan dengan benar) (dan dengan demikian dari prinsip pertama).
Tes Ljung-Box didasarkan pada momen kedua residual dari proses stasioner (dan dengan demikian bersifat relatif lebih ad-hoc).
Tes Breusch-Godfrey sama dengan Lagrange Multiplier test yang secara asimtotik sama dengan tes yang paling kuat. Meskipun demikian, ini hanya asimptotik yang paling kuat dengan hipotesis alternatif dari regresi yang dihilangkan (terlepas dari apakah mereka merupakan variabel yang tertinggal atau tidak). Titik kuat dari tes Ljung-Box mungkin adalah kekuatannya terhadap berbagai hipotesis alternatif.
sumber