Apakah non-stasioneritas dalam logit / probit penting?

8

Saya ingin bertanya - Saya menggunakan logit untuk menyelidiki, jika beberapa variabel meningkatkan risiko krisis mata uang. Saya memiliki data tahunan dari 1980 untuk banyak negara (panel tidak seimbang), variabel dummy adalah 1 jika krisis mata uang dimulai (menurut definisi saya), 0 sebaliknya. Variabel penjelas sesuai dengan beberapa teori, seperti giro / PDB, aset luar negeri bersih / PDB, pinjaman / PDB, dan sebagainya ... Semua tertinggal (-1). Saya menggunakan kesalahan standar yang kuat, yang harus konsisten dengan heteroskedastisitas. Namun, misalnya pinjaman ke PDB atau NFA / PDB tidak stasioneritas (uji panel). Apakah ini masalah? Saya belum melihat pengujian kertas untuk stasioneritas melakukan logit / probit. Bagi saya itu juga intuitif bahwa itu tidak masalah. Jika saya menguji apakah suatu variabel meningkatkan risiko krisis, itu seharusnya tidak menjadi masalah, bahwa variabel ini naik secara permanen. Sebaliknya - peningkatan variabel secara permanen meningkatkan risiko krisis dan ketika mencapai tingkat yang tidak berkelanjutan, krisis terjadi. Tolong bisakah Anda memberi saya jawaban, apakah saya benar?

Jirka
sumber
2
Apakah ada alasan mengapa Anda tidak dapat menggunakan waktu dengan efek tetap? Melakukan hal itu sering mengendalikan perubahan tingkat variabel tidak stasioner. Logit menggunakan kemungkinan maksimum yang mengasumsikan kesalahan laten iid. Jika kesalahan dikorelasikan melalui waktu, itu bisa menghasilkan kecocokan yang bias terlepas dari bagaimana kesalahan standar dihitung. Sekali lagi menggunakan waktu efek tetap harus menjelaskan sebagian besar dari ini.
Zachary Blumenfeld
2
Mereka tidak mengizinkan efek tetap pada logit karena mereka berusaha menghindari bias parameter insidental yang menurut pemikiran kedua masuk akal. Satu hal yang dapat Anda lakukan adalah menjalankan model probabilitas linier, dengan dan tanpa efek waktu acak / tetap. Anda dapat melakukan diagnostik sisa untuk model-model ini dan melihat apakah margin minat Anda berubah. Jika residu dalam grup Anda tidak berkorelasi dan kontrol waktu tidak secara signifikan mengubah margin daripada Anda mungkin baik-baik saja dengan logit (margin rata-rata harus untuk logit harus serupa dengan model linier)
Zachary Blumenfeld
2
Juga ada beberapa hal menarik yang Anda dapat dengan sampling ulang untuk mengurangi bias insidental dalam model panel non-linear yang saya pikir juga berlaku untuk masalah Anda. <a href=" onlinelibrary.wiley.com/doi/10.1111/j.1468-0262.2004.00533.x/…> adalah makalah oleh Hahn dan Newey yang melakukannya dengan jacknife. Saya tidak akan tahu bagaimana menerapkan sesuatu seperti ini di Eveiws atau STATA (Maaf), tapi saya yakin ini bisa dilakukan di STATA.
Zachary Blumenfeld
1
Saya tidak yakin 100%. Gagasan dengan model linier adalah bahwa Anda dapat dengan mudah melakukan diagnostik residual untuk non-stasioneritas (atau auto-korelasi) dalam residual. Efek marginal rata-rata untuk logit harus sangat dekat dengan margin model linier. Menggunakan fakta ini, jika Anda tahu model linear tidak bias (melalui memeriksa residu), daripada Anda dapat mengatakan logit memperkirakan efek marginal rata-rata juga (mengingat Anda mengamati margin rata-rata cukup banyak untuk kedua model). Jadi, masuk akal untuk percaya bahwa logit adalah unbias.
Zachary Blumenfeld
1
Ketika datang ke perbedaan pertama, ini semacam "de-makna" variabel deret waktu yang sangat mirip dengan gagasan menambahkan efek tetap ... mengendalikan perubahan tingkat untuk setiap periode waktu individu. Namun, pengobatan formal semacam ini dapat menjadi tenang kompleks dan masih ada kesempatan bagi autokorelasi dalam residu <a href=" people.stern.nyu.edu/jsimonof/classes/2301/pdf/...> memiliki beberapa saran yang masuk akal menggunakan pearson residu untuk memeriksa autokorelasi
Zachary Blumenfeld

Jawaban:

5

Model apa pun yang Anda gunakan, dasar-dasar teori ekonometrika harus diperiksa dan dihormati. Para peneliti bersikukuh tentang penggunaan model-model yang sangat canggih, tetapi seringkali - lebih atau kurang sukarela - mereka lupa tentang dasar-dasar ekonometrik; karena itu mereka menjadi sangat konyol. Ekonometrik tidak lebih dari memperkirakan rata-rata dan varians dari parameter Anda, tetapi jika rata-rata, varians, dan kovarian variabel Anda berubah dari waktu ke waktu, perangkat dan analisis yang sesuai harus dilakukan. Menurut pendapat saya, model probit / logit dengan data non stasioner tidak masuk akal karena Anda ingin memasukkan sisi kanan persamaan Anda (yang non stasioner) ke sisi kiri yang merupakan variabel biner. Struktur dinamika waktu variabel independen Anda harus koheren dengan variabel dependen. Jika beberapa regresi Anda tidak stasioner, Anda salah menentukan hubungan Anda; memang harus bahwa kombinasi regressor Anda harus stasioner. Jadi saya percaya bahwa mungkin Anda harus melakukan regresi dua langkah. Di yang pertama Anda menemukan hubungan stasioner dari variabel Anda, maka Anda menempatkan hubungan ini ke dalam model probit / logit Anda dan memperkirakan hanya satu parameter.

Tentunya pada langkah pertama Anda harus memiliki daftar dua variabel terintegrasi (dalam kasus kointegrasi) atau setidaknya dua variabel dengan jenis tren tren yang sama. Jika ini bukan masalahnya Anda memiliki masalah variabel dihilangkan.

Alternatif untuk semua ini adalah Anda mengubah cakupan analisis Anda dan mengubah semua regresi Anda menjadi yang diam.

Cerbero
sumber
3

Saya menyarankan melihat hasil di Chang Jiang Park (2006) dan Park, Phillips (2000) . * Menurut makalah pertama, penduga logit konsisten bahkan dalam kasus seri terintegrasi (teorema 2 di halaman 6-7) dan biasanya t-statistik dapat digunakan untuk parameter yang menarik dalam kasus Anda (koefisien pada regressor). Makalah lain dari penulis yang sama mengembangkan teori ekonometrik untuk kasus lain dari proses non-stasioner dalam model non-linear.

* Makalah-makalah ini hanya memperlakukan teori, sayangnya saya tidak dapat menemukan contoh makalah empiris yang sebenarnya menyebutkan masalah non-stasioneritas dalam konteks ini.

Giuseppe
sumber
1

Saya tahu posting ini sudah tua tetapi orang-orang melakukan pencarian dan sering menggunakan barang-barang ini sebagai referensi.

Mari kita tetap sederhana. Mari kita memiliki model probabilitas individu gagal bayar hipotek sebagai Y. Sekarang mari kita jalankan level GDP di atasnya. Katakanlah data Anda adalah 2002-2017, setiap triwulan. Anda memiliki jutaan pengamatan yang pada waktu T semuanya berbagi variabel ekon yang sama. Saya memilih kerangka waktu ini untuk alasan yang bagus.

Apa yang akan Anda dapatkan sebagai suatu hubungan? Oh man, Anda akan menemukan shazaam itu, GDP yang lebih rendah berkorelasi dengan default yang lebih tinggi. Terlihat bagus kan?

Tapi sekarang mari kita ramalkan ini, katakan 50 tahun (untuk bersenang-senang). Ambil PDB yang diharapkan pada tingkat pertumbuhan historis, katakanlah 2%, dan ekstrapolasi PDB. Sekarang jalankan ramalan. Apa yang kamu temukan Shazaam, seperti sulap, probabilitas default akan cenderung ke 0%.

Anda akan mendapatkan sebaliknya jika Anda memilih jumlah total penganggur (bukan tingkat). Anda akan menemukan shazaam itu, memperkirakannya di masa depan dan kemungkinan tren default menjadi 100%.

Keduanya konyol. Dan inilah kickernya. Jika Anda melakukan tes stasioner pada beberapa kerangka waktu ini, Anda akan menemukan bahwa itu stasioner. Alasannya adalah Anda dapat memotong seri non stasioner menjadi bagian stasioner. Terutama karena PDB Riil meningkat, menurun, dan meningkat dalam periode waktu.

Ya, sampel dalam Anda akan terlihat bagus. Tetapi perkiraan Anda tidak akan berarti.

Saya sering melihat ini dalam pemodelan metrik risiko.

stratozyck
sumber
-1

Anda jelas baik-baik saja dari sudut pandang teoritis. Ini adalah pemahaman yang keliru dari seri non-stasioner bahwa mereka memiliki cara yang berubah. Mereka tidak berarti. Rata-rata sampel adalah angka acak karena konvergen ke titik tidak ada dan tampaknya berubah. Ini juga bukan masalah untuk logit atau probit.

Model statistik adalah pemetaan dan tidak ada alasan seseorang tidak dapat membungkus seri yang tidak terikat menjadi seri yang dibatasi. Misalnya, garis bilangan real biasanya dianggap tidak memiliki panjang sama sekali, tetapi membungkusnya di sekitar lingkaran dengan kutub selatan menjadi 0 dan kutub utara menjadi dan untuk lingkaran satuan, seluruh garis bilangan sekarang memiliki panjang π.

Dengan memetakan seri non-stasioner ke set yang dibatasi dengan baik, Anda telah menciptakan masalah yang terikat dengan baik karena solusi utamanya harus memetakan ke interval [0,1].

Semua rasio akuntansi harus tidak memiliki varian dan semua pengembalian keuangan harus memiliki varian. Lihat kertas di https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2828744

Anda tidak perlu khawatir tentang kesalahan kuat secara intrinsik. Ini adalah kesalahpahaman dari seri non-stasioner bahwa mereka heteroskedastik. Mereka tidak; mereka ditanyai karena mereka tidak memiliki maksud untuk membentuk varian tentang di tempat pertama, jadi itu lagi-lagi angka acak. Struktur istilah kesalahan lebih berkaitan dengan model yang memetakan daripada kurangnya stasioneritas.

Di mana Anda bisa menghadapi masalah adalah dengan konsep kovarians. Distribusi pengembalian ekuitas berasal dari distribusi yang tidak memiliki matriks kovarians. Bukannya saham tidak bisa bergerak, tetapi mereka tidak bisa menjadi kovari. Hal yang sama berlaku untuk ekonomi. Ini adalah konsep yang lebih kompleks daripada kovarian yang merupakan hubungan sederhana. Anda akan ingin membaca makalah di atas dan memikirkan hubungan model Anda dengan hati-hati.

Dave Harris
sumber