Pengetahuan saya (yang sangat mendasar) tentang model regresi Tobit bukan dari kelas, seperti yang saya inginkan. Sebaliknya, saya telah mengambil potongan-potongan informasi di sana-sini melalui beberapa pencarian Internet. Tebakan terbaik saya pada asumsi untuk regresi terpotong adalah bahwa mereka sangat mirip dengan asumsi kuadrat terkecil biasa (OLS). Saya tidak tahu apakah itu benar.
Maka pertanyaan saya: Apa asumsi yang harus saya periksa ketika melakukan regresi Tobit?
Catatan: Bentuk asli dari pertanyaan ini merujuk pada regresi terpotong, yang bukan model yang saya gunakan atau tanyakan. Saya sudah mengoreksi pertanyaannya.
regression
assumptions
Firefeather
sumber
sumber
Jawaban:
Jika kita mencari jawaban yang sederhana, kutipan dari buku Wooldridge (halaman 533) sangat tepat:
... heteroskedastisitas dan nonnormalitas mengakibatkan estimator Tobit tidak konsisten untuk . Ketidakkonsistenan ini terjadi karena kerapatan turunan diberikan bergantung secara krusial pada . Ketidakpastian dari penaksir Tobit ini menunjukkan bahwa penyensoran data bisa sangat mahal: jika tidak ada penyensoran ( ) dapat secara konsisten diperkirakan di bawah [atau bahkan ]. ßyxy*| x∼Normal(xβ,σ2)y=y∗βE(u|x)=0E(x′u)=0β^ β y x y∗|x∼Normal(xβ,σ2) y=y∗ β E(u|x)=0 E(x′u)=0
Notasi dalam kutipan ini berasal dari model Tobit:
Untuk meringkas perbedaan antara kuadrat terkecil dan regresi Tobit adalah asumsi bawaan dari normalitas dalam yang terakhir.
Juga saya selalu berpikir bahwa artikel asli Amemyia cukup bagus dalam meletakkan fondasi teoritis dari regresi Tobit.
sumber
Untuk mengomentari komentar Aniko: Asumsi utama adalah adanya pemotongan. Ini bukan asumsi yang sama dengan dua kemungkinan lain yang disarankan pos Anda kepada saya: batasan dan pemilihan sampel.
Jika Anda memiliki variabel dependen yang terikat secara fundamental daripada yang terpotong, Anda mungkin ingin pindah ke kerangka kerja model linier umum dengan salah satu (kurang sering dipilih) distribusi untuk Y misalnya log-normal, gamma, eksponensial, dll. Yang menghormati itu batas bawah.
Atau Anda mungkin bertanya pada diri sendiri apakah Anda berpikir bahwa proses yang menghasilkan pengamatan nol dalam model Anda adalah sama dengan yang menghasilkan nilai-nilai positif yang ketat - harga dalam aplikasi Anda, saya pikir. Jika ini bukan masalahnya, maka sesuatu dari kelas model pemilihan sampel , (misalnya model Heckman) mungkin sesuai. Dalam hal ini Anda akan berada dalam situasi menentukan satu model yang bersedia membayar harga berapa pun, dan model lain berapa harga yang akan dibayar subjek Anda jika mereka ingin membayar sesuatu.
Singkatnya, Anda mungkin ingin meninjau perbedaan antara asumsi variabel terpotong, disensor, terikat, dan sampel yang dipilih. Yang mana yang Anda inginkan akan datang dari rincian aplikasi Anda. Setelah asumsi paling penting pertama dibuat, Anda dapat lebih mudah menentukan apakah Anda menyukai asumsi spesifik model apa pun di kelas yang Anda pilih. Beberapa model pemilihan sampel memiliki asumsi yang agak sulit untuk diperiksa ...
sumber
@Firefeather: Apakah data Anda mengandung (dan hanya dapat benar-benar mengandung) hanya nilai positif? Jika demikian, modelkan itu menggunakan model linier umum dengan kesalahan gamma dan tautan log. Jika mengandung nol maka Anda dapat mempertimbangkan dua tahap (regresi logistik untuk probabilitas nol dan regresi gamma untuk nilai-nilai positif). Skenario terakhir ini juga dapat dimodelkan sebagai regresi tunggal menggunakan gamma nol yang meningkat. Beberapa penjelasan yang bagus tentang ini diberikan pada daftar SAS beberapa tahun yang lalu. Mulai di sini jika tertarik dan cari tindak lanjut. teks tautan
Mungkin bisa membantu Anda ke arah lain jika regresi terpotong ternyata tidak masuk akal.
sumber
Seperti yang telah disebutkan orang lain di sini, aplikasi utama regresi tobit adalah di mana ada sensor data. Tobit banyak digunakan dalam hubungannya dengan Data Envelopment Analysis (DEA) dan oleh para ekonom. Dalam DEA, skor efisiensi terletak di antara 0 dan 1, yang berarti bahwa variabel dependen disensor di 0 dari kiri dan 1 dari kanan. Oleh karena itu, penerapan regresi linier (OLS) tidak layak.
Tobit adalah kombinasi dari probit dan regresi terpotong. Perawatan harus diambil saat membedakan sensor dan pemotongan:
Tobit = Probit + Regresi Pemotongan
Model Tobit mengasumsikan normalitas seperti halnya model probit.
Langkah:
Model probit memutuskan apakah variabel dependen adalah 0 atau 1. Jika variabel dependen adalah 1 maka dengan berapa banyak (dengan asumsi sensor pada 0) .
Koefisien sama untuk kedua model keputusan. adalah istilah koreksi untuk menyesuaikan nilai yang disensor (nol).β σλ(x′βσ)
Silakan juga periksa model Cragg di mana Anda dapat menggunakan berbeda di setiap langkah.β
sumber