Apa asumsi untuk menerapkan model regresi Tobit?

9

Pengetahuan saya (yang sangat mendasar) tentang model regresi Tobit bukan dari kelas, seperti yang saya inginkan. Sebaliknya, saya telah mengambil potongan-potongan informasi di sana-sini melalui beberapa pencarian Internet. Tebakan terbaik saya pada asumsi untuk regresi terpotong adalah bahwa mereka sangat mirip dengan asumsi kuadrat terkecil biasa (OLS). Saya tidak tahu apakah itu benar.

Maka pertanyaan saya: Apa asumsi yang harus saya periksa ketika melakukan regresi Tobit?

Catatan: Bentuk asli dari pertanyaan ini merujuk pada regresi terpotong, yang bukan model yang saya gunakan atau tanyakan. Saya sudah mengoreksi pertanyaannya.

regression assumptions Firefeather
sumber

1

Anda tidak boleh menggunakan regresi terpotong hanya karena Anda memiliki data miring atau terikat. Ini khusus untuk situasi ketika nilai di bawah ambang batas (misalnya nilai negatif) dimungkinkan, tetapi tidak akan diamati karena alasan tertentu. Apakah itu situasi yang Anda miliki?

Aniko

@ Aniko, nilai-nilai negatif dari variabel dependen tidak benar-benar masuk akal (itu berarti dibayar untuk menerima layanan), tetapi saya pernah mendengar bahwa Wooldridge (dalam Analisis Ekonometrik dari Cross Section dan Panel Data , 2002) merekomendasikan terpotong atau model regresi disensor bukan OLS ketika

P (Y = 0) > 0

$P(Y=0)>0$ namun

Y

$Y$ adalah variabel acak kontinu atas nilai-nilai positif.

Firefeather

Kesalahan besar; Saya menyadari bahwa yang saya maksud adalah regresi Tobit sepanjang waktu, bukan regresi terpotong . Saya baru saja mengubah pertanyaan untuk mencerminkan kesalahan ini.

Firefeather

Referensi Wooldridge masih merupakan referensi yang benar; yaitu, mengacu pada regresi Tobit.

Firefeather

Aniko benar, tobit itu mungkin bukan pilihan terbaik. Lihatlah yang berikut untuk mencari tahu tentang alternatif: ideas.repec.org/p/boc/bost10/2.html

6

Jika kita mencari jawaban yang sederhana, kutipan dari buku Wooldridge (halaman 533) sangat tepat:

... heteroskedastisitas dan nonnormalitas mengakibatkan estimator Tobit tidak konsisten untuk . Ketidakkonsistenan ini terjadi karena kerapatan turunan diberikan bergantung secara krusial pada . Ketidakpastian dari penaksir Tobit ini menunjukkan bahwa penyensoran data bisa sangat mahal: jika tidak ada penyensoran ( ) dapat secara konsisten diperkirakan di bawah [atau bahkan ]. $\hat{\beta}$ $\beta$ $y$ $x$ $y^*|x\sim\mathrm{Normal}(x\beta,\sigma^2)$ $y=y^*$ $\beta$ $E(u|x)=0$ $E(x'u)=0$

Notasi dalam kutipan ini berasal dari model Tobit:

\begin{aligned} y^{*} & = x β + u, u | x \sim N (0, σ^{2}) \\ y^{*} & = max (y^{*}, 0) \end{aligned}

$\begin{align} y^{*}&=x\beta+u, \quad u|x\sim N(0,\sigma^2)\\ y^{*}&=\max(y^*,0) \end{align}$ mana dan diamati.

y

$y$

x

$x$

Untuk meringkas perbedaan antara kuadrat terkecil dan regresi Tobit adalah asumsi bawaan dari normalitas dalam yang terakhir.

Juga saya selalu berpikir bahwa artikel asli Amemyia cukup bagus dalam meletakkan fondasi teoritis dari regresi Tobit.

mpiktas
sumber

Wow! Terima kasih telah menemukan referensi yang dapat dilihat — saya tidak pernah berpikir untuk mencari di Google Buku ketika mencari salinan buku Wooldridge.

Firefeather

4

Untuk mengomentari komentar Aniko: Asumsi utama adalah adanya pemotongan. Ini bukan asumsi yang sama dengan dua kemungkinan lain yang disarankan pos Anda kepada saya: batasan dan pemilihan sampel.

Jika Anda memiliki variabel dependen yang terikat secara fundamental daripada yang terpotong, Anda mungkin ingin pindah ke kerangka kerja model linier umum dengan salah satu (kurang sering dipilih) distribusi untuk Y misalnya log-normal, gamma, eksponensial, dll. Yang menghormati itu batas bawah.

Atau Anda mungkin bertanya pada diri sendiri apakah Anda berpikir bahwa proses yang menghasilkan pengamatan nol dalam model Anda adalah sama dengan yang menghasilkan nilai-nilai positif yang ketat - harga dalam aplikasi Anda, saya pikir. Jika ini bukan masalahnya, maka sesuatu dari kelas model pemilihan sampel , (misalnya model Heckman) mungkin sesuai. Dalam hal ini Anda akan berada dalam situasi menentukan satu model yang bersedia membayar harga berapa pun, dan model lain berapa harga yang akan dibayar subjek Anda jika mereka ingin membayar sesuatu.

Singkatnya, Anda mungkin ingin meninjau perbedaan antara asumsi variabel terpotong, disensor, terikat, dan sampel yang dipilih. Yang mana yang Anda inginkan akan datang dari rincian aplikasi Anda. Setelah asumsi paling penting pertama dibuat, Anda dapat lebih mudah menentukan apakah Anda menyukai asumsi spesifik model apa pun di kelas yang Anda pilih. Beberapa model pemilihan sampel memiliki asumsi yang agak sulit untuk diperiksa ...

conjugateprior
sumber

3

@Firefeather: Apakah data Anda mengandung (dan hanya dapat benar-benar mengandung) hanya nilai positif? Jika demikian, modelkan itu menggunakan model linier umum dengan kesalahan gamma dan tautan log. Jika mengandung nol maka Anda dapat mempertimbangkan dua tahap (regresi logistik untuk probabilitas nol dan regresi gamma untuk nilai-nilai positif). Skenario terakhir ini juga dapat dimodelkan sebagai regresi tunggal menggunakan gamma nol yang meningkat. Beberapa penjelasan yang bagus tentang ini diberikan pada daftar SAS beberapa tahun yang lalu. Mulai di sini jika tertarik dan cari tindak lanjut. teks tautan

Mungkin bisa membantu Anda ke arah lain jika regresi terpotong ternyata tidak masuk akal.

B_Miner
sumber

2

Seperti yang telah disebutkan orang lain di sini, aplikasi utama regresi tobit adalah di mana ada sensor data. Tobit banyak digunakan dalam hubungannya dengan Data Envelopment Analysis (DEA) dan oleh para ekonom. Dalam DEA, skor efisiensi terletak di antara 0 dan 1, yang berarti bahwa variabel dependen disensor di 0 dari kiri dan 1 dari kanan. Oleh karena itu, penerapan regresi linier (OLS) tidak layak.

Tobit adalah kombinasi dari probit dan regresi terpotong. Perawatan harus diambil saat membedakan sensor dan pemotongan:

Sensor: Ketika batas pengamatan ada dalam sampel. Nilai variabel dependen mencapai batas baik ke kiri atau kanan.
Pemotongan: Pengamatan di mana kisaran tertentu dari nilai-nilai dependen tidak termasuk dalam penelitian ini. Misalnya, hanya nilai positif. Pemotongan memiliki kehilangan informasi yang lebih besar daripada menyensor.

Tobit = Probit + Regresi Pemotongan

Model Tobit mengasumsikan normalitas seperti halnya model probit.

Langkah:

Model probit memutuskan apakah variabel dependen adalah 0 atau 1. Jika variabel dependen adalah 1 maka dengan berapa banyak (dengan asumsi sensor pada 0) .
$\begin{matrix} (Discreet decision) & P (y > 0) = Φ (x^{^{'}} β) \end{matrix}$ $P(y>0) = Φ(x^{'} β) \tag{Discreet decision}$
$E(y│y>0)= x^{'} β+ σλ\big(\frac{x^{'} β}{σ}\big) \tag{Continuous decision}$

Koefisien sama untuk kedua model keputusan. adalah istilah koreksi untuk menyesuaikan nilai yang disensor (nol). $β$ $σλ\big(\frac{x^{'} β}{σ}\big)$

Silakan juga periksa model Cragg di mana Anda dapat menggunakan berbeda di setiap langkah. $β$

Amar nayak
sumber

Selamat datang di situs ini, @Amarnayak. Saya telah mengedit posting Anda untuk menggunakan format -type. Harap pastikan masih mengatakan apa yang Anda inginkan.

L A T E X

$\LaTeX$

gung - Reinstate Monica

Apa asumsi untuk menerapkan model regresi Tobit?

Jawaban: