Saya sudah memikirkan masalah ini. Fungsi logistik yang biasa untuk memodelkan data biner adalah: Namun adalah fungsi logit, yang merupakan kurva berbentuk S , selalu yang terbaik untuk memodelkan data? Mungkin Anda memiliki alasan untuk percaya bahwa data Anda tidak mengikuti kurva berbentuk S normal tetapi tipe kurva berbeda dengan domain .
Apakah ada penelitian tentang ini? Mungkin Anda bisa memodelkannya sebagai fungsi probit atau sesuatu yang serupa, tetapi bagaimana jika itu adalah sesuatu yang sama sekali berbeda? Bisakah ini menghasilkan estimasi efek yang lebih baik? Hanya sebuah pemikiran yang saya miliki, dan saya ingin tahu apakah ada penelitian tentang hal ini.
logistic
references
link-function
Lembah kecil
sumber
sumber
Jawaban:
Orang-orang menggunakan segala macam fungsi untuk menjaga data mereka antara 0 dan 1. Peluang log keluar secara alami dari matematika saat Anda menurunkan model (ini disebut "fungsi tautan kanonik"), tetapi Anda benar-benar bebas bereksperimen dengan alternatif lain.
Seperti yang disinggung oleh Makro dalam komentarnya tentang pertanyaan Anda, satu pilihan umum adalah model probit , yang menggunakan fungsi kuantil dari Gaussian alih-alih fungsi logistik. Saya juga pernah mendengar hal-hal baik tentang penggunaan fungsi kuantil dari distribusi Student , walaupun saya belum pernah mencobanya.t
Semoga ini membantu.
Diedit untuk menambahkan : Diskusi yang dikaitkan dengan @Macro benar-benar luar biasa. Saya sangat merekomendasikan membacanya jika Anda tertarik lebih detail.
sumber
Saya tidak melihat alasan, a-priori, mengapa fungsi tautan yang sesuai untuk dataset yang diberikan harus berupa logit (meskipun alam semesta tampaknya agak ramah pada kita secara umum). Saya tidak tahu apakah ini yang Anda cari, tapi di sini ada beberapa makalah yang membahas fungsi tautan yang lebih eksotis:
Cauchit (dll.):
Koenker, R., & Yoon, J. (2009). Tautan parametrik untuk model pilihan biner: A Fisherian-Bayesian colloquy . Jurnal Ekonometrika, 152, 2 , hlm. 120-130.
Koenker, R. (2006). Tautan parametrik untuk model pilihan biner . Rnews, 6, 4 , hlm. 32-34.
Scobit :
Nagler, J. (1994). Scobit: Estimator alternatif untuk logit dan probit . American Journal of Political Science, 38, 1 , hlm. 230-255.
Skew-Probit :
Bazan, JL, Bolfarine, H., & Branco, MD (2010). Kerangka kerja untuk tautan condong-probit dalam regresi biner . Komunikasi dalam Statistik - Teori dan Metode, 39 , hlm. 678-697.
(Ini tampak seperti ikhtisar yang baik tentang tautan miring dalam kerangka Bayesian) :
Chen, MH (2004). Model tautan miring untuk data respons kategorikal . Dalam Distribusi Skew-Elliptical dan Aplikasi Mereka: A Journey Beyond Normalality , Marc Genton, editor. Chapman dan Hall.
Pengungkapan: Saya tidak tahu materi ini dengan baik. Saya mencoba berkecimpung dengan Cauchit dan Scobit beberapa tahun yang lalu, tetapi kode saya terus mogok (mungkin karena saya bukan programmer yang hebat), dan sepertinya tidak relevan untuk proyek yang sedang saya kerjakan, jadi saya menjatuhkannya .
sumber
Strategi terbaik adalah memodelkan data berdasarkan apa yang sedang terjadi (Tidak mengejutkan!)
Mungkin tidak ada penelitian tentang model-model ini, meskipun ada banyak penelitian tentang salah satu dari model-model ini, dan pada perbandingan di antara mereka, dan pada berbagai cara memperkirakannya. Apa yang Anda temukan dalam literatur adalah bahwa ada banyak kegiatan untuk sementara waktu, karena peneliti mempertimbangkan sejumlah opsi untuk kelas masalah tertentu, dan kemudian satu metode muncul sebagai yang lebih unggul.
sumber
sumber