Model linier nonlinear vs. umum: Bagaimana Anda merujuk pada regresi logistik, Poisson, dll.?

23

Saya memiliki pertanyaan tentang semantik yang saya inginkan tentang pendapat sesama ahli statistik.

Kita tahu model seperti logistik, Poisson, dll. Jatuh di bawah payung model linear umum. Model ini mencakup fungsi-fungsi nonlinear dari parameter, yang pada gilirannya dapat dimodelkan menggunakan kerangka model linier dengan menggunakan fungsi tautan yang sesuai.

Saya ingin tahu apakah Anda mempertimbangkan (mengajar?) Situasi seperti regresi logistik sebagai:

  1. Model nonlinear, diberi bentuk parameter
  2. Model linear, karena tautan mengubah kita ke kerangka model linier
  3. Secara bersamaan (1) dan (2): Ini "dimulai" sebagai model nonlinear, tetapi dapat dikerjakan dengan cara yang memungkinkan kita untuk menganggapnya sebagai model linier

Seandainya saya bisa mengatur jajak pendapat yang sebenarnya ...

Meg
sumber

Jawaban:

24

Ini pertanyaan yang bagus.

Kita tahu model seperti logistik, Poisson, dll. Jatuh di bawah payung model linear umum.

Ya dan tidak. Mengingat konteks pertanyaan, kita harus cukup berhati-hati untuk menentukan apa yang kita bicarakan - dan "logistik" dan "Poisson" saja tidak cukup untuk menggambarkan apa yang dimaksudkan.

(i) "Poisson" adalah distribusi. Sebagai deskripsi distribusi bersyarat, ini bukan linear (dan karenanya bukan GLM) kecuali jika Anda menentukan model linear (dalam parameter) untuk menggambarkan mean bersyarat (artinya tidak cukup hanya dengan mengatakan "Poisson"). Ketika orang-orang menentukan "Poisson regresi", mereka hampir selalu berniat untuk model yang adalah linear dalam parameter, dan karena itu GLM a. Tapi "Poisson" sendiri bisa menjadi banyak hal *.

(ii) "Logistik" di sisi lain mengacu pada deskripsi rata-rata (bahwa rata-rata adalah logistik dalam prediktor). Ini bukan GLM kecuali jika Anda menggabungkannya dengan distribusi bersyarat yang ada dalam keluarga eksponensial. Ketika orang mengatakan " regresi logistik " di sisi lain, mereka hampir selalu berarti model binomial dengan tautan logit - yang memang berarti bahwa itu logistik dalam prediktor, modelnya linear dalam parameter dan berada dalam keluarga eksponensial, begitu pula GLM.

Model ini mencakup fungsi parameter nonlinier,

Sekali lagi, ya dan tidak.

η=g(μ)η=Xβ

yang pada gilirannya dapat dimodelkan menggunakan kerangka model linier dengan menggunakan fungsi tautan yang sesuai.

Benar

Saya ingin tahu apakah Anda mempertimbangkan (mengajar?) Situasi seperti regresi logistik sebagai:

(Saya mengubah urutan pertanyaan Anda di sini)

Model linear, karena tautan mengubah kita ke kerangka model linier

Itu konvensional untuk memanggil GLM "linear", untuk alasan inilah. Memang, cukup jelas bahwa ini adalah konvensi, karena ada di sana dalam nama .

Model nonlinear, diberi bentuk parameter

Kita harus sangat berhati-hati di sini, karena "nonlinier" umumnya mengacu pada model yang nonlinier dalam parameter. Kontras regresi nonlinier dengan model linier umum.

Jadi, jika Anda ingin menggunakan istilah "nonlinear" untuk menggambarkan GLM, penting untuk menentukan dengan hati-hati apa yang Anda maksud - secara umum, bahwa rata-rata tidak terkait linear dengan prediktor.

Memang, jika Anda menggunakan "nonlinear" untuk merujuk ke GLM, Anda akan mendapatkan kesulitan tidak hanya dengan konvensi (dan kemungkinan akan disalahpahami), tetapi juga ketika mencoba untuk berbicara tentang model nonlinier umum . Agak sulit untuk menjelaskan perbedaannya jika Anda sudah mengkarakterisasi GLM sebagai "model nonlinear"!

g(μ)

YPoisson(μx)

xYxμxx

μx=α+exp(βx).

xα

Di sini istilah pertama mewakili tingkat kematian yang konstan karena (katakanlah) kecelakaan (atau efek lain yang tidak banyak berkaitan dengan usia) sedangkan istilah kedua memiliki tingkat kematian yang meningkat karena usia. Model seperti itu mungkin kadang-kadang layak dilakukan pada rentang pendek usia dewasa-tetapi-bukan-tua; itu pada dasarnya adalah hukum Makeham (ditampilkan sebagai fungsi bahaya, tetapi untuk itu tingkat tahunan akan menjadi perkiraan yang masuk akal).

Itu model nonlinier umum.

Glen_b -Reinstate Monica
sumber
Terima kasih atas masukan Anda. Inilah yang saya coba sampaikan. Jelas "linear" adalah atas nama GLM. Saya mencoba untuk mengklasifikasikan model-model yang secara inheren nonlinear (mereka adalah nonlinear dalam parameter), namun "transformably linear," dan dengan demikian jatuh di bawah kerangka GLM. Saya kira mungkin saya baru saja menjawab pertanyaan saya sendiri - cara terbaik untuk merujuk kepada mereka adalah "berubah secara nonlinier."
Meg
1
Cara yang lebih umum untuk merujuk pada model yang dapat diberikan linear dalam parameter oleh transformasi adalah "linierzable" (berbeda dengan "instrincically nonlinear"). Saya pikir kita perlu jelas apa itu linear (vs apa yang nonlinier) ketika membahas model, dan mungkin juga harus jelas bagaimana hal-hal seperti itu secara konvensional disebut, karena orang-orang harus dapat menemukan informasi dan juga untuk dipahami saat mendiskusikannya. Seseorang yang berbicara tentang GLM sebagai "nonlinear" cenderung disalahpahami, kecuali jika mereka menambahkan kualifikasi yang benar yang membuat maknanya jelas.
Glen_b -Reinstate Monica
Saya setuju. Saya hanya melihatnya diklasifikasikan sebagai regresi nonlinear dalam teks dan juga telah diajarkan oleh profesor saya bahwa itu nonlinier. Saya pribadi menganggapnya membingungkan karena kita berurusan dengannya dalam kerangka kerja GLM, namun saya bisa (semacam, setidaknya) berempati dengan menyebutnya juga. Saya pikir saya akan menggunakan linear / transformable linear dan diskusi tentang bagaimana kita mendapatkan dari titik A ke titik B (yaitu, bagaimana kita mulai dengan fungsi nonlinear dan mengubahnya ke kerangka linear).
Meg
Ya, saya sangat mengerti. Sementara saya juga berempati dengan dorongan mereka untuk melakukannya, jika saya memiliki telinga mereka, saya akan memperingatkan mereka terhadap praktik memanggil mereka model nonlinier (setidaknya tidak tanpa selalu memenuhi syarat istilah), untuk alasan yang saya uraikan di atas. Itu adalah bagian besar dari mengapa saya pikir ini adalah pertanyaan penting - orang kadang-kadang menyebutnya nonlinier, yang menurut saya baik-baik saja selama kita jelas tentang apa yang kita sebut nonlinier, karena itu bukan cara paling konvensional untuk lihat model - ketika kita menentang konvensi, kita harus melakukannya dengan hati-hati dan sengaja.
Glen_b -Reinstate Monica