Saya mencari ukuran yang sesuai dari "varians yang dijelaskan" dari Poisson GLM (menggunakan fungsi log-link).
Saya telah menemukan sejumlah sumber daya yang berbeda (baik di situs ini dan di tempat lain) yang membahas sejumlah pseudo- berbeda tindakan, tetapi hampir setiap situs menyebutkan langkah-langkah dalam kaitannya dengan fungsi link-logit, dan mereka tidak membahas apakah pseudo- ukurannya sesuai untuk fungsi tautan lainnya, seperti tautan-log untuk GLM distribusi Poisi saya.
Sebagai contoh, berikut adalah beberapa situs yang saya temukan:
Yang pseudo- ukuran apakah yang dilaporkan untuk regresi logistik (Cox & Snell atau Nagelkerke)?
http://thestatsgeek.com/2014/02/08/r-squared-in-logistic-regress/
http://www.ats.ucla.edu/stat/mult_pkg/faq/general/Psuedo_RSquareds.htm
Pertanyaan saya adalah: Apakah ada metode yang dibahas pada tautan tersebut (khususnya, FAQ pada halaman UCLA) yang sesuai untuk PoM GLM (menggunakan fungsi log-link)? Apakah ada metode tertentu yang lebih tepat dan / atau standar digunakan daripada metode lain?
Beberapa latar belakang:
Ini untuk makalah penelitian di mana saya menggunakan PoMisi GLM untuk menganalisis data saraf. Saya menggunakan penyimpangan model (dihitung dengan asumsi distribusi Poission) untuk membandingkan dua model: Satu model (A) yang mencakup 5 parameter yang ditinggalkan dari model lainnya (B). Ketertarikan saya (dan fokus makalah ini) adalah untuk menunjukkan bahwa 5 parameter secara statistik meningkatkan kesesuaian model. Namun, salah satu pengulas ingin indikasi seberapa baik kedua model tersebut cocok dengan data.
Jika saya menggunakan OLS agar sesuai dengan data saya, pengulas secara efektif meminta nilai untuk kedua model dengan 5 parameter dan tanpa parameter 5, untuk menunjukkan seberapa baik model menjelaskan perbedaan. Sepertinya permintaan yang masuk akal bagi saya. Katakanlah, secara hipotesis, model B memiliki 0,05 dan model A memiliki 0,25: meskipun itu mungkin merupakan peningkatan yang signifikan secara statistik, model tidak melakukan pekerjaan yang baik untuk menjelaskan data. Atau, jika model B memiliki 0,5 dan model A memiliki 0,7, yang bisa ditafsirkan dengan cara yang sangat berbeda. Saya mencari ukuran yang paling tepat yang dapat diterapkan dengan cara yang mirip dengan GLM saya.
sumber
Jawaban:
McCullagh dan Nelder 1989 (halaman 34) memberikan fungsi penyimpanganD untuk distribusi Poisson:
di mana y mewakili data Anda danμ output model Anda. Saya menggunakan fungsi ini untuk memperkirakan penyimpangan yang dijelaskanED dari GLM dengan distribusi Poisson seperti ini:
di mana penyimpangan total diberikan oleh persamaan yang sama untukD tetapi menggunakan rata-rata y (nomor tunggal, yaitu, mean(y) ) bukannya array perkiraan yang dimodelkan μ .
Saya tidak tahu apakah ini 100% benar, kedengarannya logis bagi saya dan tampaknya berfungsi seperti yang Anda harapkan perkiraan penyimpangan yang dijelaskan untuk bekerja (itu memberi Anda 1 jika Anda menggunakanμ=y , dll).
sumber