Saya memiliki satu set angka yang dianggap berasal dari distribusi Poisson. Himpunan memiliki beberapa pencilan juga dan karena itu, perkiraan kemungkinan maksimum sangat terpengaruh. Saya mendengar bahwa prosedur estimasi yang kuat dapat membantu dalam situasi seperti itu. Adakah yang bisa menjelaskan cara melakukan ini? Saya bukan mahasiswa statistik.
Saya menemukan bahwa glmrob
fungsi dalam R dapat digunakan untuk ini. (Saya cukup baru di R). Tapi saya tidak tahu, bagaimana menggunakannya meskipun membaca halaman buku panduan. Secara khusus saya tidak dapat memahami bagaimana cara mendapatkan forumula
argumen pertama untuk fungsi glmrob.
Terima kasih.
sumY ~ Age10 + Base4*Trt
. Dengan data yang saya miliki, saya tidak dapat membuat formula seperti itu. Saya hanya memiliki banyak angka yang dianggap berasal dari distribusi Poisson. Seperti yang saya pahami, saya tidak memiliki variabel dependen dan variabel independen dan mungkin itu sebabnya saya tidak dapat membuat formula.y~1
.Jawaban:
@ cardinal telah mengirim telegram jawaban dalam komentar. Mari kita menyempurnakannya. Maksudnya adalah bahwa meskipun model linier umum (seperti yang diterapkan oleh
lm
dan, dalam hal ini,glmRob
) tampaknya dimaksudkan untuk mengevaluasi hubungan antar variabel, mereka dapat menjadi alat yang kuat untuk mempelajari variabel tunggal, juga. Triknya bergantung pada fakta bahwa regresi data terhadap konstanta hanyalah cara lain untuk memperkirakan nilai rata-rata ("lokasi") .Sebagai contoh, hasilkan beberapa data yang didistribusikan Poisson:
Dalam hal ini,(1,5,2,3,2,2,1,1,3,1) nilai-nilai 2 . Perkirakan lokasinya dengan
R
akan menghasilkan vektorx
dari dari distribusi Poisson rata-rataglmRob
:Responsnya memberi tahu kami bahwa intersep diperkirakan sebesar0.7268 . Tentu saja, siapa pun yang menggunakan metode statistik perlu tahu cara kerjanya: ketika Anda menggunakan model linier umum dengan keluarga Poisson, fungsi "tautan" standar adalah logaritma. Ini berarti intersep adalah logaritma dari perkiraan lokasi. Jadi kami menghitung
Hasil,2.0685 , Nyaman dekat dengan 2 : prosedur tampaknya berhasil. Untuk melihat apa yang dilakukannya, plot data:
Garis yang dipasang murni horizontal dan karenanya memperkirakan nilai tengah vertikal: data kami. Hanya itu yang terjadi.
Untuk memeriksa ketahanan, mari kita buat outlier yang buruk dengan menempelkan beberapa nol pada nilai pertama
x
:Kali ini, untuk fleksibilitas yang lebih besar dalam pasca-pemrosesan, kami akan menghemat output dari
glmRob
:Untuk mendapatkan perkiraan rata-rata kami dapat meminta
Nilai kali ini sama dengan2.496 : sedikit off, tetapi tidak terlalu jauh, mengingat bahwa nilai rata-rata 12 . Itulah arti di mana prosedur ini "kuat." Informasi lebih lanjut dapat diperoleh melalui
x
(diperoleh sebagaimean(x)
) adalahOutputnya menunjukkan kepada kita, antara lain, bahwa bobot terkait dengan nilai outlying dari100 di 0.02179 hampir 0 , menunjukkan outlier yang dicurigai.
x[1]
adilsumber