Apa itu "nilai awal" dalam fungsi glm ()?

12

Parameter apa start, etastart, mustartdi GLM () function ? Saya telah mencari di dokumen dan internet tetapi saya belum menemukan penjelasan yang jelas apa artinya ini.

Ini menyerupai "nilai awal" bayesian untuk rantai, tapi saya ragu ini terkait, karena fungsi glm () dalam R adalah statistik frequentist ...

Ingin tahu
sumber

Jawaban:

10

Ini hanya ada hubungannya dengan teknik estimasi - bagaimana seperangkat estimasi untuk parameter dalam model sampai pada. Model linier umum cocok dengan kuadrat terkecil berulang berulang. Seperangkat bobot acak dipilih untuk memulai dengan (seringkali semuanya sama dengan permulaan), kemudian estimasi parameter dalam prediktor linier dipilih yang meminimalkan jumlah bobot kuadrat residu. Parameter yang diestimasi dalam prediktor linier digunakan untuk memperkirakan vektor rata-rata baru. Dari sini seperangkat bobot baru diturunkan - misalnya, tergantung pada keluarga dan fungsi tautan apa yang digunakan, varian respons mungkin proporsional dengan rata-rata respons - sehingga bobot akan berbanding terbalik dengan rata-rata. Kumpulan bobot baru ini digunakan dalam iterasi baru dari seluruh prosedur.

Jadi tiga argumen untuk glm () yang Anda tanyakan hanyalah cara bagi pengguna untuk memulai prosedur di beberapa titik arbitrer alih-alih membiarkannya memilih titik awal default sendiri. Dari file bantuan yang Anda tautkan ke:

  • mulai - nilai awal untuk parameter dalam prediktor linier.
  • etastart - nilai awal untuk prediktor linier.
  • mustart - nilai awal untuk vektor mean.
Peter Ellis
sumber
Peter terima kasih! Ini benar-benar menyerupai prosedur MCMC bayesian! Saya pikir paket frequentist lebih pintar dan tidak bekerja seperti itu :-) Ini yang saya bingungkan ... mengapa ada sesuatu seperti nilai awal dalam paket frequentist :-)
Curious
1
Terkadang tanpa nilai awal Anda bisa gagal untuk konvergen, atau konvergen pada maksimum lokal yang bukan solusi optimal secara global. Jadi ada baiknya memiliki opsi untuk mencoba nilai awal yang berbeda.
Peter Ellis
Saya mulai merasa bahwa bahkan glm()bayesian :-)
Curious
4
@ Curious Ini tidak terlalu bayesian. Yang Anda minta hanyalah paket perangkat lunak untuk menemukan titik tertentu melalui teknik pencarian. Nilai awal hanya memberi tahu di mana untuk memulai - itu tidak memberikan bobot khusus untuk jawaban itu, tetapi dapat membantu jika itu berkeliaran di ruang yang rumit. Tidak ada yang terlalu bayesian tentang "Saya akan mulai dari, katakanlah, 0,05 dan bekerja dari sana ..."
Fomite