Derajat kebebasan residual yang sesuai setelah menjatuhkan persyaratan dari suatu model

27

Saya merenungkan diskusi seputar pertanyaan ini dan khususnya komentar Frank Harrell bahwa estimasi untuk varians dalam model yang dikurangi (yaitu satu dari mana sejumlah variabel penjelas telah diuji dan ditolak) harus menggunakan Tingkat Kemerdekaan Umum Ye . Profesor Harrell menunjukkan ini akan jauh lebih dekat dengan derajat sisa kebebasan dari model "penuh" asli (dengan semua variabel dalam) daripada dari model akhir (dari mana sejumlah variabel telah ditolak).

Pertanyaan 1. Jika saya ingin menggunakan pendekatan yang tepat untuk semua ringkasan standar dan statistik dari model yang diperkecil (tapi singkatnya implementasi Generalized Degrees of Freedom), apakah pendekatan yang masuk akal adalah dengan hanya menggunakan sisa derajat kebebasan dari model lengkap dalam perkiraan saya tentang varian residual, dll?

Pertanyaan 2. Jika hal di atas benar dan saya ingin melakukannya R, mungkin sesederhana pengaturan

finalModel$df.residual <- fullModel$df.residual

di beberapa titik dalam latihan pemasangan model, di mana finalModel dan fullModel dibuat dengan lm () atau fungsi serupa. Setelah fungsi seperti ringkasan () dan confint () tampaknya bekerja dengan df.resid yang diinginkan, meskipun mengembalikan pesan kesalahan bahwa seseorang telah jelas mucking sekitar dengan objek finalModel.

Peter Ellis
sumber
8
Pertanyaan bagus. Ini terkait dengan mengapa Douglas Bates tidak memasukkan nilai-p dalam lmeroutput. Lihat alasannya di sini .
2
Saya telah melihat model penuh df digunakan dalam situasi seperti itu lebih dari sekali. (Pendekatan Ye muncul banyak dalam situasi yang berbeda; ini adalah makalah yang saya rekomendasikan kepada orang-orang secara teratur. Akan menyenangkan jika memiliki beberapa fungsi R yang umum tetapi efisien yang dapat dimanfaatkan banyak fungsi.)
Glen_b -Reinstate Monica

Jawaban:

3

Apakah Anda tidak setuju dengan jawaban @ FrankHarrel bahwa kekikiran datang dengan beberapa pertukaran ilmiah yang buruk?

Saya suka tautan yang disediakan dalam komentar @ MikeWiezbicki kepada alasan Doug Bates. Jika seseorang tidak setuju dengan analisis Anda, mereka dapat melakukannya dengan cara mereka, dan ini adalah cara yang menyenangkan untuk memulai diskusi ilmiah tentang asumsi dasar Anda. Nilai p tidak menjadikan kesimpulan Anda sebagai "kebenaran absolut".

Jika keputusan apakah atau tidak untuk memasukkan parameter dalam model Anda datang ke "memilih rambut" atas apa, untuk sampel bermakna secara ilmiah, perbedaan yang relatif kecil dalam df - dan Anda tidak berurusan dengan masalah yang membenarkan inferensi yang lebih bernuansa, bagaimanapun - maka Anda memiliki param yang sangat dekat untuk memenuhi cutoff Anda sehingga Anda harus transparan dan membicarakannya dengan cara apa pun: cukup sertakan, atau analisis model dengan dan tanpa itu, tetapi jelas-jelas membahas keputusan Anda secara transparan. analisis akhir. n<hal

egbutter
sumber
2
+1 dan saya sekarang cenderung setuju bahwa sebenarnya pertanyaan awal saya tidak begitu penting mengingat masalah-masalah lain ini
Peter Ellis