Inilah konteks saya untuk pertanyaan ini: Dari apa yang bisa saya katakan, kita tidak bisa menjalankan regresi kuadrat terkecil biasa dalam R ketika menggunakan data tertimbang dan survey
paket. Di sini, kita harus menggunakan svyglm()
, yang sebaliknya menjalankan model linear umum (yang mungkin hal yang sama? Saya bingung di sini dalam hal apa yang berbeda).
Dalam OLS dan melalui lm()
fungsi, ini menghitung nilai R-squared, interpretasi yang saya mengerti. Namun, svyglm()
sepertinya tidak menghitung ini dan malah memberi saya Deviance, yang perjalanan singkat saya di internet mengatakan kepada saya adalah ukuran good-of-fit yang ditafsirkan berbeda dari R-squared.
Jadi saya kira saya pada dasarnya memiliki dua pertanyaan yang saya harapkan untuk mendapatkan arahan:
- Mengapa kita tidak bisa menjalankan OLS dalam
survey
paket, sementara sepertinya ini mungkin dilakukan dengan data tertimbang di Stata? - Apa perbedaan interpretasi antara penyimpangan model linear umum dan nilai r-squared?
Jawaban:
svyglm
akan memberi Anda model linier jika Anda menggunakanfamily = gaussian()
yang tampaknya merupakan default dari sketsa survei (dalam versi 3.32-1). Lihat contoh di mana mereka menemukanregmodel
.Tampaknya paket itu hanya memastikan bahwa Anda menggunakan bobot yang benar saat menelepon
glm
. Dengan demikian, jika hasil Anda kontinu dan Anda menganggap bahwa itu biasanya dibagikan maka Anda harus menggunakannyafamily = gaussian()
. Hasilnya adalah model linear tertimbang. Jawaban inidengan menyatakan bahwa Anda memang bisa melakukan itu dengan
survey
paket. Adapun pertanyaan berikutfamily = gaussian()
Penyimpangan hanya jumlah kesalahan kuadrat saat Anda gunakan
family = gaussian()
.Peringatan
Saya berasumsi bahwa Anda menginginkan model linier dari pertanyaan Anda. Lebih lanjut, saya tidak pernah menggunakan
survey
paket itu tetapi dengan cepat memindai melalui itu dan membuat asumsi tentang apa yang dilakukannya yang saya nyatakan dalam jawaban saya.sumber