Saya mencari bantuan, saran, atau tip bagaimana menjelaskan heterogenitas / heteroskedastisitas kepada ahli biologi di departemen saya. Secara khusus saya ingin menjelaskan mengapa penting untuk mencarinya dan menanganinya jika ada, saya mencari pendapat tentang pertanyaan-pertanyaan berikut.
- Apakah heterogenitas mempengaruhi reliabilitas estimasi efek acak? Saya cukup yakin, tetapi saya tidak dapat menemukan kertas.
- Seberapa serius masalah itu heterogenitas? Saya telah menemukan pandangan yang bertentangan mengenai hal ini, sementara beberapa orang mengatakan bahwa kesalahan standar model dll tidak akan dapat diandalkan, saya juga membaca bahwa itu hanya masalah jika heterogenitasnya parah. Seberapa parah parah?
- Nasihat tentang pemodelan heterogenitas. Saat ini, saya sebagian besar fokus pada paket nlme di R dan penggunaan varians covariates, ini cukup sederhana dan kebanyakan orang di sini menggunakan R sehingga memberikan skrip berguna. Saya juga menggunakan paket MCMCglmm, tetapi saran lain dipersilahkan, terutama untuk data yang tidak normal.
- Saran lain dipersilahkan.
regression
mixed-model
references
residuals
heteroscedasticity
pengguna3136
sumber
sumber
Jawaban:
Allometry akan menjadi tempat yang baik untuk memulai yang akrab bagi ahli biologi. Transformasi logaritmik sering digunakan dalam alometri karena data memiliki bentuk hukum kekuatan, tetapi juga karena proses kebisingan heteroskedastik (karena variabilitasnya proporsional dengan ukuran). Untuk contoh di mana ini telah menyebabkan masalah parah, lihat "Persamaan alometrik untuk memprediksi massa tubuh dinosaurus" , di mana kesimpulan bahwa dinosaurus hanya setengah ukuran sebelumnya meskipun salah karena asumsi yang tidak valid dari homoseksualitas dibuat (lihat korespondensi untuk detail).
sumber
Salah satu opsi adalah menggunakan simulasi. Jadi siapkan sebuah model di mana Anda secara spesifik menentukan heterogenitas misalkan sebagai . Kemudian hasilkan data Anda dari model ini, dengan mengambil intersepsi acak sebagai contoh sederhana.var(αi)=X¯¯¯¯2iσ2u
(Semoga notasi ini masuk akal). Saya percaya bermain-main dengan set-up seperti ini akan membantu Anda menjawab pertanyaan 2). Jadi, Anda akan cocok dengan model ini menggunakan intersep acak, padahal sebenarnya itu seharusnya merupakan kemiringan acak (yang memberi Anda jawaban parsial untuk pertanyaan 3 - intersep acak dapat menjelaskan "mengipasi" ke tingkat tertentu - ini adalah "mengipasi tingkat 2") ). Gagasan di atas adalah berusaha sekeras yang Anda bisa untuk memecahkan metode pemodelan Anda - cobalah kondisi ekstrim yang konsisten dengan apa yang Anda ketahui tentang data, dan lihat apa yang terjadi. Jika Anda kesulitan menemukan kondisi ini, maka jangan khawatir.
Saya melakukan pemeriksaan cepat pada heteroskedastisitas untuk OLS, dan sepertinya tidak terlalu mempengaruhi perkiraan beta. Bagi saya sepertinya heteroskedastisitas akan terjadi di beberapa tempat dengan memberikan perkiraan kesalahan yang keliru, dan di tempat lain akan memberikan perkiraan kesalahan yang keliru (dalam istilah prediktif). Lihat di bawah:
menunggu sebidang data di sini, pengguna saat ini frustrasi dengan komputer
Dan satu hal yang selalu saya anggap lucu adalah "non-normalitas data" yang dikhawatirkan orang. Data tidak perlu didistribusikan secara normal, tetapi istilah kesalahan tidak. Jika ini tidak benar, maka GLM tidak akan berfungsi - GLM menggunakan perkiraan normal untuk fungsi kemungkinan untuk memperkirakan parameter, seperti halnya GLMM.
Jadi saya akan mengatakan jika memperkirakan parameter efek tetap adalah tujuan utama maka tidak banyak yang perlu dikhawatirkan, tetapi Anda mungkin mendapatkan hasil yang lebih baik untuk prediksi dengan memperhitungkan heteroskedastisitas.
sumber
Sumber daya online GRATIS terbaik yang saya tahu untuk belajar tentang heteroskedastisitas adalah kuliah ECON 421 dari Prof. Thoma dari tahun 2011. Khususnya kuliah 1 - 7. Kuliahnya sangat teratur dan mudah diikuti terlepas dari disiplin Anda.
Inilah kuliah pertama. Anda dapat menemukan sisa kuliah dari semester Musim Dingin 2011 di sini juga. http://www.youtube.com/watch?v=WK03XgoVsPM
Juga, situs web yang sesuai untuk kursus Econ 421 Prof. Thoma memiliki Masalah Pekerjaan Rumah dan juga solusinya. Untuk solusi yang memerlukan perangkat lunak, solusinya dirinci langkah-demi-langkah menggunakan kombinasi teks, formula, dan tangkapan layar dari Eviews.
Meskipun langkah-langkah yang digunakan untuk memecahkan masalah pekerjaan rumah dirinci menggunakan tangkapan layar dari E-views, solusi dengan mudah diterjemahkan dengan baik ke dalam paket statistik lainnya seperti STATA atau statistik R.
Tidak ada Solusi yang terdaftar untuk Pekerjaan Rumah dari semester 2011, yang merupakan semester rekaman video terakhir Prof. Thoma. Namun ada pekerjaan rumah yang tersedia untuk semester Musim Dingin 2012 -nya .
Berikut ini tautan ke bagian Solusi pekerjaan rumah di kelas Prof. Thomas Winter 2012 421. Secara khusus di sini adalah Solusi untuk Pekerjaan Rumah 3 di mana heteroskedastisitas diperkenalkan ke set pekerjaan rumah. http://economistsview.typepad.com/economics421/2012/02/solution-to-homework-3.html
sumber