Sebagai contoh, perhatikan ChickWeight
kumpulan data dalam R. Varians jelas tumbuh dari waktu ke waktu, jadi jika saya menggunakan regresi linier sederhana seperti:
m <- lm(weight ~ Time*Diet, data=ChickWeight)
Pertanyaan saya:
- Aspek mana dari model yang akan dipertanyakan?
- Apakah masalah terbatas pada ekstrapolasi di luar
Time
rentang? - Seberapa tolerankah regresi linier terhadap pelanggaran asumsi ini (yaitu, bagaimana heteroscedastic harus menyebabkan masalah)?
Jawaban:
Model linier (atau "kuadrat terkecil") masih memiliki sifat tidak bias dalam kasus ini.
Dalam menghadapi heteroskedastisitas dalam hal kesalahan, Anda masih memiliki perkiraan parameter yang tidak bias tetapi Anda kehilangan pada matriks kovarians: kesimpulan Anda (yaitu pengujian parameter) mungkin tidak aktif. Perbaikan umum adalah menggunakan metode yang kuat untuk menghitung matriks kovarians alias kesalahan standar. Yang mana yang Anda gunakan agak tergantung pada domain tetapi metode White adalah permulaan.
Dan untuk kelengkapannya, korelasi seri istilah kesalahan lebih buruk karena akan menyebabkan estimasi parameter yang bias.
sumber
Homoscedasticity adalah salah satu asumsi Gauss Markov yang diperlukan untuk OLS untuk menjadi penaksir tidak bias linier terbaik (BLUE).
Teorema Gauss-Markov memberitahu kita bahwa estimator kuadrat terkecil untuk koefisien tidak bias dan memiliki varians minimum di antara semua estimator linier yang tidak bias, mengingat bahwa kita memenuhi semua asumsi Gauss-Markov. Anda dapat menemukan informasi lebih lanjut tentang Teorema Gauss-Markov termasuk bukti matematis teorema di sini . Selain itu, Anda dapat menemukan daftar lengkap asumsi OLS termasuk penjelasan apa yang terjadi jika mereka dilanggar di sini .β
Ringkas meringkas informasi dari situs web di atas, heteroskedastisitas tidak menimbulkan bias dalam estimasi koefisien Anda. Namun, dengan heteroskedastisitas, Anda tidak dapat memperkirakan dengan benar matriks varians-kovarians. Karenanya, kesalahan standar dari koefisien adalah salah. Ini berarti bahwa seseorang tidak dapat menghitung t-statistik dan nilai-p dan akibatnya pengujian hipotesis tidak dimungkinkan. Secara keseluruhan, di bawah heteroskedastisitas OLS kehilangan efisiensinya dan tidak BIRU lagi.
Namun, heteroskedastisitas bukanlah akhir dari dunia. Untungnya, mengoreksi heteroskedastisitas tidaklah sulit. Penaksir sandwich memungkinkan Anda memperkirakan kesalahan standar yang konsisten untuk koefisien. Namun demikian, menghitung kesalahan standar melalui estimator sandwich dikenakan biaya. Estimator tidak sangat efisien dan kesalahan standar mungkin sangat besar. Salah satu cara untuk mendapatkan kembali beberapa efisiensi adalah dengan mengelompokkan kesalahan standar jika memungkinkan.
Anda dapat menemukan informasi lebih rinci tentang subjek ini di situs web yang saya sebutkan di atas.
sumber
Tidak adanya homoseksualitas dapat memberikan estimasi kesalahan standar yang tidak dapat diandalkan dari parameter. Estimasi parameter tidak bias. Namun perkiraan tersebut mungkin tidak efisien (bukan BIRU). Anda dapat menemukan lebih banyak di tautan berikut
sumber
sumber
Ada informasi bagus di sini di jawaban lain, terutama untuk pertanyaan pertama Anda. Saya pikir saya akan menambahkan beberapa informasi gratis mengenai dua pertanyaan terakhir Anda.
sumber