Ini cukup sulit untuk saya gambarkan, tetapi saya akan mencoba membuat masalah saya dapat dimengerti. Jadi pertama-tama Anda harus tahu bahwa saya telah melakukan regresi linier yang sangat sederhana sejauh ini. Sebelum saya memperkirakan koefisien, saya memperhatikan distribusi saya . Itu berat miring miring. Setelah saya memperkirakan model, saya cukup yakin untuk mengamati residu condong ke kiri di QQ-Plot sebagai wel, tapi saya benar-benar tidak. Apa yang mungkin menjadi alasan untuk solusi ini? Dimana kesalahannya? Atau memiliki distribusi tidak ada hubungannya dengan distribusi istilah kesalahan?y
regression
residuals
skewness
MarkDollar
sumber
sumber
Jawaban:
Untuk menjawab pertanyaan Anda, mari kita ambil contoh yang sangat sederhana. Model regresi sederhana diberikan oleh , di mana ϵ i ∼ N ( 0 , σ 2 ) . Sekarang anggaplah x i adalah dikotomis. Jika β 1 tidak sama dengan nol, maka distribusi y iysaya= β0+ β1xsaya+ ϵsaya ϵsaya∼ N( 0 , σ2) xsaya β1 ysaya tidak akan normal, tetapi sebenarnya merupakan campuran dari dua distribusi normal, satu dengan rata-rata dan satu dengan rata-rata β 0β0 .β0+ β1
Jika cukup besar dan σ 2 cukup kecil, maka histogram y i akan terlihat bimodal. Namun, kita juga bisa mendapatkan histogram dari y i yang terlihat seperti "tunggal" distribusi miring. Berikut ini satu contoh (menggunakan R):β1 σ2 ysaya ysaya
Ini bukan distribusi yang penting - tetapi distribusi istilah kesalahan.ysaya
Dan itu terlihat sangat normal - tidak hanya secara kiasan =)
sumber
Dengan merujuk pada jawaban luar biasa dari @ Wolfgang, berikut adalah plot dari kode R-nya:
sumber