Saya punya pertanyaan aneh. Asumsikan bahwa Anda memiliki sampel kecil di mana variabel dependen yang akan Anda analisis dengan model linier sederhana sangat miring. Jadi, Anda berasumsi bahwa tidak terdistribusi normal, karena ini akan menghasilkan y terdistribusi normal . Tetapi ketika Anda menghitung plot QQ-Normal ada bukti, bahwa residu terdistribusi secara normal. Dengan demikian siapa pun dapat berasumsi bahwa istilah kesalahan terdistribusi secara normal, walaupun y tidak. Jadi apa artinya, ketika istilah kesalahan tampaknya terdistribusi normal, tapi tidak?
sumber
@DikranMarsupial memang benar, tentu saja, tetapi terlintas dalam benak saya bahwa mungkin lebih baik untuk mengilustrasikan maksudnya, terutama karena kekhawatiran ini tampaknya sering muncul. Secara khusus, residu model regresi harus didistribusikan secara normal agar nilai-p menjadi benar. Namun, bahkan jika residu terdistribusi secara normal, itu tidak menjamin bahwa akan menjadi (bukan berarti itu penting ...); itu tergantung pada distribusi XY X .
Mari kita ambil contoh sederhana (yang saya buat). Katakanlah kita sedang menguji obat untuk hipertensi sistolik terisolasi (yaitu, angka tekanan darah tinggi terlalu tinggi). Mari kita tentukan lebih lanjut bahwa bp sistolik biasanya terdistribusi dalam populasi pasien kami, dengan rata-rata 160 & SD 3, dan untuk setiap mg obat yang dikonsumsi setiap hari, bp sistolik turun 1 mmHg. Dengan kata lain, nilai sebenarnya dari adalah 160, dan ß 1 adalah -1, dan fungsi pembangkit data yang benar adalah: B P s y s = 160 - 1 × dosis obat harian + εβ0 β1
Dalam penelitian fiktif kami, 300 pasien ditugaskan secara acak untuk mengonsumsi 0mg (plasebo), 20mg, atau 40mg obat baru ini per hari. (Perhatikan bahwa X tidak terdistribusi secara normal.) Kemudian, setelah periode waktu yang cukup untuk obat tersebut berlaku, data kami mungkin terlihat seperti ini:
(Saya jittered dosis sehingga poin tidak akan tumpang tindih sehingga sulit untuk dibedakan.) Sekarang, mari kita periksa distribusi (yaitu, itu distribusi marjinal / asli), dan residu:Y
Hasil ini menunjukkan bahwa semuanya berjalan dengan baik.
sumber
sumber