Sebagai asumsi regresi linier, normalitas distribusi kesalahan kadang-kadang salah "diperluas" atau ditafsirkan sebagai kebutuhan untuk normalitas y atau x.
Apakah mungkin untuk membuat skenario / dataset bahwa di mana X dan Y adalah tidak normal tetapi istilah kesalahannya adalah dan oleh karena itu estimasi regresi linier yang diperoleh valid?
Jawaban:
Memperluas komentar Hong Oois dengan sebuah gambar. Berikut ini adalah gambar dari dataset di mana tidak ada margin yang terdistribusi normal tetapi residualnya masih ada, sehingga asumsi regresi linier masih valid:
Gambar dihasilkan oleh kode R berikut:
sumber