Dalam regresi linier, kami membuat asumsi berikut
Salah satu cara kita dapat menyelesaikan regresi linier adalah melalui persamaan normal, yang dapat kita tulis sebagai
Dari sudut pandang matematika, persamaan di atas hanya perlu untuk dapat dibalik. Jadi, mengapa kita membutuhkan asumsi-asumsi ini? Saya bertanya kepada beberapa rekan dan mereka menyebutkan bahwa itu untuk mendapatkan hasil yang baik dan persamaan normal adalah algoritma untuk mencapainya. Tetapi dalam kasus itu, bagaimana asumsi ini membantu? Bagaimana menjunjung tinggi mereka membantu dalam mendapatkan model yang lebih baik?
regression
assumptions
Jam Budak
sumber
sumber
Jawaban:
Anda benar - Anda tidak perlu memenuhi asumsi ini agar sesuai dengan garis kuadrat terkecil ke poin. Anda perlu asumsi-asumsi ini untuk menafsirkan hasil. Misalnya, dengan asumsi tidak ada hubungan antara input dan Y , berapakah probabilitas mendapatkan koefisien β 1 setidaknya sama besar seperti apa yang kita lihat dari regresi?X1 Y β1
sumber
Coba citra kuartet Anscombe dari Wikipedia untuk mendapatkan ide dari beberapa masalah potensial dengan menafsirkan regresi linier ketika beberapa asumsi-asumsi yang jelas palsu: sebagian besar statistik deskriptif dasar yang sama di keempat (dan individu nilai-nilai identik dalam semua kecuali bagian kanan bawah)xi
sumber
Anda tidak perlu asumsi-asumsi itu agar sesuai dengan model linier. Namun, estimasi parameter Anda mungkin bias atau tidak memiliki varian minimum. Melanggar asumsi akan membuat diri Anda lebih sulit dalam menafsirkan hasil regresi, misalnya, membangun interval kepercayaan.
sumber
Ok, jawabannya sejauh ini seperti ini: Jika kita melanggar asumsi maka hal buruk bisa terjadi. Saya percaya bahwa arah yang menarik adalah: Ketika semua asumsi yang kita butuhkan (sebenarnya sedikit berbeda dari yang di atas) terpenuhi, mengapa dan bagaimana kita dapat yakin bahwa regresi linier adalah model terbaik?
sumber
Dua asumsi utama adalah
Lihat Diskusi dalam buku Julian Faraway .
Jika keduanya benar, secara mengejutkan OLS tahan terhadap pelanggaran dalam asumsi lain yang telah Anda daftarkan.
sumber