Jika saya mengulangi setiap pengamatan sampel dalam model regresi linier dan menjalankan kembali regresi, bagaimana hasilnya akan terpengaruh?
15
Katakanlah saya memiliki pengamatan N, mungkin beberapa faktor dan saya mengulangi setiap pengamatan dua kali (atau M kali) bagaimana sebuah regresi pada set ukuran baru NM dibandingkan dengan regresi hanya pada pengamatan asli?
Seperti yang Anda lihat, koefisien (panjang) yang sebelumnya tidak penting menjadi signifikan secara statistik dalam model yang diperluas, mewakili ketepatan yang dengannya Anda "tahu" apa yang Anda ketahui.
Ya kesalahan standar memang turun. Beberapa merekomendasikan regresi linier tertimbang untuk ini .. Apakah ada metode yang Anda gunakan untuk memperbaikinya?
BBDynSys
3
Regresi linier biasa menyelesaikan masalah
w∗= argminw| | Xw - y| |2
dimana X adalah matriks prediktor dan yadalah jawabannya. Jika Anda mengulangi setiap sampelM. kali, itu akan meninggalkan fungsi objektif untuk diminimalkan tidak berubah (kecuali untuk faktor multiplikatif M.). Oleh karena itu vektor bobot yang optimal untuk masalah yang lebih besar akan sama seperti untuk masalah kecil yang asli.
Setuju, tapi saya pikir t statistik dan kesalahan standar harus berubah mengingat perubahan dari N ke NM?
Palace Chan
Karena OLS mengasumsikan bahwa kebisingan itu independen, kesalahan standar akan berbeda karena jumlah derajat kebebasannya akan berbeda M.∗ N- P (N adalah ukuran sampel asli dan P adalah jumlah prediktor) dan panjang vektor residual naik oleh faktor M..
Regresi linier biasa menyelesaikan masalah
sumber