Saya tertarik untuk mendapatkan estimasi tidak bias dalam regresi linier berganda.
Pada refleksi, saya dapat memikirkan dua nilai yang berbeda yang estimasi yang tidak bias dari mungkin berusaha mencocokkan.
- Dari sampel : r-square yang akan diperoleh jika persamaan regresi yang diperoleh dari sampel ) yang diterapkan untuk jumlah tak terbatas data eksternal untuk sampel tetapi dari proses menghasilkan data yang sama.
- Populasi : R-square yang akan diperoleh jika sampel tak terbatas diperoleh dan model dipasang pada sampel tak terbatas tersebut (yaitu, ) atau sebagai alternatif hanya R-square yang tersirat oleh proses pembuatan data yang diketahui.
Saya mengerti bahwa disesuaikan dirancang untuk mengkompensasi Overfitting diamati dalam sampel . Meskipun demikian, tidak jelas apakah disesuaikan R 2 sebenarnya perkiraan berisi dari R 2 , dan jika itu adalah berisi perkiraan, yang di atas dua definisi R 2 itu bertujuan untuk memperkirakan.
Jadi, pertanyaan saya:
- Berapakah estimasi yang tidak bias dari apa yang saya sebut di atas dari sampel ?
- Apa perkiraan tak bias dari apa yang saya sebut di atas populasi ?
- Apakah ada referensi yang memberikan simulasi atau bukti ketidakberpihakan lainnya?
estimation
multiple-regression
r-squared
bias
Jeromy Anglim
sumber
sumber
Jawaban:
Evaluasi penyesuaian analitik untuk R-square
@ttnphns merujuk saya ke artikel Yin dan Fan (2001) yang membandingkan metode analitik yang berbeda dalam memperkirakan . Sesuai pertanyaan saya, mereka membedakan antara dua jenis penduga. Mereka menggunakan terminologi berikut:R2
Hasilnya diringkas secara abstrak:
di mana N adalah ukuran sampel, dan p adalah jumlah prediktor.
Estimasi empiris penyesuaian ke R-square
Referensi
sumber