Apa yang dimaksud dengan estimasi tidak bias dari populasi R-square?

14

Saya tertarik untuk mendapatkan estimasi tidak bias dalam regresi linier berganda.R2

Pada refleksi, saya dapat memikirkan dua nilai yang berbeda yang estimasi yang tidak bias dari mungkin berusaha mencocokkan.R2

  1. Dari sampel :R2 r-square yang akan diperoleh jika persamaan regresi yang diperoleh dari sampel ) yang diterapkan untuk jumlah tak terbatas data eksternal untuk sampel tetapi dari proses menghasilkan data yang sama.β^
  2. Populasi :R2 R-square yang akan diperoleh jika sampel tak terbatas diperoleh dan model dipasang pada sampel tak terbatas tersebut (yaitu, β ) atau sebagai alternatif hanya R-square yang tersirat oleh proses pembuatan data yang diketahui.

Saya mengerti bahwa disesuaikan R2 dirancang untuk mengkompensasi Overfitting diamati dalam sampel . Meskipun demikian, tidak jelas apakah disesuaikan R 2 sebenarnya perkiraan berisi dari R 2 , dan jika itu adalah berisi perkiraan, yang di atas dua definisi R 2 itu bertujuan untuk memperkirakan.R2R2R2R2

Jadi, pertanyaan saya:

  • Berapakah estimasi yang tidak bias dari apa yang saya sebut di atas dari sampel ?R2
  • Apa perkiraan tak bias dari apa yang saya sebut di atas populasi ?R2
  • Apakah ada referensi yang memberikan simulasi atau bukti ketidakberpihakan lainnya?
Jeromy Anglim
sumber
Pertanyaan apa rumus untuk adj. R ^ 2 kurang bias telah dinaikkan misalnya di sini .
ttnphns
Terima kasih. Saya sekarang membaca referensi yang Anda sebutkan: Yin, P., & Fan, X. (2001). Memperkirakan penyusutan dalam regresi berganda: Perbandingan metode analitik yang berbeda. Jurnal Pendidikan Eksperimental, 69 (2), 203-224. R2
Jeromy Anglim

Jawaban:

14

Evaluasi penyesuaian analitik untuk R-square

@ttnphns merujuk saya ke artikel Yin dan Fan (2001) yang membandingkan metode analitik yang berbeda dalam memperkirakan . Sesuai pertanyaan saya, mereka membedakan antara dua jenis penduga. Mereka menggunakan terminologi berikut:R2

  • ρ2
  • ρc2

Hasilnya diringkas secara abstrak:

R2ρ2ρ2ρc2

ρ2

R^2=1(N3)(1R2)(Np1)[1+2(1R2)Np2.3]

di mana N adalah ukuran sampel, dan p adalah jumlah prediktor.

Estimasi empiris penyesuaian ke R-square

R2ρ2ρc2ρ2 .

Referensi

  • Kromrey, JD, & Hines, CV (1995). Penggunaan estimasi empiris penyusutan dalam regresi berganda: hati-hati. Pengukuran Pendidikan dan Psikologis, 55 (6), 901-925.
  • R2
Jeromy Anglim
sumber