Saya ingin tahu tentang pernyataan yang dibuat di bagian bawah halaman pertama dalam teks ini mengenai penyesuaian
Teks menyatakan:
Logika penyesuaian adalah sebagai berikut: dalam regresi berganda biasa, prediktor acak menjelaskan rata-rata proporsi dari variasi respons, sehingga m prediktor acak menjelaskan bersama, rata-rata, m / (n - 1) variasi tanggapan; dengan kata lain, nilai yang diharapkan dari R ^ 2 adalah \ mathbb {E} (R ^ 2) = m / (n - 1) . Menerapkan rumus [ R ^ 2_ \ mathrm {adjusted} ] ke nilai itu, di mana semua prediktor acak, memberikan R ^ 2_ \ mathrm {adjusted} = 0. "m m / ( n - 1 ) R 2 E ( R 2 ) = m / ( n - 1 ) R 2 a d j u s t e d R 2 a d j u s t e d = 0
Ini tampaknya menjadi motivasi yang sangat sederhana dan dapat ditafsirkan untuk . Namun, saya belum dapat menemukan bahwa untuk prediktor acak tunggal (yaitu tidak berkorelasi).
Bisakah seseorang mengarahkan saya ke arah yang benar di sini?
sumber
Jawaban:
Ini adalah statistik matematika yang akurat. Lihat posting ini untuk derivasi dari distribusi bawah hipotesis bahwa semua regressor (batalkan istilah konstan) tidak berkorelasi dengan variabel dependen ("prediktor acak").R2
Distribusi ini Beta, dengan adalah jumlah prediktor tanpa menghitung jangka konstan, dan ukuran sampel,nm n
dan sebagainya
Ini tampaknya menjadi cara yang pintar untuk "membenarkan" logika di balik disesuaikan : jika memang semua regresi tidak berkorelasi, maka disesuaikan adalah "rata-rata" nol.R 2R2 R2
sumber