Nilai yang diharapkan dari

Saya ingin tahu tentang pernyataan yang dibuat di bagian bawah halaman pertama dalam teks ini mengenai penyesuaian $R^2_\mathrm{adjusted}$

R_{a d j u s t e d}^{2} = 1 - (1 - R^{2}) (\frac{n - 1}{n - m - 1}) .

$R^2_\mathrm{adjusted} =1-(1-R^2)\left({\frac{n-1}{n-m-1}}\right).$

Teks menyatakan:

Logika penyesuaian adalah sebagai berikut: dalam regresi berganda biasa, prediktor acak menjelaskan rata-rata proporsi dari variasi respons, sehingga prediktor acak menjelaskan bersama, rata-rata, variasi tanggapan; dengan kata lain, nilai yang diharapkan dari adalah . Menerapkan rumus [ ] ke nilai itu, di mana semua prediktor acak, memberikan " $1/(n – 1)$ $m$ $m/(n – 1)$ $R^2$ $\mathbb{E}(R^2) = m/(n – 1)$ $R^2_\mathrm{adjusted}$ $R^2_\mathrm{adjusted} = 0$

Ini tampaknya menjadi motivasi yang sangat sederhana dan dapat ditafsirkan untuk $R^2_\mathrm{adjusted}$ . Namun, saya belum dapat menemukan bahwa $\mathbb{E}(R^2)=1/(n – 1)$ untuk prediktor acak tunggal (yaitu tidak berkorelasi).

Bisakah seseorang mengarahkan saya ke arah yang benar di sini?

regression expected-value goodness-of-fit r-squared gregory_britten
sumber

Jika tautannya mati di masa mendatang, dapatkah Anda memberikan referensi lengkap? Terima kasih.

Richard Hardy

Jawaban:

Ini adalah statistik matematika yang akurat. Lihat posting ini untuk derivasi dari distribusi bawah hipotesis bahwa semua regressor (batalkan istilah konstan) tidak berkorelasi dengan variabel dependen ("prediktor acak"). $R^2$

Distribusi ini Beta, dengan adalah jumlah prediktor tanpa menghitung jangka konstan, dan ukuran sampel, $m$ $n$

R^{2} \sim B e t a (\frac{m}{2}, \frac{n - m - 1}{2})

$R^2 \sim Beta\left (\frac {m}{2}, \frac {n-m-1}{2}\right)$

dan sebagainya

E (R^{2}) = \frac{m / 2}{(m / 2) + [(n - m - 1) / 2]} = \frac{m}{n - 1}

$E(R^2) = \frac {m/2}{(m/2)+[(n-m-1)/2]} = \frac{m}{n-1}$

Ini tampaknya menjadi cara yang pintar untuk "membenarkan" logika di balik disesuaikan : jika memang semua regresi tidak berkorelasi, maka disesuaikan adalah "rata-rata" nol. $R^2$ $R^2$

Alecos Papadopoulos
sumber

Hanya sedikit informasi yang saya butuhkan! Terima kasih! Dan pertukaran Stack hidup lama!

gregory_britten

Saya akan tertarik pada kasus di mana tidak semua regressor tidak berkorelasi dengan variabel dependen. Apakah Anda punya referensi tentang ini?

Olivier

@ Olivier Tidak, saya rasa tidak. Lihat di bawah "F-test untuk signifikansi regresi, distribusi di bawah alternatif", atau sesuatu seperti itu.

Alecos Papadopoulos