Harapan bersyarat dari R-squared

16

Pertimbangkan model linier sederhana:

yy = X ββ + ϵ

yy=Xββ+ϵ

dimana ϵ ii . i . d .N ( 0 , σ 2 )ϵii.i.d.N(0,σ2) dan X R n × pXRn×p , p 2p2 dan XX berisi kolom konstanta.

Pertanyaan saya adalah, mengingat E ( X X )E(XX) , ββ dan σσ , apakah ada rumus untuk batas atas non trivial pada E ( R 2 )E(R2) *? (dengan asumsi model diestimasi oleh OLS).

* Saya berasumsi, menulis ini, bahwa mendapatkan E ( R 2 )E(R2) itu sendiri tidak akan mungkin.

EDIT1

menggunakan solusi yang diturunkan oleh Stéphane Laurent (lihat di bawah) kita bisa mendapatkan batas atas non trivial pada E ( R 2 )E(R2) . Beberapa simulasi numerik (di bawah) menunjukkan bahwa ikatan ini sebenarnya cukup ketat.

Stéphane Laurent diturunkan sebagai berikut: R 2B ( p - 1 , n - p , λ ) diR2B(p1,np,λ) mana B ( p - 1 , n - p , λ )B(p1,np,λ) adalah distribusi Beta non-sentral dengan parameter non-sentralitas λλ dengan

λ = | | X β - E ( X ) β 1 n | | 2σ 2

λ=||XβE(X)β1n||2σ2

Begitu

E ( R 2 ) = E ( χ 2 p - 1 ( λ )χ 2 p - 1 ( λ ) + χ 2 n - p )E(χ 2 p - 1 (λ))E ( χ 2 p - 1 ( λ ) ) + E ( χ 2 n - p )

E(R2)=E(χ2p1(λ)χ2p1(λ)+χ2np)E(χ2p1(λ))E(χ2p1(λ))+E(χ2np)

di mana χ 2 k ( λ )χ2k(λ) adalah non-tengah χ 2χ2 dengan parameter λλ dan kk derajat kebebasan. Jadi batas atas non-sepele untuk E ( R 2 )E(R2) adalah

λ + p - 1λ + n - 1

λ+p1λ+n1

itu sangat ketat (jauh lebih ketat dari apa yang saya harapkan mungkin terjadi):

misalnya, menggunakan:

rho<-0.75
p<-10
n<-25*p
Su<-matrix(rho,p-1,p-1)
diag(Su)<-1
su<-1
set.seed(123)
bet<-runif(p)

rata-rata dari R 2 lebih dari 1000 simulasi adalah . Batas atas teoretis di atas memberi . Terikat tampaknya sama-sama tepat di banyak nilai-nilai R 2 . Benar-benar mencengangkan!R20.9608190.9609081R2

EDIT2:

setelah penelitian lebih lanjut, tampak bahwa kualitas perkiraan batas atas ke E ( R 2 ) akan menjadi lebih baik karena λ + p meningkat (dan semuanya sama, λ meningkat dengan n ).E(R2)λ+pλn

pengguna603
sumber
R 2 memiliki distribusi Beta dengan parameter tergantung hanya pada n dan p . Tidak ? R2np
Stéphane Laurent
1
Oooppss maaf, klaim saya sebelumnya hanya benar di bawah hipotesis "model nol" (intersep saja). Kalau tidak, distribusi R 2 harus seperti distribusi Beta noncentral, dengan parameter noncentrality yang melibatkan parameter yang tidak diketahui. R2
Stéphane Laurent
@ StéphaneLaurent: terima kasih. Apakah Anda tahu lebih banyak tentang hubungan antara parameter yang tidak diketahui dan parameter Beta? Saya macet, jadi setiap penunjuk akan disambut ...
user603
Apakah Anda benar-benar harus berurusan dengan E [ R 2 ] ? Mungkin ada rumus tepat sederhana untuk E [ R 2 / ( 1 - R 2 ) ] . E[R2]E[R2/(1R2)]
Stéphane Laurent
1
Dengan notasi jawaban saya, R 2 / ( 1 - R 2 ) = k F untuk beberapa skalar k dan momen pertama distribusi F noncentral sederhana. R2/(1R2)=kFkF
Stéphane Laurent

Jawaban:

12

Any linear model can be written Y=μ+σGY=μ+σG where GG has the standard normal distribution on RnRn and μμ is assumed to belong to a linear subspace WW of RnRn. In your case W=Im(X)W=Im(X).

Let [1]W[1]W be the one-dimensional linear subspace generated by the vector (1,1,,1)(1,1,,1). Taking U=[1]U=[1] below, the R2R2 is highly related to the classical Fisher statistic F=PZY2/(m)PWY2/(nm),

F=PZY2/(m)PWY2/(nm),
for the hypothesis test of H0:{μU}H0:{μU} where UWUW is a linear subspace, and denoting by Z=UWZ=UW the orthogonal complement of UU in WW, and denoting m=dim(W)m=dim(W) and =dim(U)=dim(U) (then m=pm=p and =1=1 in your situation).

Indeed, PZY2PWY2=R21R2

PZY2PWY2=R21R2
because the definition of R2R2 is R2=PZY2PUY2=1PWY2PUY2.
R2=PZY2PUY2=1PWY2PUY2.

Obviously PZY=PZμ+σPZGPZY=PZμ+σPZG and PWY=σPWGPWY=σPWG.

When H0:{μU}H0:{μU} is true then PZμ=0PZμ=0 and therefore F=PZG2/(m)PWG2/(nm)Fm,nm

F=PZG2/(m)PWG2/(nm)Fm,nm
has the Fisher Fm,nmFm,nm distribution. Consequently, from the classical relation between the Fisher distribution and the Beta distribution, R2B(m,nm)R2B(m,nm).

In the general situation we have to deal with PZY=PZμ+σPZGPZY=PZμ+σPZG when PZμ0PZμ0. In this general case one has PZY2σ2χ2m(λ)PZY2σ2χ2m(λ), the noncentral χ2χ2 distribution with mm degrees of freedom and noncentrality parameter λ=PZμ2σ2λ=PZμ2σ2, and then FFm,nm(λ)FFm,nm(λ) (noncentral Fisher distribution). This is the classical result used to compute power of FF-tests.

The classical relation between the Fisher distribution and the Beta distribution hold in the noncentral situation too. Finally R2R2 has the noncentral beta distribution with "shape parameters" mm and nmnm and noncentrality parameter λλ. I think the moments are available in the literature but they possibly are highly complicated.

Finally let us write down PZμPZμ. Note that PZ=PWPUPZ=PWPU. One has PUμ=ˉμ1PUμ=μ¯1 when U=[1]U=[1], and PWμ=μPWμ=μ. Hence PZμ=μˉμ1PZμ=μμ¯1 where here μ=Xβμ=Xβ for the unknown parameters vector ββ.

Stéphane Laurent
sumber
1
PZxPZx is the orthogoanl projection of xx on the linear subspace ZZ. And PP denotes projection on the orthogonal.
Stéphane Laurent
1
Beware of PxPx2PxPx2. I'm going to edit my post to write the formulas.
Stéphane Laurent
1
Done - do you see any simplification ?
Stéphane Laurent
1
ˉμ=1nμi
Stéphane Laurent
1
Type I, obviously: type II are distributed on (0,). Actually R2/(1R2) has the type II distribution. I have done the last corrections for today.
Stéphane Laurent