Apakah koefisien korelasi sampel merupakan penaksir yang tidak bias dari koefisien korelasi populasi?

14

Benarkah adalah penaksir yang tidak bias untuk ? Yaitu, ρ X , Y E [ R X , Y ] = ρ X , Y ?RX,YρX,Y

E[RX,Y]=ρX,Y?

Jika tidak, apa yang merupakan penaksir tidak bias untuk ? (Mungkin ada penaksir bias standar yang digunakan? Juga, apakah ini analog dengan varians sampel yang tidak bias, di mana kami hanya membuat penyesuaian sederhana untuk mengalikan varians sampel yang bias dengan ?)nρX,Ynn1

Koefisien korelasi populasi didefinisikan sebagai sedangkan koefisien korelasi sampel didefinisikan sebagaiRX,Y= n i = 1 (Xi- ˉ X )(Yi- ˉ Y )

ρX,Y=E[(X-μX)(Y-μY)]E[(X-μX)2]E[(Y-μY)2],
RX,Y=i=1n(XiX¯)(YiY¯)i=1n(XiX¯)2i=1n(YiY¯)2.
Kenny LJ
sumber
A (sedikit mirip) pertanyaan tentang estimator dari . ρ
ttnphns
Pertanyaan "apa itu penaksir yang tidak bias" mengandaikan bahwa ada satu dan hanya ada satu. A priori , tampaknya tidak ada alasan untuk berpikir seperti itu.
Michael Hardy
@MichaelHardy: Saya sudah memperbaikinya. Terima kasih telah menunjukkan.
Kenny LJ
Baru saja menemukan utas ini, dan saya pikir ini mungkin merupakan bacaan yang menarik sciencedirect.com/science/article/pii/S0167715298000352 (saya belum membacanya sendiri tbh)
martn
penaksir tidak bias varians minimum: projecteuclid.org/euclid.aoms/1177706717
Sextus Empiricus

Jawaban:

10

Ini bukan pertanyaan yang mudah tetapi beberapa ungkapan tersedia. Jika Anda berbicara tentang distribusi Normal pada khususnya, maka jawabannya adalah TIDAK ! Kita punya

Eρ^=ρ[1(1ρ2)2n+O(1n2)]

seperti yang terlihat dalam Bab 2 dari Estimasi Titik Teori Lehmann. Ada banyak istilah yang tak terhingga dalam ungkapan di atas, tetapi kami pada dasarnya mempertimbangkan istilah dengan urutan yang sama atau lebih rendah daripada dapat diabaikan.n2

Rumus ini menunjukkan bahwa koefisien korelasi sampel hanya tidak bias untuk , yaitu independensi, seperti yang diharapkan. Ini juga tidak bias untuk kasus-kasus degenerasi dengan , tapi itu tidak terlalu menarik. Secara umum, biasnya dalam urutan tetapi cukup kecil untuk semua ukuran sampel yang masuk akal.ρ=0|ρ|=11n

Dalam distribusi normal, koefisien korelasi sampel adalah mle, yang berarti tidak bias secara asimptotik. Anda juga dapat melihatnya dari rumus di atas sebagai . Perhatikan bahwa ini sudah mengikuti dari batasan dan konsistensi dari koefisien korelasi sampel melalui teorema konvergensi terikat.Eρ^ρ

JohnK
sumber
2
Mungkin ada banyak istilah yang tak terhingga dalam ungkapan di atas, tetapi "istilah tak terbatas" akan ada beberapa istilah, yang masing-masing tak terbatas.
Michael Hardy
|ρ|=1|r|1
|1|
Untuk pertanyaan terkait, apakah ada yang tahu jika ada hasil analog untuk distribusi lain selain 2D normal?
Riemann1337