Mengapa replikasi saya Silver & Dunlap 1987 tidak berhasil?

8

Saya mencoba meniru Silver & Dunlap (1987) . Saya hanya membandingkan rata-rata korelasi atau rata-rata z mentransformasi korelasi dan mengubah kembali. Saya sepertinya tidak mereplikasi asimetri dalam bias yang mereka temukan (zs yang ditransformasikan kembali tidak mendekati nilai populasi bagi saya daripada rs). Adakah pikiran? Mungkinkah kekuatan komputasi 1987 tidak menjelajahi ruang cukup?

# Fisher's r2z
fr2z <- atanh
# and back
fz2r <- tanh

# a function that generates a matrix of two correlated variables
rcor <- function(n, m1, m2, var1, var2, corr12){
    require(MASS)
    Sigma <- c(var1, sqrt(var1*var2)*corr12, sqrt(var1*var2)*corr12, var2)
    Sigma <- matrix(Sigma, 2, 2)
    return( mvrnorm(n, c(m1,m2), Sigma, empirical=FALSE) )
    }

Dengan fungsi ini mudah untuk melihat sekelompok korelasi (pada dasarnya mereplikasi perak dan dunlap 1987) dan melihat perbedaan antara rata-rata korelasi dan rata-rata skor-z dan transformasi balik. Ini baru satu.

r <- 0.9
Y <- replicate(20000, rcor(10, 0, 0, 1, 1, r))
rs <- apply(Y, 3, function(x) cor(x[,1], x[,2]))
mean(rs) - r
zs <- fr2z(rs)
fz2r( mean(zs) ) - r

Hanya dengan melihat ukuran sampel 10 dan korelasi 0,1, 0,5, dan 0,9 inilah hasilnya.

     rho  r bias   z bias
     0.1  -0.006   0.006
     0.5  -0.024   0.021
     0.9  -0.011   0.011

Dan ini berasal dari Tabel 1 Silver & Dunlap.

     rho  r bias   z bias
     0.1  -0.007   0.003
     0.5  -0.025   0.001
     0.9  -0.011  -0.007

Ini adalah hasil yang sangat berbeda. Dari tes saya, saya melihat bahwa itu hanya masalah arah bias, bukan besarnya. Tapi, dalam makalah yang diterbitkan mereka menemukan jauh lebih kecil dengan z. Saya tidak dapat menemukan non-replikasi yang diterbitkan.

John
sumber
Saya terjebak di dua baris pertama Anda. Mereka tampaknya tidak benar R sintaks. Mereka juga tampaknya berasumsi bahwa atanh adalah kebalikannya sendiri, tetapi tidak: tanh adalah kebalikan dari atanh.
whuber
Mereka hanya kesalahan ketik dalam pertanyaan ... diperbaiki.
John
1
Bagi saya, hanya dengan mata, r biasuntuk rho0,5 di tabel Silver & Dunlap tampak seperti outlier bagi saya. Saya tentu tidak dapat menjamin kualitas jurnal, yang tampak cukup baru dan agak kasar, tetapi saya memang menemukan makalah baru-baru ini dengan pencarian Google. Lihat, khususnya, Tabel 3 mereka yang, sekali lagi, dengan mata, tampaknya menguatkan hasil Anda.
kardinal
1
@whuber: Cukup benar. Namun, UMVUE dari dalam kasus normal bivariat --- seperti yang mungkin Anda ketahui --- dikenal (cukup) dikenal sebagaiDi sini adalah MLE. Terkadang estimator ini muncul di bawah notasi . ρ
rΓ((n2)/2)Γ(1/2)Γ((n3)/2)01u1/2(1u)(n5)/21u(1r2)du.
rG(r)
kardinal
1
@whuber: Anda mendapat poin bagus. Saya juga tidak memiliki akses siap ke kertas S & D, jadi komentar saya telah dikurangi menjadi dugaan. Jika kita pernah bertemu secara langsung, saya akan bertukar satu atau dua cerita dengan Anda lebih dari satu bir pada frustrasi berurusan dengan mereka yang bersikeras pada rata-rata korelasi. Saya setuju dengan sepenuh hati dengan komentar Anda tentang masalah ini. Yang mengatakan, mungkin masuk akal dalam beberapa pengaturan yang saya biasanya kurang terbiasa. :)
kardinal

Jawaban:

9

Bagi saya, r biasentri untuk rho0,5 di tabel Silver & Dunlap terlihat sangat mencurigakan bagi saya. Namun, mengatakan bahwa, itu tidak sesuai dengan nilai perkiraan cukup erat.

Sayangnya, saya tidak memiliki akses ke kertas Silver & Dunlap saat ini, tetapi pencarian Google ternyata menghasilkan makalah baru-baru ini yang melakukan penelitian serupa dengan yang telah Anda lakukan. ini

RL Gorsuch dan CS Lehmann (2010), koefisien korelasi: Bias rata-rata dan distorsi interval kepercayaan , Jurnal Metode dan Pengukuran dalam Ilmu Sosial , vol. 1, tidak. 2, 52–65.

Lihat, khususnya, Tabel 3 mereka yang, setidaknya dengan mata, tampaknya menguatkan hasil Anda.

Saya tentu saja tidak dapat menjamin kualitas jurnal (atau seluruh makalah), yang terlihat cukup baru dan agak kasar, menurut perkiraan saya. Lektor peringatan.

Untuk perawatan inferensi yang mendalam, lebih teoretis, tentang korelasi (sederhana, parsial, dan banyak) terutama dalam kerangka kerja normal multivariat, referensi yang baik adalah

FA Graybill, Teori dan penerapan model linier , Duxbury Press, 1976, Bab 11 .

Namun, hal itu tidak terlalu mementingkan kinerja sampel kecil atau aspek terapan.

kardinal
sumber