Kapan z-transform cocok?

13

Saya ingin menguji korelasi sampel untuk signifikansi, menggunakan nilai-p, yaitur

H0:ρ=0,H1:ρ0.

Saya mengerti bahwa saya dapat menggunakan z-transform Fisher untuk menghitungnya

zobs=n32ln(1+r1r)

dan menemukan nilai-p oleh

p=2P(Z>zobs)

menggunakan distribusi normal standar.

Pertanyaan saya adalah: seberapa besar n seharusnya transformasi yang tepat? Jelas, n harus lebih besar dari 3. Buku teks saya tidak menyebutkan batasan, tetapi pada slide 29 dari presentasi ini dikatakan bahwa n harus lebih besar dari 10. Untuk data yang akan saya pertimbangkan, saya akan memiliki sesuatu seperti 5n10 .

Gunnhild
sumber
2
The Wikipedia halaman daftar standard error yang diberikan oleh di mana adalah ukuran sampel. Jadi, Anda membutuhkan setidaknya 4 pasangan lengkap. Saya tidak mengetahui adanya pembatasan di luar itu terkait ukuran sampel. zobs1/N3N
COOLSerdash
8
Tidak yakin seberapa besar mempercayai presentasi dari seseorang yang tidak bisa mengeja nama universitas mereka sendiri. Lebih serius lagi, waspadalah semua saran yang menyiratkan bahwa semuanya baik-baik saja di atas ukuran sampel tertentu dan sebaliknya. Ini masalah kualitas perkiraan yang meningkat dengan lancar dengan ukuran sampel dan juga tergantung pada distribusi data. Saran sederhana adalah sangat berhati-hati, merencanakan semuanya dan mengecek dengan interval kepercayaan bootstrap.
Nick Cox
1
Slide 17 menjelaskan uji-t untuk case khusus . ρ=0
whuber

Jawaban:

8

Untuk pertanyaan seperti ini saya hanya akan menjalankan simulasi dan melihat apakah nilai- berperilaku seperti yang saya harapkan. Nilai- p adalah probabilitas untuk secara acak mengambil sampel yang menyimpang paling tidak dari hipotesis nol seperti data yang Anda amati jika hipotesis nol itu benar. Jadi jika kita memiliki banyak sampel seperti itu, dan salah satu dari mereka memiliki nilai p -0,04 maka kita akan mengharapkan 4% dari sampel tersebut memiliki nilai kurang dari 0,04. Hal yang sama berlaku untuk semua nilai p lainnya yang mungkin .pppp

Di bawah ini adalah simulasi di Stata. Grafik memeriksa apakah nilai- mengukur apa yang seharusnya mereka ukur, yaitu, mereka menunjukkan seberapa besar proporsi sampel dengan nilai p- kurang dari nilai p- menyimpang dari nilai p- nilai. Seperti yang Anda lihat, tes itu agak bermasalah dengan sejumlah kecil pengamatan. Apakah itu terlalu bermasalah untuk penelitian Anda adalah panggilan penilaian Anda.pppp

clear all
set more off

program define sim, rclass
    tempname z se
    foreach i of numlist 5/10 20(10)50 {
        drop _all
        set obs `i'
        gen x = rnormal()
        gen y = rnormal()
        corr x y 
        scalar `z'  = atanh(r(rho))
        scalar `se' = 1/sqrt(r(N)-3)
        return scalar p`i' = 2*normal(-abs(`z'/`se'))
    }
end

simulate p5 =r(p5)  p6 =r(p6)  p7  =r(p7)     ///
         p8 =r(p8)  p9 =r(p9)  p10 =r(p10)    ///
         p20=r(p20) p30=r(p30) p40 =r(p40)    ///
         p50=r(p50), reps(200000) nodots: sim 

simpplot p5 p6 p7 p8 p9 p10, name(small, replace) ///
    scheme(s2color) ylabel(,angle(horizontal)) 

masukkan deskripsi gambar di sini

simpplot p20 p30 p40 p50 , name(less_small, replace) ///
    scheme(s2color) ylabel(,angle(horizontal)) 

masukkan deskripsi gambar di sini

Maarten Buis
sumber
1
Coba kurangi 2,5 bukannya 3 dari :-). n
whuber
5

FWIW Saya melihat rekomendasi dalam Myers & Well (desain penelitian dan analisis statistik, edisi kedua, 2003, hal. 492). Catatan kaki menyatakan:N10

Sebenarnya, transformasi bias dengan jumlah r / ( 2 ( N - 1 ) ) : lihat Pearson dan Hartley (1954, hlm. 29). Bias ini biasanya diabaikan kecuali N kecil dan ρ besar, dan kami abaikan di sini.Zr/(2(N1))Nρ

Burak Aydin
sumber
3
Sepertinya ini adalah jawaban untuk saya.
gung - Reinstate Monica
1

zH0:ρ=0ρrzt

H0:ρ=ρ00ρ0nnα

Poin Nick cukup adil: perkiraan dan rekomendasi selalu beroperasi di beberapa wilayah abu-abu.

n(tα/2s/ϵ)2tsn(1.96s/ϵ)2

Lucozade
sumber
4
zzz
1
zH0:ρ=ρ00t
3
ztρ=0
1
z
ϵn