Saya melihat halaman ini tentang implementasi tes Carlofors dari Lillefors. Saya tidak mengerti kalimat ini:
Ada kesalahan acak dalam perhitungan ini dari simulasi. Namun, karena trik menambahkan 1 ke pembilang dan penyebut dalam menghitung nilai-P dapat digunakan langsung tanpa memperhatikan keacakan.
Apa yang mereka maksud dengan trik menambahkan 1 ke pembilang dan penyebut?
Sepotong kode yang relevan ada di sini:
n <- length(x)
nsim <- 4999
d.star <- double(nsim)
for (i in 1:nsim) {
x.star <- rnorm(n)
d.star[i] <- fred(x.star)
}
hist(d.star)
abline(v = d.hat, lty = 2)
## simulation-derived P-value
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)
monte-carlo
lilliefors
Aksakal
sumber
sumber
Jawaban:
Penjelasan pada halaman referensi adalah
Untuk memahami hal ini, kita harus melihat kode yang garis kuncinya (disingkat jauh)
Masalah yang menonjol adalah bahwa kode tidak cocok dengan kutipan. Bagaimana kita bisa mendamaikan mereka? Satu upaya dimulai dengan bagian terakhir dari kutipan. Kami mungkin menginterpretasikan prosedur sebagai terdiri dari langkah-langkah berikut:
Kumpulkan independen dan identik didistribusikan Data menurut beberapa hukum probabilitas . Terapkan prosedur uji (diimplementasikan dalam kode sebagai ) untuk menghasilkan angka . G t T 0 = t ( X 1 , ... , X n )X1,X2,…,Xn G t T0=t(X1,…,Xn)
fred
Menghasilkan melalui komputer dataset yang sebanding, masing-masing ukuran , menurut sebuah hipotesis nol dengan hukum probabilitas . Terapkan ke setiap dataset tersebut untuk menghasilkan angka . n F t N T 1 , T 2 , … , T NN=nsim n F t N T1,T2,…,TN
Hitung
(" " adalah fungsi indikator yang diimplementasikan oleh perbandingan bernilai vektor dalam kode.) Sisi kanan dipahami acak berdasarkan keacakan simultan (statistik uji aktual) dan keacakan ( statistik uji simulasi). T 0 T iI T0 Ti
d.star > d.hat
Untuk mengatakan bahwa data sesuai dengan hipotesis nol adalah untuk menegaskan bahwa . Pilih ukuran uji , . Mengalikan kedua sisi dengan dan mengurangi menunjukkan bahwa peluang bahwa untuk angka apa pun adalah peluang yang tidak lebih dari dari melebihi . Ini hanya mengatakan bahwa terletak di bagian atas dari set statistik semua tes yang diurutkan . Sejak (dengan konstruksi)F=G α 0<α<1 N+1 1 P≤α α (N+1)α−1 Ti T0 T0 (N+1)α N+1 T0 tidak tergantung pada semua , ketika adalah distribusi kontinu, kesempatan ini akan menjadi fraksi dari total yang diwakili oleh bagian integer ; yaitu, dan itu akan persis sama dengan yang disediakan adalah bilangan ; yaitu ketika .Ti F ⌊(N+1)α⌋ (N+1)αkα=k/(N+1)
Ini tentu saja adalah salah satu hal yang ingin kita benar dari kuantitas apa pun yang pantas disebut "nilai-p": itu harus memiliki distribusi yang seragam pada . Asalkan cukup besar, sehingga setiap dekat dengan sebagian kecil dari bentuk , ini akan memiliki dekat dengan seragam distribusi. (Untuk mempelajari tentang kondisi tambahan yang diperlukan dari nilai-p, silakan baca dialog yang saya pasang pada subjek nilai-p. )N + 1 α k / ( N + 1 ) = k / ( n sim + 1 ) P[0,1] N+1 α k/(N+1)=k/(nsim+1) P
Jelas kutipan harus menggunakan " " bukannya " " di mana pun itu muncul.n simnsim+1 nsim
sumber
Saya percaya bahwa di sini, 1 ditambahkan ke keduanya karena statistik yang diamati termasuk dalam distribusi referensi; jika ini masalahnya, itu karena bagian "paling tidak sebesar" dari definisi nilai-p.
Saya tidak tahu pasti karena teks tersebut sepertinya mengatakan sesuatu yang berbeda, tetapi itulah sebabnya saya melakukannya.
sumber