Apa trik ini dengan menambahkan 1 di sini?

Saya melihat halaman ini tentang implementasi tes Carlofors dari Lillefors. Saya tidak mengerti kalimat ini:

Ada kesalahan acak dalam perhitungan ini dari simulasi. Namun, karena trik menambahkan 1 ke pembilang dan penyebut dalam menghitung nilai-P dapat digunakan langsung tanpa memperhatikan keacakan.

Apa yang mereka maksud dengan trik menambahkan 1 ke pembilang dan penyebut?

Sepotong kode yang relevan ada di sini:

n <- length(x)
nsim <- 4999
d.star <- double(nsim)
for (i in 1:nsim) {
    x.star <- rnorm(n)
    d.star[i] <- fred(x.star)
}
hist(d.star)
abline(v = d.hat, lty = 2)
## simulation-derived P-value
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)

monte-carlo lilliefors Aksakal
sumber

Bisakah Anda menambahkan konteks yang relevan di sini?

gung - Reinstate Monica

Sepertinya Laplace menghaluskan untuk penduga probabilitas Monte Carlo, yang menyusutkannya menjadi 1/2; efek utama mungkin adalah untuk menghindari mendapatkan nilai p 0, seperti yang dicatat oleh @Tim (meskipun tidak ada risiko membagi dengan 0 seperti yang dia katakan kecuali jika Anda melakukan 0 simulasi). Saya tidak benar-benar mengerti mengapa ini memungkinkan Anda untuk menggunakannya "tanpa memperhatikan keacakan", meskipun.

Dougal

Sudahkah Anda menulis Geyer langsung untuk bertanya apa arti kalimat itu?

Alexis

@Alexis, tidak, tapi itu ide yang bagus.

Aksakal

@Dougal, ya, memang terlihat seperti Laplace smoothing. Tidak jelas mengapa dia menerapkannya di sini.

Aksakal

Jawaban:

Penjelasan pada halaman referensi adalah

Di bawah hipotesis nol probabilitas persis ketika kedua keacakan dalam data dan keacakan dalam simulasi diperhitungkan. $\Pr(P \le k / n_\text{sim})$ $k / n_\text{sim}$

Untuk memahami hal ini, kita harus melihat kode yang garis kuncinya (disingkat jauh)

fred <- function(x) {ks.test(...)$statistic}  # Apply a statistical test to an array
d.hat <- fred(x)                              # Apply the test to the data
d.star <- apply(matrix(rnorm(n*nsim), n, nsim),
                2, fred)                      # Apply the test to nsim simulated datasets
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)# Estimate a simulation p-value

Masalah yang menonjol adalah bahwa kode tidak cocok dengan kutipan. Bagaimana kita bisa mendamaikan mereka? Satu upaya dimulai dengan bagian terakhir dari kutipan. Kami mungkin menginterpretasikan prosedur sebagai terdiri dari langkah-langkah berikut:

Kumpulkan independen dan identik didistribusikan Data menurut beberapa hukum probabilitas . Terapkan prosedur uji (diimplementasikan dalam kode sebagai ) untuk menghasilkan angka . $X_1, X_2, \ldots, X_n$ $G$ $t$ fred $T_0=t(X_1, \ldots, X_n)$
Menghasilkan melalui komputer dataset yang sebanding, masing-masing ukuran , menurut sebuah hipotesis nol dengan hukum probabilitas . Terapkan ke setiap dataset tersebut untuk menghasilkan angka . $N=n_\text{sim}$ $n$ $F$ $t$ $N$ $T_1,T_2,\ldots,T_N$
Hitung
$P = (\sum_{i = 1}^{N} I (T_{i} > T_{0}) + 1) / (N + 1) .$ $P = \left(\sum_{i=1}^N I(T_i \gt T_0) + 1\right) / (N+1).$
(" " adalah fungsi indikator yang diimplementasikan oleh perbandingan bernilai vektor dalam kode.) Sisi kanan dipahami acak berdasarkan keacakan simultan (statistik uji aktual) dan keacakan ( statistik uji simulasi). $I$ d.star > d.hat $T_0$ $T_i$

Untuk mengatakan bahwa data sesuai dengan hipotesis nol adalah untuk menegaskan bahwa . Pilih ukuran uji , . Mengalikan kedua sisi dengan dan mengurangi menunjukkan bahwa peluang bahwa untuk angka apa pun adalah peluang yang tidak lebih dari dari melebihi . Ini hanya mengatakan bahwa terletak di bagian atas dari set statistik semua tes yang diurutkan . Sejak (dengan konstruksi) $F=G$ $\alpha$ $0 \lt \alpha \lt 1$ $N+1$ $1$ $P\le \alpha$ $\alpha$ $(N+1)\alpha - 1$ $T_i$ $T_0$ $T_0$ $(N+1)\alpha$ $N+1$ $T_0$ tidak tergantung pada semua , ketika adalah distribusi kontinu, kesempatan ini akan menjadi fraksi dari total yang diwakili oleh bagian integer ; yaitu, dan itu akan persis sama dengan yang disediakan adalah bilangan ; yaitu ketika . $T_i$ $F$ $\lfloor (N+1)\alpha\rfloor$

Pr (P \leq α) = \frac{⌊ (N + 1) α ⌋}{N + 1} \approx α

$\Pr(P\le \alpha)=\frac{\lfloor(N+1)\alpha\rfloor}{N+1} \approx \alpha$

(N + 1) α

$(N+1)\alpha$

k

$k$

α = k / (N + 1)

$\alpha = k/(N+1)$

Ini tentu saja adalah salah satu hal yang ingin kita benar dari kuantitas apa pun yang pantas disebut "nilai-p": itu harus memiliki distribusi yang seragam pada . Asalkan cukup besar, sehingga setiap dekat dengan sebagian kecil dari bentuk , ini akan memiliki dekat dengan seragam distribusi. (Untuk mempelajari tentang kondisi tambahan yang diperlukan dari nilai-p, silakan baca dialog yang saya pasang pada subjek nilai-p. ) $[0,1]$ $N+1$ $\alpha$ $k/(N+1) = k/(n_\text{sim}+1)$ $P$

Jelas kutipan harus menggunakan " " bukannya " " di mana pun itu muncul. $n_\text{sim}+1$ $n_\text{sim}$

whuber
sumber

Saya percaya bahwa di sini, 1 ditambahkan ke keduanya karena statistik yang diamati termasuk dalam distribusi referensi; jika ini masalahnya, itu karena bagian "paling tidak sebesar" dari definisi nilai-p.

Saya tidak tahu pasti karena teks tersebut sepertinya mengatakan sesuatu yang berbeda, tetapi itulah sebabnya saya melakukannya.

Glen_b -Reinstate Monica
sumber

@whuber aku tidak mengerti bagaimana aku bisa setuju. Tidak semua tes adalah tes rasio kemungkinan; ketika mereka bukan LRT, relevansi apa yang dapat menafsirkannya berdasarkan rasio kemungkinan?

Glen_b -Reinstate Monica

@whuber Tentu saja bisa. Tetapi pertimbangkan, misalnya, sebuah Wilcoxon-Mann-Whitney (atau memang, tes permutasi lebih luas). Ada sejumlah tes masuk akal sempurna dalam penggunaan luas yang bukan tes Lilliefors atau tes rasio kemungkinan. Ketika ada alternatif yang jelas terhadap kekuatan yang diinginkan, seringkali mungkin untuk membangun statistik uji yang bermakna di mana pemesanan pada ruang sampel yang diberikan oleh statistik uji masuk akal dan memiliki sifat yang wajar dalam berbagai alternatif.

Glen_b -Reinstate Monica

Tentu saja ketika datang dengan statistik uji yang sesuai dengan (dalam arti mengambil nilai-nilai yang lebih ekstrim, apakah lebih besar, lebih kecil atau keduanya) jenis alternatif yang diminati, seseorang menarik untuk "jenis alternatif yang tertarik "- tetapi bahkan jika seseorang menggunakan tes yang tidak dapat diterima (bahkan, tes yang tidak berguna), prinsip yang saya garis besarkan dalam jawaban saya termasuk memasukkan sampel yang diamati dalam hasil simulasi masih akan berlaku. Setelah Anda memesan, bahkan jika itu bukan yang terbaik, saat menghitung nilai-p, kasing yang diamati masih termasuk dalam hitungan.

Glen_b -Reinstate Monica

@whuber kita mungkin tidak begitu jauh sekarang. Dalam memilih statistik uji yang wajar kita tentu ingin menarik sesuatu . Tetapi begitu kita memiliki statistik uji (seperti yang harus kita miliki pada saat kita mensimulasikan di bawah nol), kita sudah melakukannya. Dan begitu kita miliki, alasan mengapa kita akan memasukkan kasus yang diamati dalam perhitungan nilai-p adalah karena apa nilai-p itu.

Glen_b -Reinstate Monica

Saya tidak berpikir kita memiliki perbedaan sama sekali. (Perhatikan bahwa jawaban saya sendiri memperjelas bahwa memasukkan sampel yang diamati dalam penghitungan sudah sesuai.) Komentar saya tidak diarahkan pada jawaban Anda atas pertanyaan (yang saya setujui dan tingkatkan), tetapi hanya pada frasa bermasalah "setidaknya sama besar. " Saya melihat frase yang disalahartikan di begitu banyak tempat di situs ini (dan di tempat lain) bahwa saya ingin menarik perhatian pembaca dengan apa yang harus benar-benar berarti.

whuber