Kapan / mengapa kecenderungan sentral dari simulasi resampling berbeda dari nilai yang diamati?

Haruskah seseorang selalu mengharapkan kecenderungan sentral (yaitu, rata-rata dan / atau median) sampel yang di-boot sama dengan nilai yang diamati?

Dalam kasus khusus ini saya memiliki tanggapan yang didistribusikan secara eksponensial untuk subjek di dua kondisi (saya tidak menjalankan eksperimen, saya hanya punya data). Saya telah ditugaskan untuk boot dengan ukuran efek (dalam hal Cohen d, rumus satu-sampel, yaitu $\bar{M_D}\over{s_D}$ dimana estimasi sampel dari standar deviasi populasi. Forum untuk ini disediakan dalam Rosenthal & Rosnow (2008) pada hal 398, persamaan 13.27. Mereka menggunakan $\sigma$ dalam penyebut karena secara historis benar, namun praktik standar telah salah mendefinisikan sebagai penggunaan $s$ , dan saya menindaklanjuti dengan kesalahan itu dalam perhitungan di atas.

Saya telah secara acak baik di dalam peserta (yaitu peserta RT dapat sampel lebih dari sekali) dan di seluruh mata pelajaran (peserta dapat sampel lebih dari satu kali) sehingga bahkan jika peserta 1 sampel dua kali, RT rata-rata mereka di kedua sampel tidak mungkin persis sama. Untuk setiap dataset acak / resampled, saya menghitung ulang d. Pada kasus ini $N_{sim} = 10000$ . Apa yang saya amati adalah tren untuk nilai yang diamati dari Cohen d yang biasanya lebih dekat dengan persentil ke-97,5 dari ke persentil ke-2,5 dari nilai-nilai yang diamati yang disimulasikan. Ia juga cenderung lebih dekat ke 0 daripada median bootstrap (sebesar 5% hingga 10% dari kepadatan distribusi yang disimulasikan).

Apa yang bisa menjelaskan hal ini (mengingat besarnya efek yang saya amati)? Apakah karena lebih mudah melakukan resampling untuk mendapatkan varians yang lebih ekstrem daripada yang diamati relatif terhadap ekstremitas rata-rata pada saat resampling? Mungkinkah ini merupakan cerminan dari data yang telah dipijat / dipilih secara selektif? Apakah pendekatan resampling ini sama dengan bootstrap? Jika tidak, apa lagi yang harus dilakukan untuk menghasilkan CI?

bootstrap simulation effect-size cohens-d russellpierce
sumber

Setiap statistik nonlinear (kombinasi non-linear dari statistik linear seperti rata-rata sampel) memiliki bias sampel kecil. Cohen $d$ jelas tidak terkecuali: pada dasarnya

d = \frac{m_{1} - m_{2}}{\sqrt{m_{3} - m_{4}^{2}}}

$d=\frac{m_1 - m_2}{\sqrt{m_3-m_4^2}}$ yang cukup non-linear, setidaknya sejauh istilah dalam penyebut pergi. Setiap momen dapat dianggap sebagai penaksir yang tidak bias dari apa yang seharusnya diperkirakan:

\begin{array}{ll} m_{1} & = \frac{1}{n_{1}} \sum_{saya \in kelompok 1} y_{saya}, \\ m_{2} & = \frac{1}{n_{2}} \sum_{saya \in kelompok 2} y_{saya}, \\ m_{3} & = \frac{1}{n_{1} + n_{2}} \sum_{saya} y_{saya}^{2}, \\ m_{4} & = \frac{1}{n_{1} + n_{2}} \sum_{saya} y_{saya}, \end{array}

$\begin{array}{ll} m_1 & = \frac1{n_1} \sum_{i\in\mbox{group }1} y_i , \\ m_2 & = \frac1{n_2} \sum_{i\in\mbox{group }2} y_i , \\ m_3 & = \frac1{n_1+n_2} \sum_{i} y_i^2 , \\ m_4 & = \frac1{n_1+n_2} \sum_{i} y_i , \\ \end{array}$ Namun, dengan ketimpangan Jensen tidak ada cara di Bumi Anda mendapatkan penaksir yang tidak bias dari jumlah populasi dari kombinasi nonlinear. Jadi

E [d] \neq

${\mathbb{E}}[ d]\neq$ populasi

d

$d$ dalam sampel hingga, meskipun bias biasanya dari urutan

O (1 / n)

$O(1/n)$ . Artikel Wikipedia tentang ukuran efek menyebutkan bias sampel kecil dalam diskusi tentang Hedges '

g

$g$ .

Saya membayangkan bahwa Cohen $d$ memiliki rentang terbatas (dalam kasus ekstrim, jika tidak ada variabilitas dalam grup, maka $d$ harus sama $\pm 2$ , benar?), maka distribusi samplingnya harus miring, yang berkontribusi pada bias sampel hingga (beberapa fungsi dari kemiringan distribusi sampel biasanya pengganda di depan $1/n$ yang saya sebutkan di atas). Semakin dekat Anda dengan batas rentang yang diizinkan, semakin miring kemiringannya.

Apa yang dilakukan bootstrap, secara agak ajaib mengingat bahwa ini adalah metode yang sangat sederhana, adalah membuat Anda mampu memperkirakan bias sampel terbatas ini melalui perbandingan rata-rata bootstrap dan perkiraan dari sampel asli. (Perlu diingat bahwa kecuali Anda membuat penyesuaian khusus tentang cara pengambilan sampel bootstrap, yang pertama akan dikenakan variabilitas Monte Carlo.) Saya memberikan penjelasan yang lebih rinci dan lebih teknis dalam pertanyaan bootstrap lain yang mungkin layak dibaca.

Sekarang jika ada bias positif, yaitu estimasi berdasarkan sampel asli bias ke atas relatif terhadap populasi $d$ , maka bootstrap akan mengejek itu dan menghasilkan perkiraan yang, rata-rata, bahkan lebih tinggi dari perkiraan sampel. Sebenarnya tidak seburuk kedengarannya, karena Anda dapat mengukur bias dan mengurangi dari estimasi awal. Jika estimasi awal suatu kuantitas adalah $\hat\theta_n$ , dan bootstrap rata-rata dari replikasi bootstrap adalah $\bar\theta^*_n$ , maka estimasi bias adalah $\hat b_n=\bar\theta^*_n-\hat\theta_n$ , dan estimasi yang dikoreksi bias adalah $\hat\theta_n - \hat b_n=2\hat\theta_n - \bar\theta^*_n$ .

Tugas
sumber

Saya sudah menyadari bahwa Cohen d adalah statistik yang bias. Saya menghargai detail tentang alasan mengapa bias. Namun demikian, saya agak skeptis bahwa itu bias ke tingkat yang saya amati. Artikel Wikipedia tidak mendefinisikan 'a' dalam persamaan referensi. Selain itu persamaan yang direferensikan dan persamaan Anda tampaknya merujuk pada dua versi sampel Cohen d. Jadi, saya tidak yakin seberapa besar bias yang harus saya harapkan dalam kasus ini dan apakah jawaban Anda mencakup perbedaan yang saya lihat.

russellpierce

Saya juga tidak jelas tentang cara menggabungkan dua paragraf terakhir Anda. Bootstrap akan memungkinkan Anda untuk memperkirakan bias tetapi juga akan menghasilkan hasil yang lebih bias daripada sampel asli?

russellpierce

Tidak ada

a

$a$ dalam formula saya - apa itu

a

$a$ yang Anda maksud? Saya memperbarui paragraf terakhir untuk menunjukkan cara mendapatkan perkiraan bootstrap yang bias diperbaiki. Saya bukan ahli ukuran efek, dan Anda tidak memberikan tautan apa pun, jadi saya telah menggunakan informasi terbaik yang tersedia bagi saya, yaitu Wikipedia. Jika 1-sampel Cohen

d

$d$ serupa, dan juga nonlinier, maka penjelasan saya berlaku secara kualitatif.

Tugas

Hedge's g formula dalam artikel yang ditautkan menggunakan

a

$a$ . Saya akan memperbarui pertanyaan saya untuk menyertakan satu sampel referensi Cohen. Ini memang non-linear. Respons Anda memprediksi

O (1 / n)

$O(1/n)$ Bias, tapi perbedaan yang diamati jauh lebih ekstrim dari itu, jadi saya tidak berpikir jawaban Anda mencakup masalah yang saya lihat. Saya telah memberikan rincian lebih lanjut di atas - mungkin saya tidak menerapkan prosedur bootstrap dengan benar.

russellpierce

O (1 / n)

$O(1/n)$ hanya kurs. Saya telah melihat beberapa hasil yang cukup konyol di mana konstan di depan itu

1 / n

$1/n$ istilah diturunkan (jangan salah paham, pengangkatan yang sangat berat ini menghasilkan konstanta ini, lebih sulit daripada menetapkan kurs itu sendiri), sehingga semuanya tampak seperti

1 - 10^{8} / n

$1-10^8/n$ untuk probabilitas yang seharusnya konvergen ke 1.

a

$a$ dalam rumus Wikipedia hanya indeks dummy, seperti

i

$i$ dalam penjumlahan atau

x

$x$ dalam integrasi; siapa pun yang menulis artikel hanya menancapkannya di sana untuk menunjukkan itu

J (a)

$J(a)$ adalah singkatan untuk rasio fungsi gamma.

Tugas

Kapan / mengapa kecenderungan sentral dari simulasi resampling berbeda dari nilai yang diamati?

Jawaban: