Bagaimana cara melakukan tes bootstrap untuk membandingkan cara dua sampel?

12

Saya memiliki dua sampel yang sangat miring dan saya mencoba menggunakan bootstrap untuk membandingkan cara mereka menggunakan t-statistik.

Apa prosedur yang benar untuk melakukannya?


Proses yang saya gunakan

Saya khawatir tentang kesesuaian menggunakan kesalahan standar data asli / yang diamati pada langkah terakhir ketika saya tahu bahwa ini tidak terdistribusi secara normal.

Inilah langkah-langkah saya:

  • Bootstrap - sampel acak dengan penggantian (N = 1000)
  • Hitung statistik-t untuk setiap bootstrap untuk membuat distribusi-t:
    T(b)=(X¯b1X¯b2)(X¯1X¯2)σxb12/n+σxb22/n
  • Perkirakan interval kepercayaan t dengan mendapatkan persentil distribusi danα/21α/2
  • Dapatkan interval kepercayaan melalui:

    CIL=(X¯1X¯2)T_CIL.SEoriginal
    CIU=(X¯1X¯2)+T_CIU.SEoriginal
    mana
    SE=σX12/n+σX22/n
  • Lihat di mana interval kepercayaan jatuh untuk menentukan apakah ada perbedaan yang signifikan dalam berarti (yaitu tidak nol)

Saya juga telah melihat Wilcoxon rank-sum tetapi tidak memberikan hasil yang sangat masuk akal karena distribusi yang sangat miring (mis. 75 == persentil ke-95). Untuk alasan ini saya ingin mengeksplorasi t-test bootstrap lebih lanjut.

Jadi pertanyaan saya adalah:

  1. Apakah ini metodologi yang tepat?
  2. Apakah tepat untuk menggunakan SE dari data yang diamati ketika saya tahu itu sangat miring?

Kemungkinan rangkap: Metode apa yang lebih disukai, tes bootstrap atau tes berbasis peringkat nonparametrik?

CatsLoveJazz
sumber
Berapa besar sampel?
Michael M
@Michael Mayer Sekitar 800
CatsLoveJazz
Lihat juga stats.stackexchange.com/questions/189587
amoeba berkata Reinstate Monica

Jawaban:

16

Saya hanya akan melakukan tes bootstrap biasa:

  • menghitung statistik-t dalam data Anda dan menyimpannya
  • ubah data sedemikian rupa sehingga hipotesis nol itu benar. Dalam hal ini, kurangi rata-rata dalam kelompok 1 untuk kelompok 1 dan tambahkan rata-rata keseluruhan, dan lakukan hal yang sama untuk kelompok 2, dengan cara itu rata-rata di kedua kelompok akan menjadi rata-rata keseluruhan.
  • Ambil sampel bootstrap dari dataset ini, mungkin sekitar 20.000.
  • hitung statistik t di masing-masing sampel bootstrap ini. Distribusi t-statistik ini adalah perkiraan bootstrap dari distribusi sampling t-statistik dalam data Anda yang miring jika hipotesis nol itu benar.
  • Proporsi statistik t bootstrap yang lebih besar dari atau sama dengan statistik t yang Anda amati adalah estimasi nilai- Anda. Anda dapat melakukan sedikit lebih baik dengan melihat jumlah statistik bootstrap t yang lebih besar atau sama dengan statistik t yang diamati dibagi dengan jumlah sampel bootstrap . Namun, perbedaannya akan menjadi kecil ketika jumlah sampel bootstrap besar.p(+1)(+1)

Anda dapat membaca lebih lanjut tentang itu di:

  • Bab 4 dari AC Davison dan DV Hinkley (1997) Metode Bootstrap dan Penerapannya . Cambridge: Cambridge University Press.

  • Bab 16 dari Bradley Efron dan Robert J. Tibshirani (1993) Pengantar Bootstrap . Boca Raton: Chapman & Hall / CRC.

  • Entri Wikipedia tentang pengujian hipotesis bootstrap.

Maarten Buis
sumber
Ini pada dasarnya adalah apa yang saya lakukan tetapi melihat proporsi dari t-statistik asli / yang diamati>> t-statistik bootsrapped. Apakah boleh melakukan uji-t pada data yang sangat miring pada contoh pertama, ini adalah salah satu alasan mengapa saya ingin meningkatkan.
CatsLoveJazz
2
Secara teknis, untuk tes bootstrap Anda hanya perlu uji statistik sehingga tidak menjadi masalah. Secara substansial, uji-t membandingkan rata-rata dan pada data yang miring median seringkali lebih bermakna daripada rata-rata. Jadi, sebuah tes yang membandingkan median dan bukan cara mungkin lebih masuk akal. Namun, itu tergantung pada hipotesis nol Anda, yang merupakan pilihan Anda dan pilihan Anda sendiri.
Maarten Buis
Ok terima kasih, ini adalah nilai rata-rata yang ingin kami uji karena semua output kami yang lain ada di formulir ini.
CatsLoveJazz