Menggunakan bootstrap, saya menghitung nilai p dari tes signifikansi menggunakan dua metode:
- resampling di bawah hipotesis nol dan menghitung hasil setidaknya paling ekstrim sebagai hasil yang berasal dari data asli
- resampling di bawah hipotesis alternatif dan menghitung hasil setidaknya sama jauh dari hasil asli sebagai nilai yang sesuai dengan hipotesis nol
Saya percaya bahwa 1 st pendekatan adalah sepenuhnya benar karena mengikuti definisi nilai ap. Saya kurang yakin tentang yang kedua, tetapi biasanya memberikan hasil yang sangat mirip dan mengingatkan saya pada tes Wald.
Apakah saya benar? Apakah kedua metode ini benar? Apakah identik (untuk sampel besar)?
Contoh untuk dua metode (suntingan setelah pertanyaan DWin dan jawaban Erik):
Contoh 1. Mari kita membuat tes bootstrap mirip dengan dua uji T sampel. Metode 1 akan sampel ulang dari satu sampel (diperoleh dengan menggabungkan dua yang asli). Metode 2 akan melakukan sampel ulang dari kedua sampel secara independen.Contoh 2. Mari kita buat tes bootstrap korelasi antara x₁ ... xₐ dan y₁ ... yₐ. Metode 1 akan menganggap tidak ada korelasi dan sampel ulang memungkinkan untuk (xₑ, yₔ) pasangan mana e ≠ ə. Metode 2 akan mengkompilasi sampel bootstrap dari pasangan asli (x, y).
Contoh 3. Mari kita membuat tes bootstrap untuk memeriksa apakah koin itu adil. Metode 1 akan membuat pengaturan sampel acak Pr (head) = Pr (tail) = ½. Metode 2 akan menguji ulang sampel nilai kepala / ekor eksperimental dan membandingkan proporsinya dengan ½.
sumber
Jawaban:
Pendekatan pertama adalah klasik dan dapat dipercaya tetapi tidak selalu dapat digunakan. Untuk mendapatkan sampel bootstrap dengan asumsi hipotesis nol, Anda harus bersedia untuk mengasumsikan distribusi teoretis untuk dipegang ( ini adalah opsi pertama Anda ) atau untuk menganggap bahwa statistik minat Anda memiliki bentuk distribusi yang sama ketika bergeser ke hipotesis nol ( opsi kedua Anda) ). Sebagai contoh, dengan asumsi biasa, distribusi-t memiliki bentuk yang sama ketika bergeser ke mean lain. Namun, ketika mengubah frekuensi nol 0,5 dari distribusi binomial menjadi 0,025 juga akan berubah bentuk.
Dalam pengalaman saya, jika tidak, dalam hal Anda bersedia membuat asumsi-asumsi ini, Anda seringkali juga memiliki pilihan lain. Dalam contoh Anda 1) di mana Anda tampaknya menganggap bahwa kedua sampel bisa berasal dari populasi basis yang sama tes permutasi akan lebih baik menurut saya.
Ini adalah metode yang sangat fleksibel dan berlaku untuk banyak tes. Namun, sangat penting untuk membuat interval kepercayaan bootstrap yang baik dan tidak hanya menggunakan Wald-approximations atau metode persentil. Beberapa info ada di sini: Interval kepercayaan berbasis-bootstrap
sumber