Tes permutasi adalah tes signifikansi berdasarkan sampel permutasi yang diambil secara acak dari data asli. Contoh permutasi diambil tanpa penggantian, berbeda dengan sampel bootstrap, yang ditarik dengan penggantian. Berikut adalah contoh yang saya lakukan di R dari tes permutasi sederhana. (Komentar Anda diterima)
Tes permutasi memiliki keuntungan besar. Mereka tidak memerlukan bentuk populasi tertentu seperti normalitas. Mereka berlaku untuk berbagai statistik, bukan hanya untuk statistik yang memiliki distribusi sederhana di bawah hipotesis nol. Mereka dapat memberikan nilai-p yang sangat akurat, terlepas dari bentuk dan ukuran populasi (jika cukup permutasi digunakan).
Saya juga telah membaca bahwa sering kali berguna untuk memberikan interval kepercayaan bersama dengan tes, yang dibuat menggunakan bootstrap resampling daripada permutasi resampling.
Bisakah Anda menjelaskan (atau hanya memberikan kode R) bagaimana interval kepercayaan dibangun (yaitu untuk perbedaan antara rata-rata dari dua sampel dalam contoh di atas)?
EDIT
Setelah beberapa googling saya menemukan bacaan yang menarik ini .
sumber
sample
danreplace=TRUE
? Apakah ada alasan untuk menggunakan paket sepertiboot
?sum(b$t>=b$t0)/b$R
Karena tes permutasi adalah tes yang tepat , memberi Anda nilai p yang tepat. Bootstrap tes permutasi tidak masuk akal.
Selain itu, menentukan interval kepercayaan di sekitar statistik uji juga tidak masuk akal, karena dihitung berdasarkan sampel Anda dan bukan perkiraan. Anda menentukan interval kepercayaan di sekitar perkiraan suka cara dan suka, tetapi tidak di sekitar statistik uji.
Tes permutasi tidak boleh digunakan pada dataset yang sangat besar sehingga Anda tidak dapat menghitung semua permutasi yang mungkin terjadi lagi. Jika itu masalahnya, gunakan prosedur bootstrap untuk menentukan cut-off untuk statistik uji yang Anda gunakan. Tetapi sekali lagi, ini tidak ada hubungannya dengan interval kepercayaan 95%.
Contoh: Saya menggunakan statistik T-klasik di sini, tetapi menggunakan pendekatan sederhana untuk bootstrap untuk perhitungan distribusi empiris statistik saya. Berdasarkan itu, saya menghitung nilai-p empiris:
Mempertimbangkan bahwa pengujian 2-sisi ini hanya berfungsi untuk distribusi simetris. Distribusi non-simetris biasanya hanya diuji satu sisi.
EDIT:
OK, saya salah paham pertanyaannya. Jika Anda ingin menghitung interval kepercayaan pada estimasi perbedaan, Anda dapat menggunakan kode yang disebutkan di sini untuk bootstrap dalam setiap sampel. Pikiran Anda, ini adalah estimasi yang bias: umumnya ini memberikan CI yang terlalu kecil. Lihat juga contoh yang diberikan di sana sebagai alasan mengapa Anda harus menggunakan pendekatan yang berbeda untuk interval kepercayaan dan nilai-p.
sumber
x[6:11]
merujuk pada argumenx
fungsi anonim dalam berlaku. Mungkin membingungkan, tetapi hasil edit Anda memberikan hasil yang sangat salah. Berikan komentar tentang apa yang Anda pikirkan sebelum mengedit kode. Menghemat rollback saya. Untuk menghindari kebingungan lebih lanjut, saya mengubahnyax
kei
Dari kode Joris Meys di Jawaban tetapi dengan modifikasi untuk memungkinkannya diterapkan lebih dari satu situasi:
Saya mencoba mengedit yang lain tetapi saya tidak punya waktu untuk menyelesaikannya dan untuk beberapa alasan saya tidak dapat berkomentar (mungkin karena ini adalah pertanyaan lama).
sumber