Apa intuisi di balik sampel yang dapat ditukar di bawah hipotesis nol?

15

Tes permutasi (juga disebut tes pengacakan, uji pengacakan ulang, atau tes yang tepat) sangat berguna dan berguna ketika asumsi distribusi normal yang diperlukan misalnya, t-testtidak terpenuhi dan ketika transformasi nilai dengan peringkat dari tes non-parametrik seperti Mann-Whitney-U-testakan menyebabkan lebih banyak informasi hilang. Namun, satu dan hanya satu asumsi yang tidak boleh diabaikan ketika menggunakan tes semacam ini adalah asumsi pertukaran dari sampel di bawah hipotesis nol. Juga perlu dicatat bahwa pendekatan semacam ini juga dapat diterapkan ketika ada lebih dari dua sampel seperti apa yang diterapkan dalam coinpaket R.

Bisakah Anda menggunakan beberapa bahasa kiasan atau intuisi konseptual dalam bahasa Inggris sederhana untuk menggambarkan asumsi ini? Ini akan sangat berguna untuk memperjelas masalah yang diabaikan ini di kalangan non-ahli statistik seperti saya.

Catatan:
Akan sangat membantu untuk menyebutkan kasus di mana penerapan tes permutasi tidak berlaku atau tidak valid dengan asumsi yang sama.

Pembaruan:
Misalkan saya memiliki 50 subjek yang dikumpulkan dari klinik lokal di distrik saya secara acak. Mereka secara acak ditugaskan untuk menerima obat atau plasebo dengan perbandingan 1: 1. Mereka semua diukur untuk paramerter 1 Par1di V1 (baseline), V2 (3 bulan kemudian), dan V3 (1 tahun kemudian). Semua 50 subjek dapat dibagi menjadi 2 kelompok berdasarkan fitur A; A positif = 20 dan A negatif = 30. Mereka juga dapat dikelompokkan menjadi 2 kelompok lain berdasarkan fitur B; B positif = 15 dan B negatif = 35.
Sekarang, saya memiliki nilai Par1dari semua mata pelajaran di semua kunjungan. Dengan asumsi pertukaran, dapatkah saya melakukan perbandingan antara tingkat Par1menggunakan tes permutasi jika saya akan:
- Membandingkan subyek dengan obat dengan yang menerima plasebo di V2?
- Bandingkan subjek dengan fitur A dengan yang memiliki fitur B di V2?
- Bandingkan subjek yang memiliki fitur A di V2 dengan yang memiliki fitur A tetapi di V3?
- Dalam situasi apa perbandingan ini tidak valid dan akan melanggar asumsi pertukaran?

gelar doktor
sumber
4
Misalkan saya memiliki setiap pengamatan pada selembar kertas lepas yang terpisah dan ketika saya menyerahkan tumpukan itu, saya tergelincir, dan lembaran itu terbang ke segala arah ketika mereka duduk di lantai. Akan memalukan jika itu menghancurkan validitas tes yang Anda harapkan untuk dilakukan pada data tersebut. Jika pengamatan Anda dapat dipertukarkan dan Anda menerapkan tes berdasarkan itu, Anda akan menghibur saya dan mengatakan kepada saya untuk tidak khawatir sambil membantu saya mengumpulkan kertas dari lantai. Jika tidak, dan pengumpulan datanya sangat mahal, saya mungkin harus berlari untuk hidup saya.
kardinal
2
Di sisi lain, pesanan memang penting untuk hal-hal seperti data deret waktu (secara umum) dan pengujian umumnya harus menghormati pesanan ini dengan cara yang tepat.
kardinal
@ kardinal, sementara cerita intuitif Anda telah menggambar gambaran yang jelas tentang bagaimana asumsi ini terlihat, tetapi saya masih bingung bagaimana cara menilai apakah kertas berharga yang jatuh dapat ditukar atau tidak. Anda dapat mencalonkan diri untuk komentar lain jika memungkinkan!
gelar doktor

Jawaban:

7

fXYZ(x=1,y=3,z=2)=fXYZ(x=3,y=2,z=1), dll). Jika ini bukan kasusnya maka penghitungan permutasi bukan cara yang valid untuk menguji hipotesis nol, karena setiap permutasi akan memiliki bobot yang berbeda (probabilitas / kepadatan). Tes permutasi tergantung pada masing-masing penugasan dari serangkaian nilai numerik untuk variabel Anda yang memiliki kepadatan / probabilitas yang sama.

f(x1=1,x2=2,X3=3 ...XN=N)f(x1=N,x2=N-1,X3=N-2 ...XN=1)jadi Anda tidak bisa hanya menghitung permutasi dari nilai 1 sampai N. Secara umum, pertukaran dapat gagal ketika sampel Anda dapat dikelompokkan menjadi sub-kelompok (seperti yang telah saya lakukan dengan stoples). Pertukaran akan dikembalikan jika, contoh mengambil 1 sampel dari N guci, Anda mengambil sampel N dari 1 jar. Kemudian, distribusi gabungan akan menjadi invarian terhadap permutasi.


sumber
+1, meskipun pertukarannya dijelaskan dengan baik tetapi saya masih tersandung mencoba menerapkan metafora guci pada studi di tangan. (lihat pembaruan pertanyaan). Mengingat lamanya kunjungan, dan pengelompokan berdasarkan fitur, bagaimana saya bisa menilai apakah perbandingan nilai-nilai ini dapat ditukar atau tidak?
gelar doktor
@doctorate: sepertinya Anda mengelompokkan grup Anda berdasarkan faktor-faktor yang relevan dengan hasil Par1, benar? Selama Anda menggunakan permutasi dalam kuadran feture A / B tertentu, maka saya akan menganggap subyek Anda dapat dipertukarkan. Tes pertama Anda, yang akan melintasi fitur-fitur, perlu diproses lebih lanjut sebelum Anda dapat menggunakan tes yang bergantung pada pertukaran. khususnya, Anda perlu mengukur efek dari perawatan dan mengoreksi efek perancu dari fitur A dan B - jika tidak, ukuran goup akan memengaruhi hasil keseluruhan (paradoks simpson)
1
@doctorate: Saya menyadari bahwa komentar saya di atas mungkin agak miring seperti yang Anda inginkan: toples dalam kasus Anda adalah pasangan fitur, yaitu (A +, B +), (A-, B +), (A +, B -), (B-, A-) dengan total 4 "stoples". Apakah itu membantu membuatnya menjadi lebih konkret?
Tks, tetapi yang membingungkan non-ahli statistik seperti saya, adalah bagaimana seseorang dapat menilai apakah asumsi ini dipenuhi atau tidak? sering ada tes untuk memeriksa asumsi, misalnya, untuk normalitas ada tes Shapiro-Wilk. Tapi saya ingin tahu tes apa yang akan menguji pertukaran? kalau tidak, definisi itu akan sangat sulit atau kabur dan dua ahli statistik mungkin tidak menyetujui subkelompok ini atau itu. Seperti yang Anda sebutkan, dalam kuadran A / B tidak ada masalah, tetapi dalam Obat / Placebo Anda menunjukkan kekhawatiran. Jadi adakah tes asam untuk asumsi ini?
gelar doktor
2
Sejauh pertukaran, tidak ada "tes" untuk pertukaran. Tidak seperti independensi (yang dapat diuji), pertukaran adalah lebih dari asumsi pemodelan yang telah Anda ambil sampel berulang seperti yang Anda ambil, Anda akan menemukan bahwa setiap permutasi terjadi persis sama dengan fraksi waktu. Anda hanya memiliki 1 sampel, jadi Anda tidak dapat "mengujinya".