Apa manfaat menggunakan tes permutasi?

10

Saat menguji beberapa hipotesis nol versus alternatif dengan statistik uji , di manaU(X)X={xi,...,xn} , terapkan tes permutasi dengan setpermutasi padadan kami memiliki statistik GX

T(X):=#{πG:U(πX)U(X)}|G|.
  1. Apa manfaat menggunakan tes permutasi daripada tidak menggunakannya? Yaitu seperti apa saat tes permutasi bekerja?

  2. Kondisi apa yang membuat itu terjadi? Seperti beberapa kondisi pada uji statistik dan / atau pada hipotesis nol?U

Sebagai contoh,

  1. Haruskah sama dengan nilai p berdasarkan , untuk sampel ? Jika ya, mengapa? (referensi juga dihargai)T(X)U(X)X

    Nilai p didefinisikan sebagai . Jika tes permutasi adalah untuk memperkirakan distribusi permutasi U (X) | X = x , bagaimana T (X) sama dengan nilai p U (X) pada X = x ? Terutama, mungkin ada lebih dari satu distribusi di null H , dan T (X) tidak mempertimbangkan distribusi null satu per satu dan kemudian mengambil \ sup_ {F \ in H} dan \ inf_ {c: U (x) \ geq c} .U(X)

    infcR:U(x)csupFHP(U(X)c|XF)
    U(X)|X=xT(X)U(X)X=xHT(X)supFHinfc:U(x)c
  2. Haruskah tes permutasi membuat distribusi T(X) bebas dari hipotesis nol? Kondisi apa yang akan membuat itu terjadi?

  3. Haruskah didistribusikan secara merata ke ? Kondisi apa yang akan membuat itu terjadi? Perhatikan bahwa ketika adalah fungsi konstan, juga konstan pada dan distribusi jauh dari seragam di atas .T(X)[0,1]U()T()1T(X)[0,1]

Terima kasih dan salam!

Tim
sumber
@Glen_b: Terima kasih! Haruskah sama dengan nilai p berdasarkan , untuk sampel ? Jika saya mengerti dengan benar, saya menemukannya di halaman 5 slide ini. Jadi manfaat menggunakan tes permutasi adalah untuk menghitung nilai p dari statistik uji asli tanpa mengetahui distribusi bawah nol? Karena itu, distribusi belum tentu seragam? T(X)U(X)XUXT(X)
Tim
Apakah "T adalah nilai-p (untuk kasus di mana U besar menunjukkan penyimpangan dari nol dan U kecil konsisten dengan itu)", berarti bahwa nilai p untuk statistik uji dan sampel adalah ? UXT(X)
Tim
Mengapa? Apakah ada referensi untuk menjelaskannya?
Tim

Jawaban:

18

Karena diskusi semakin panjang, saya telah mengambil jawaban saya untuk sebuah jawaban. Tapi saya sudah mengubah urutannya.

Tes permutasi "tepat", bukan asimptotik (bandingkan dengan, misalnya, tes rasio kemungkinan). Jadi, misalnya, Anda dapat melakukan tes cara bahkan tanpa dapat menghitung distribusi perbedaan di bawah nol; Anda bahkan tidak perlu menentukan distribusi yang terlibat. Anda dapat merancang statistik uji yang memiliki kekuatan baik di bawah serangkaian asumsi tanpa menjadi sensitif terhadap asumsi-asumsi tersebut sebagai asumsi parametrik sepenuhnya (Anda dapat menggunakan statistik yang kuat tetapi memiliki ARE bagus).

Perhatikan bahwa definisi yang Anda berikan (atau lebih tepatnya, siapa pun yang Anda kutip di sana memberi) tidak universal; beberapa orang akan menyebut U sebagai statistik uji permutasi (yang membuat tes permutasi bukanlah statistik tetapi bagaimana Anda mengevaluasi nilai-p). Tapi begitu Anda melakukan tes permutasi dan Anda telah menetapkan arahan sebagai 'ekstrem dari ini tidak konsisten dengan H0', definisi untuk T di atas pada dasarnya adalah bagaimana Anda menghitung nilai-p - itu hanya proporsi aktual dari distribusi permutasi setidaknya sama ekstrimnya dengan sampel di bawah nol (definisi p-value).

Jadi misalnya, jika saya ingin melakukan tes (satu-ekor, untuk kesederhanaan) dari sarana seperti uji-dua sampel, saya bisa menjadikan statistik saya sebagai pembilang dari t-statistik, atau t-statistik itu sendiri, atau jumlah sampel pertama (masing-masing definisi tersebut adalah monoton dalam yang lain, tergantung pada sampel gabungan), atau transformasi monoton mereka, dan memiliki tes yang sama, karena mereka menghasilkan nilai-p yang identik. Yang perlu saya lakukan adalah melihat seberapa jauh (dalam hal proporsi) distribusi permutasi dari statistik apa pun yang saya pilih kebohongan statistik sampel. T seperti yang didefinisikan di atas hanyalah statistik lain, sama bagusnya dengan yang lain yang bisa saya pilih (T sebagaimana didefinisikan ada monotonik di U).

T tidak akan persis seragam, karena itu akan memerlukan distribusi kontinu dan T tentu saja terpisah. Karena U dan oleh karena itu T dapat memetakan lebih dari satu permutasi ke statistik yang diberikan, hasilnya tidak mungkin sama, tetapi mereka memiliki "seragam-seperti" cdf **, tetapi di mana langkah-langkah tidak selalu sama dalam ukuran .

** ( , dan benar-benar sama dengan itu pada batas kanan setiap lompatan - mungkin ada nama untuk apa itu sebenarnya)F(x)x

Untuk statistik yang masuk akal saat berlanjut hingga tak terbatas, distribusi mendekati keseragaman. Saya pikir cara terbaik untuk mulai memahami mereka adalah dengan melakukannya dalam berbagai situasi. nT

Haruskah T (X) sama dengan nilai p berdasarkan U (X), untuk sampel X? Jika saya mengerti dengan benar, saya menemukannya di halaman 5 slide ini.

T adalah nilai-p (untuk kasus-kasus di mana U besar menunjukkan penyimpangan dari nol dan U kecil konsisten dengan itu). Perhatikan bahwa distribusi tergantung pada sampel. Jadi distribusinya bukan untuk sampel apa pun.

Jadi manfaat menggunakan uji permutasi adalah untuk menghitung nilai p dari statistik uji asli U tanpa mengetahui distribusi X di bawah nol? Karena itu, distribusi T (X) belum tentu seragam?

Saya sudah menjelaskan bahwa T tidak seragam.

Saya pikir saya sudah menjelaskan apa yang saya lihat sebagai manfaat dari tes permutasi; orang lain akan menyarankan keuntungan lain ( misalnya ).

Apakah "T adalah nilai p (untuk kasus di mana U besar menunjukkan penyimpangan dari nol dan U kecil konsisten dengan itu)", berarti bahwa nilai p untuk statistik uji U dan sampel X adalah T (X)? Mengapa? Apakah ada referensi untuk menjelaskannya?

Kalimat yang Anda kutip secara eksplisit menyatakan bahwa T adalah nilai-p, dan kapan itu. Jika Anda bisa menjelaskan apa yang tidak jelas tentang itu mungkin saya bisa mengatakan lebih banyak. Adapun alasannya, lihat definisi nilai-p (kalimat pertama pada tautan) - cukup langsung mengikuti dari itu

Ada diskusi dasar yang bagus tentang tes permutasi di sini .

-

Sunting: Saya tambahkan di sini contoh uji permutasi kecil; kode (R) ini hanya cocok untuk sampel kecil - Anda perlu algoritma yang lebih baik untuk menemukan kombinasi ekstrim dalam sampel sedang.

Pertimbangkan tes permutasi terhadap alternatif satu sisi:

H0:μx=μy (beberapa orang bersikeras *)μxμy
H1:μx<μy

* tetapi saya biasanya menghindarinya karena itu cenderung membingungkan masalah bagi siswa ketika mencoba mencari distribusi nol

pada data berikut:

> x;y
[1] 25.17 20.57 19.03
[1] 25.88 25.20 23.75 26.99

Ada 35 cara membagi 7 pengamatan menjadi sampel ukuran 3 dan 4:

> choose(7,3)
[1] 35

Seperti yang disebutkan sebelumnya, mengingat 7 nilai data, jumlah sampel pertama adalah monoton dalam perbedaan rata-rata, jadi mari kita gunakan itu sebagai statistik uji. Jadi sampel asli memiliki statistik uji:

> sum(x)
[1] 64.77

Sekarang inilah distribusi permutasi:

> sort(apply(combn(c(x,y),3),2,sum))
 [1] 63.35 64.77 64.80 65.48 66.59 67.95 67.98 68.66 69.40 69.49 69.52 69.77
[13] 70.08 70.11 70.20 70.94 71.19 71.22 71.31 71.62 71.65 71.90 72.73 72.76
[25] 73.44 74.12 74.80 74.83 75.91 75.94 76.25 76.62 77.36 78.04 78.07

(Ini tidak penting untuk mengurutkan mereka, saya hanya melakukan itu untuk membuatnya lebih mudah untuk melihat statistik uji adalah nilai kedua dari akhir.)

Kita dapat melihat (dalam hal ini dengan inspeksi) bahwa adalah 2/35, ataup

> 2/35
[1] 0.05714286

(Perhatikan bahwa hanya dalam kasus tanpa tumpang tindih xy adalah nilai-p di bawah 0,05 dimungkinkan di sini. Dalam kasus ini, akan menjadi seragam diskrit karena tidak ada nilai terikat dalam )TU

distribusi permutasi

Panah merah muda menunjukkan statistik sampel pada sumbu x, dan nilai p pada sumbu y.

Glen_b -Reinstate Monica
sumber
Terima kasih! Jadi pada dasarnya, tes permutasi digunakan untuk memperkirakan distribusi bawah distribusi nol , bukan? Jadi tergantung pada distribusi nol dari , tetapi nilai p adalah inf dari tingkat FP atas semua distribusi nol dari , dan adalah nilai p untuk dan ? U(X)XT(X)XXT(X)UX
Tim
Ini memperkirakan distribusi permutasi . Itu fakta bahwa Anda memperlakukan semua permutasi sama kemungkinannya yang membuatnya 'di bawah nol' (karena di bawah nol permutasi harus sama-sama mungkin). U(X)|X=x
Glen_b -Reinstate Monica
(1) Nilai p didefinisikan sebagai . Jika tes permutasi adalah untuk memperkirakan distribusi permutasi , bagaimana sama dengan nilai p pada ? Terutama, mungkin ada lebih dari satu distribusi di null , dan tidak mempertimbangkan distribusi null satu per satu dan kemudian mengambil dan . (2) Apakah memiliki distribusi yang sama untuk semua distribusi nol, yaitu bebas-distribusi, bukan nol? U(X)
infcR:U(x)csupFHP(U(X)c|XF)
U(X)|X=xT(X)U(X)X=xHT(X)supFHinfc:U(x)cT(X)
Tim
Ditambahkan ke (1), tes permutasi tidak hanya berlaku untuk nulls sederhana tetapi juga untuk nulls komposit, bukan?
Tim
(1) Ditentukan di mana? Itu sepertinya definisi yang aneh. Mengapa Anda menentukan distribusi X? Anda mengkondisikan . Kebingungan Anda tampaknya berasal dari definisi yang agak aneh itu. (2) sama sekali tidak masuk akal bagi saya. X=x
Glen_b -Reinstate Monica