Apakah ada tes statistik "esoteris" dengan daya sangat rendah?

11

Latar Belakang

Dalam ilmu komputer, matematika, dan kadang-kadang di bidang lain, contoh "esoteris" tidak hanya menghibur, tetapi juga membantu menggambarkan konsep-konsep tertentu, misalnya:

  • Bogosort dan Slowsort adalah algoritma penyortiran yang sangat tidak efisien yang dapat digunakan untuk memahami sifat-sifat algoritma, khususnya bila dibandingkan dengan algoritma penyortiran lainnya.

  • Bahasa pemrograman esoterik menunjukkan seberapa jauh konsep bahasa pemrograman dan membantu menghargai bahasa pemrograman yang baik.

  • Fungsi Weierstraß dan fungsi Dirichlet terutama digunakan untuk menggambarkan kesalahpahaman tertentu tentang konsep kontinuitas.

Saat ini saya sedang mempersiapkan beberapa pengajaran tentang menggunakan tes hipotesis dan berpikir bahwa memiliki tes dengan daya yang sangat rendah (tetapi tidak ada kekurangan lainnya) akan membantu menggambarkan konsep kekuatan statistik. (Tentu saja, saya masih harus memutuskan sendiri apakah contoh yang diberikan benar-benar bermanfaat bagi audiens saya atau hanya membingungkan.)

Pertanyaan Aktual

Apakah ada tes statistik dengan daya yang sengaja rendah, lebih khusus:

  • Tes ini cocok dalam kerangka umum tes hipotesis, yaitu, ia bekerja dengan hipotesis nol, memiliki persyaratan, dan mengembalikan  nilai p (benar) .
  • Itu tidak dimaksudkan / diusulkan untuk aplikasi serius.
  • Ini memiliki daya yang sangat rendah (karena cacat desain yang disengaja dan bukan karena sampel rendah atau ukuran efek).

Jika Anda dapat secara mendasar berpendapat bahwa tes seperti itu tidak ada, saya juga akan menganggap ini jawaban yang valid untuk pertanyaan saya. Jika di sisi lain, sejumlah besar tes semacam itu ada, saya tertarik pada yang paling efisien secara didaktik, yaitu, tes itu harus mudah diakses dan memiliki efek yang mencolok.

Perhatikan bahwa saya tidak meminta pemilihan umum kesalahan statistik (memetik ceri, dll.) Atau yang serupa.

Apa yang saya temukan sejauh ini

Pencarian internet tidak menghasilkan apa-apa untuk saya.

Setiap upaya untuk membangun sesuatu seperti ini berakhir baik dalam beberapa tes (berguna) yang ada atau formatnya bukan tes biasa. Sebagai contoh, saya berpikir tentang tes apakah suatu populasi memiliki median positif yang hanya mengembalikan ya jika semua sampel positif; tetapi tes itu tidak mengembalikan  nilai p dan dengan demikian tidak cocok dengan kerangka uji yang biasa. Jika saya hanya menghitung tanda-tanda positif dan negatif sebagai statistik uji (dan menghitung nilai p yang  sesuai), saya berakhir dengan tes tanda , yang merupakan tes yang masuk akal.

Wrzlprmft
sumber
2
Menjadi contoh yang lebih matematis, "esoterik" (yang berlimpah) cenderung menjadi contoh tandingan spesifik terhadap kesalahpahaman populer; sejumlah buku pelajaran berisi contoh-contoh seperti itu. Sebenarnya, pertanyaan Anda pada dasarnya adalah jenis pertanyaan "daftar besar" dan terlalu luas (meskipun Anda harus perhatikan bahwa beberapa pengguna telah menyimpulkan pertanyaannya tidak jelas); jika Anda dapat mengklarifikasi pertanyaan Anda dan mempersempit ruang lingkupnya, itu mungkin lebih sesuai dengan situs.
Glen_b -Reinstate Monica
1
Daya rendah dibandingkan dengan apa? Lehmann memberikan contoh uji kemungkinan-rasio umum yang memiliki kekuatan lebih rendah di bawah hipotesis alternatif apa pun daripada di bawah nol.
Scortchi
2
Penaksir konyol mana pun yang Anda gunakan Rao-Blackwellization dapat digunakan sebagai statistik uji. Misalnya, ada observasi pertama dalam sampel, yang digunakan sebagai penduga rata-rata. Ketika Rao-Blackwellized, Anda mendapatkan mean sampel. Saya harus melakukan banyak latihan seperti ini di kelas. Bagaimanapun, statistik ini dapat digunakan sebagai ganti mean sampel dalam sesuatu seperti uji . Tapi tidak, saya tidak bisa memikirkan apa pun secara langsung dalam formulir yang Anda cari, atau saya akan menulis jawaban, bukan komentar. Tetapi harus ada sesuatu, yang menggambarkan kegagalan metode umum untuk konstruksi uji. t
user54038
1
Saya akan menggali kertas Lehmann ketika saya di depan komputer. Kekuatan tes di bawah nol hanyalah ukuran tes.
Scortchi
3
Contoh tes yang digunakan dalam kelas I adalah seorang siswa (bertahun-tahun yang lalu) adalah "menggulung die sisi yang adil dan menolak jika Anda menggulung 1" (sebagai bagian dari diskusi tentang kurva daya). Ini tentu saja benar-benar mengabaikan data, tetapi merupakan tes "valid" karena tidak memiliki lebih tinggi dari tingkat kesalahan tipe I yang diinginkan (yang 5% dalam konteks contoh diberikan dalam).
Glen_b -Reinstate Monica

Jawaban:

7

Ada sedikit akibat pada lemma Neyman-Pearson (bukti di Geisser (2006), Mode of Parametric Statistics Inference , Ch 4.4): mendefinisikan level- paling kuat uji , , dari hipotesis nol density vs density dari data .

Eϕ(X)=α
ϕ(x)={0 when f0(x)<kf1(x)1 when f0(x)>kf1(x)
αϕH0:f0H1:f1x

Dari hasil ini, Anda dapat memperoleh pengujian yang seragam, paling tidak bertenaga, paling tidak bertenaga lokal, serupa, dan serupa, & paling tidak bertenaga "sangat bias" (maksud saya yang memiliki daya lebih rendah di bawah alternatif apa pun daripada di bawah nol). Jika Anda sudah memiliki seragam yang paling kuat, & c. uji, cukup gandakan statistik uji Anda dengan -1 untuk mempertahankan pemartisian ruang sampel yang diinduksi sambil membalikkan urutan partisi.


Mungkin, seperti yang disarankan @ user54038, "kegagalan metode umum konstruksi pengujian" mungkin lebih menarik. Lehmann (1950), "Beberapa prinsip teori pengujian hipotesis statistik", Ann. Matematika Statist. , 21 , 1, mengaitkan contoh berikut untuk Stein:

Biarkan menjadi variabel acak yang mampu mengambil nilai dengan probabilitas seperti yang ditunjukkan:X0,±1,±2

22110Hypothesis H:α2α212α12ααAlternatives:pC(1p)C1C1α(12α)1C1α(12α)α1c1α
Di sini, , , adalah konstanta , , dan berkisar pada interval .αC0<α12α2α<C<αp[0,1]

Diharapkan untuk menguji hipotesis pada tingkat signifikansi . Tes rasio kemungkinan ditolak ketika , dan karenanya kekuatannya adalah terhadap setiap alternatif. Karena , tes ini secara harfiah lebih buruk daripada tidak berguna, untuk tes dengan kekuatan dapat diperoleh tanpa mengamati sama sekali, hanya dengan menggunakan tabel angka acak.HαX=±2CC<ααX

Perhatikan bahwa ini adalah tes kemungkinan umum yang sedang dipertimbangkannya, dengan dalam peran parameter gangguan harus dimaksimalkan. Jadi ketika atau , masing-masing atau , & rasio kemungkinan datang ke dalam kedua kasus; untuk nilai adalah nilai lebih rendah dari .pX=2X=2p^=1p^=02CαX1C1α

Scortchi
sumber
5

(Terkait dengan komentar oleh @Scortchi)

Misalkan dan kami ingin menguji hipotesisXN(μ,1)

H0:μ=0H1:μ0

ZBernoulli(p)pαp[α,1]

R={(X,Z) | z=1 |x|>Φ1(α2p)}

α

P(XR | μ=0)=P(Z=1 , |X|>Φ1(α2p))=P(Z=1)P(|X|>Φ1(α2p))=pαp=α

p(x,z)=(1000000,0)p=αXα

Z

rev knrumsey
sumber
2
SZ=1(S<FS1(p))FS()S