Kekuatan percobaan mencicipi teh wanita

9

Dalam terkenal percobaan Fisher yang diamati adalah jumlah dikoreksi menduga cup memiliki dua jenis cup dan . Biasanya menarik untuk menghitung daerah kritis untuk menolak hipotesis nol (wanita itu menebak secara acak) mengingat ukuran tes . Ini mudah dilakukan dengan menggunakan distribusi hypergeometric. Dengan cara yang sama saya dapat menghitung ukuran tes yang diberikan wilayah kritis.A B αkABα

Pertanyaan yang berbeda adalah: bagaimana menghitung kekuatan tes, diberikan hipotesis alternatif? Misalkan misalnya wanita itu dapat menebak dengan benar dengan probabilitas pada piala tunggal ( ). Apa kekuatan tes, dengan asumsi jumlah total cangkir sama dengan dan jumlah total satu jenis gelas ? (Sayangnya) wanita itu tahu .P ( tebak A | benar A ) = P ( tebak  B | benar  B ) = 0,9 N = 8 n = N / 2 = 4 np=90%P(guessA|trueA)=P(guess B|true B)=0.9N=8n=N/2=4n

Dikatakan dengan kata lain: berapakah distribusi (jumlah gelas yang benar berdasarkan hipotesis alternatif) jika wanita itu tahu bahwa ada cangkir dari satu jenis?nk=n

Ruggero Turra
sumber
Memikirkan posting Anda ... Jika Fisher memutuskan untuk menolak nol hanya jika wanita itu benar pada semua tebakannya (saya pikir itu masalahnya), dan hanya ada satu cara yang mungkin untuk mendapatkan semua gelas dengan benar, seharusnya tidak probabilitas terjadinya hal ini adalah menjadi kekuatan sebenarnya? 0.94=0.6561
Antoni Parellada
Anda tidak menolak ketika dia menebak semua cangkir secara umum. Tetapi memang benar bahwa dengan itu adalah wilayah kritis. Anda tidak memperhitungkan bahwa wanita itu tahu bahwa ada 4 cangkir dari masing-masing jenis. Ngomong-ngomong, saya tertarik pada solusi umum N 8N=8N8
Ruggero Turra
1
Ini adalah masalah yang menarik, tetapi sulit. Sangat mudah untuk menentukan tabel yang akan menyebabkan penolakan Ho, tetapi harus berpikir tentang kemungkinan melihat tabel tersebut di bawah Ha. Artikel berikut menghitung kekuatan untuk tabel yang sedikit dimodifikasi dengan sensitivitas dan spesifisitas yang diberikan: "Generalisasi Lady-Tasting-Tea Prosedur untuk Menghubungkan Pendekatan Kualitatif dan Kuantitatif dalam Penelitian Psikiatri" oleh Falissard et al. Saya tidak yakin apakah perhitungannya benar. Jika Anda benar-benar memiliki masalah binomial, maka Anda dapat menggunakan paket Exact R, tetapi ini adalah masalah yang berbeda
Peter Calhoun

Jawaban:

3

Di bawah alternatif itu, wanita itu tidak menebak secara acak, tetapi "tidak menebak secara acak" mencakup banyak situasi yang berbeda. Dia mungkin selalu menebak dengan sempurna atau dia mungkin hanya melakukan sedikit lebih baik daripada menebak secara acak ... dan dalam kasus umum bahkan tidak ada "skala" variabel-tunggal tidak-acak untuk bekerja bersama (jadi kita bahkan tidak memiliki kekuatan kurva kecuali kita membatasi jenis tanggapan non-acak yang mungkin dia berikan).

Jadi untuk menghitung kekuatan, kita harus sangat spesifik tentang bagaimana itu non-acak (dan seberapa non-acak dalam mode tertentu).

(,)μ0σ2=1/ω2ω2μ1σ2μ1=μ0=1

Itu satu jenis model khusus untuk bagaimana dia dapat melakukan "lebih baik daripada acak" yang dengannya kita dapat menentukan parameter dan mendapatkan nilai untuk kekuatan.

Tentu saja kita dapat menganggap banyak bentuk non-keacakan selain ini.

Glen_b -Reinstate Monica
sumber
3

Distribusi jumlah tebakan yang benar di bawah hipotesis alternatif mengikuti distribusi hipergeometrik non-sentral , yang diparameterisasi dalam hal rasio peluang, yaitu, seberapa besar kemungkinan bahwa wanita akan menebak "teh dulu" ketika di Bahkan teh benar-benar ditambahkan pertama sebagai lawan ketika sebenarnya susu ditambahkan pertama kali (atau sebaliknya). Jika rasio odds adalah 1, maka kita mendapatkan distribusi hipergeometrik pusat.

Mari kita lihat apakah ini berhasil. Saya akan menggunakan R untuk tujuan ilustrasi, menggunakan MCMCpackpaket, yang memiliki fungsi dnoncenhypergeom()untuk menghitung kepadatan distribusi hypergeometrik (non-sentral). Ini memiliki argumen xuntuk jumlah yang benar tebakan (hati-hati: ini adalah jumlah yang benar tebakan di bawah salah satu dari dua kondisi, misalnya, ketika teh benar-benar ditambahkan pertama), argumen n1, n2dan m1untuk tiga dari empat margin, dan psiuntuk rasio odds yang benar. Mari kita menghitung kepadatan untuk xsama dengan 0 hingga 4 (dengan semua margin sama dengan 4) ketika rasio odds sebenarnya adalah 1:

install.packages("MCMCpack")
library(MCMCpack)
sapply(0:4, function(x) dnoncenhypergeom(x, n1=4, n2=4, m1=4, psi=1))

Ini menghasilkan:

[1] 0.01428571 0.22857143 0.51428571 0.22857143 0.01428571

Jadi, ada kemungkinan 1,43% bahwa wanita itu akan membuat 8 tebakan yang benar (yaitu, ia menebak semua 4 cangkir dengan benar di mana teh ditambahkan pertama dan karenanya ia juga menebak semua 4 cangkir dengan benar di mana susu ditambahkan pertama) di bawah hipotesis nol. Ini sebenarnya jumlah bukti yang dianggap cukup oleh Fisher untuk menolak hipotesis nol.

(.90/(1-.90))/(.10/(1-.10))=81peluang(TebakSEBUAH|benarSEBUAH)/peluang(TebakSEBUAH|benarB)). Bagaimana kemungkinan sekarang bahwa wanita itu akan menebak semua 8 gelas dengan benar (yaitu, dia akan menebak semua 4 gelas dengan benar di mana teh ditambahkan pertama dan karenanya juga 4 gelas dengan benar di mana susu ditambahkan pertama)?

dnoncenhypergeom(4, n1=4, n2=4, m1=4, psi=81)

Ini menghasilkan:

[1] 0.8312221

Jadi kekuatannya sekitar 83%.

Wolfgang
sumber