Bisakah kita menerima nol dalam tes non-inferioritas?

11

Dalam uji-t rata-rata, dengan menggunakan metode pengujian hipotesis yang biasa, kami menolak nol atau gagal menolak nol tetapi kami tidak pernah menerima nol. Salah satu alasannya adalah jika kita mendapatkan lebih banyak bukti, ukuran efek yang sama akan menjadi signifikan.

Tetapi apa yang terjadi dalam tes non-inferioritas?

Itu adalah:

H0:μ1μ0x

vs.

H1:μ1μ0>x

di mana adalah jumlah yang kami anggap pada dasarnya sama. Jadi, jika kami menolak nol, kami mengatakan bahwa lebih besar dari setidaknya . Kami gagal menolak nol jika tidak ada bukti yang cukup. μ 1 μ 0 xxμ1μ0x

Jika ukuran efek atau lebih besar, maka ini analog dengan uji-t reguler. Tetapi bagaimana jika ukuran efek kurang dari dalam sampel yang kita miliki? Kemudian, jika kami meningkatkan ukuran sampel dan mempertahankan efek yang sama, itu akan tetap tidak signifikan. Bisakah kita, oleh karena itu, menerima nol dalam kasus ini?xxx

Peter Flom
sumber
1
Apakah hipotesis Anda digabungkan? Biasanya, untuk tes NI hipotesis nol adalah bahwa perbedaannya lebih besar dari x, sedangkan alternatifnya adalah bahwa itu adalah le atau sama dengan x. Saya kira itu tergantung pada urutan skala perbedaan Anda.
Bjorn
Hai @ Björn itu akan tergantung pada apakah lebih tinggi lebih buruk atau lebih tinggi lebih baik.
Peter Flom
1
Apakah sama dengan menanyakan apakah seseorang dapat menerima nol dalam tes satu sisi? Ada beberapa diskusi tentang itu di komentar ke stats.stackexchange.com/a/85914 .
amoeba
2
@amoeba Saya pikir Peter menyajikan argumen yang menarik (+1), mungkin lebih mirip dengan paradoks. Satu penjelasan konvensional mengapa kita tidak "menerima H0" yang kadang-kadang kita dengar adalah "jika kita mendapatkan lebih banyak bukti, ukuran efek yang sama akan menjadi signifikan". Tetapi dengan mengikuti logika yang dilakukan Peter, kita berkesimpulan bahwa dalam beberapa situasi kita harus "menerima H0", atau jika tidak, bahwa "alasan" itu sebenarnya salah, dan bukan mengapa kita melakukannya sama sekali. Saya percaya Anda benar - argumennya akan berlaku untuk uji t satu sisi juga, karena ukuran efek negatif tetap tidak signifikan karena n meningkat
Silverfish
1
Ya, saya setuju: jawaban yang ditautkan tidak menjawab pertanyaan Anda. Saya hanya menyediakan tautan karena ada diskusi terkait di komentar di sana.
amoeba

Jawaban:

7

Logika Anda berlaku dengan cara yang persis sama dengan tes satu sisi yang baik dan lama (yaitu dengan ) yang mungkin lebih akrab bagi pembaca. Untuk konkret, bayangkan kita menguji null terhadap alternatif yang positif. Maka jika benar negatif, meningkatkan ukuran sampel tidak akan menghasilkan hasil yang signifikan, yaitu, untuk menggunakan kata-kata Anda, itu tidak benar bahwa "jika kami mendapat lebih banyak bukti, ukuran efek yang sama akan menjadi signifikan".H 0 : μ 0 μ μx=0H0:μ0μμ

Jika kami menguji , kami dapat memiliki tiga kemungkinan hasil:H0:μ0

  1. Pertama, interval kepercayaan bisa seluruhnya di atas nol; maka kita menolak nol dan menerima alternatif (yang positif).μ(1α)100%μ

  2. Kedua, interval kepercayaan bisa sepenuhnya di bawah nol. Dalam hal ini kami tidak menolak null. Namun, dalam hal ini saya pikir tidak apa-apa untuk mengatakan bahwa kami "menerima nol", karena kami dapat menganggap sebagai nol lain dan menolaknya.H1

  3. Ketiga, interval kepercayaan bisa mengandung nol. Maka kami tidak bisa menolak dan kami juga tidak bisa menolak , jadi tidak ada yang bisa diterima.H 1H0H1

Jadi saya akan mengatakan bahwa dalam situasi sepihak seseorang dapat menerima nol, ya. Tetapi kita tidak dapat menerimanya hanya karena kita gagal menolaknya; ada tiga kemungkinan, bukan dua.

(Persis sama berlaku untuk tes ekivalensi alias "dua tes satu sisi" (TOST), tes non-inferioritas, dll. Seseorang dapat menolak nol, menerima nol, atau mendapatkan hasil yang tidak meyakinkan.)

Sebaliknya, ketika adalah titik nol seperti , kami tidak akan pernah menerimanya, karena tidak merupakan hipotesis nol yang valid.H 0 : μ = 0 H 1 : μ 0H0H0:μ=0H1:μ0

(Kecuali hanya dapat memiliki nilai diskrit, misalnya harus bilangan bulat; maka tampaknya kita dapat menerima karena sekarang bukan merupakan null yang valid hipotesis. Ini adalah sedikit kasus khusus.)H 0 : μ = 0 H 1 : μ Z , μ 0μH0:μ=0H1:μZ,μ0


Masalah ini telah dibahas beberapa waktu lalu dalam komentar di bawah jawaban @ung di sini: Mengapa ahli statistik mengatakan hasil yang tidak signifikan berarti "Anda tidak dapat menolak nol" sebagai lawan menerima hipotesis nol?

Lihat juga utas yang menarik (dan di bawah suara) Apakah kegagalan untuk menolak nol dalam pendekatan Neyman-Pearson berarti bahwa seseorang harus "menerimanya"? , di mana @Scortchi menjelaskan bahwa dalam kerangka Neyman-Pearson beberapa penulis tidak memiliki masalah berbicara tentang "menerima nol". Itu juga yang berarti @Alexis dalam paragraf terakhir dari jawabannya di sini.

amuba
sumber
Jika interval kepercayaan seluruhnya di atas nol maka tolak null yang : itu adalah tes dengan ukuran kasus terburuk dari . Jika interval kepercayaan seluruhnya di bawah nol maka tolak null yang : itu adalah tes dengan ukuran kasus terburuk dari . Dengan menggabungkan kedua tes tersebut, Anda dapat mempertahankan ukuran kasus terburuk dari karena kedua null tersebut saling eksklusif. Jadi tiga hasil dapat digambarkan dalam hal menerima satu alternatif, atau alternatif lain, atau menolak tidak nol. μ 0 α(1α)μ0 (1-α)μ>0αα2(1α)μ>0 αα2α2
Scortchi
Tes dua sisi dapat dianggap sama seperti yang terdiri dari dua tes satu sisi; tetapi alternatifnya tidak saling eksklusif, & ukuran terburuknya adalah (ketika ). μ = 0αμ=0
Scortchi
Terima kasih @Scortchi. Entah bagaimana saya tidak yakin apakah Anda setuju atau tidak setuju dengan jawaban saya.
amoeba
μ0
@Scortchi Sintaks kalimat terakhir Anda cukup rumit: apa sebenarnya yang bisa (atau tidak bisa) digabungkan dan apa bedanya? Saya tidak yakin saya mengerti Anda dengan benar, maaf.
amoeba
6

H0H0H0HAHAHAH0

HA

H0H0HAH0+H0

Tampak bagi saya bahwa tidak ada alasan mengapa Anda tidak dapat menggabungkan inferensi dari tes satu sisi untuk inferioritas dengan tes satu sisi untuk non-inferioritas untuk memberikan bukti (atau kurangnya bukti) di kedua arah secara bersamaan.

H0δH0

Alexis
sumber
1
Pertanyaan Peter mengandung poin yang sangat menarik bahwa jawaban ini tampaknya mengendur: bahwa salah satu penjelasan konvensional yang diberikan dari terminologi "gagal menolak H0" adalah misalnya dalam uji-t, jika kita mendapatkan lebih banyak bukti, efek yang sama ukuran akan menjadi signifikan. Tetapi jika ini adalah alasan "nyata" kita "gagal menolak", argumennya bahwa kita bisa "menerima H0" dalam keadaan yang dia gariskan tampaknya (setidaknya untuk saya) menjadi yang kuat - meskipun saya tidak yakin saya Sudah melihatnya dilakukan selain dengan santai, sebagai semacam gaul statistik, bukan secara sadar dan sengaja.
Silverfish
1
Jawaban ini menyatakan kembali posisi konvensional tentang "menerima H0" dengan cara yang bagus, jelas, ringkas tetapi tampaknya tidak secara langsung membahas argumen (atau mungkin, paradoks) di jantung pertanyaan Peter. Apa pendapat Anda tentang argumen "kami tidak dapat menerima H0 karena jika kami memiliki lebih banyak bukti, ukuran efek yang sama akan menjadi signifikan" untuk terminologi konvensional - apakah ada beberapa kekurangan dalam presentasi atau perluasan Peter, atau apakah logika argumen asli tidak valid di tempat pertama?
Silverfish
1
@Silverfish mengikuti tautan dalam jawaban saya untuk "tes relevansi" untuk lebih banyak amplifikasi resolusi kritis saya untuk masalah "kami tidak dapat menerima H0 karena jika kami mendapatkan lebih banyak bukti, ukuran efek yang sama akan menjadi signifikan"
Alexis
1
@Alexis saya harus setuju dengan Silverfish. Saya menghargai jawaban Anda, tetapi itu tidak membahas poin utama saya, untuk alasan Silverfish diucapkan. Jika kita memiliki N = 1.000.000 maka cukup banyak perbedaan akan signifikan dalam pengaturan standar. Tetapi dalam kasus non-inferioritas, itu tidak benar. Dan bahkan dalam TOST dua sisi, tidak demikian. Jika perbedaannya kurang dari jumlah yang kami anggap penting, maka tidak ada N yang akan membuatnya sig.
Peter Flom
1
Permintaan maaf - komentar pertama saya dimaksudkan hanya sebagai pendahuluan ke-2 (atau lebih tepatnya, yang ke-2 adalah luapan dari yang ke-1!) Dan tidak dimaksudkan untuk menaikkan titik berdiri sendiri. Tautan itu membantu, terima kasih. Poin sentral Anda (yang Anda berikan dengan sangat baik, baik dalam jawaban Anda maupun pernyataan Anda) menjelaskan dengan jelas mengapa Anda tidak setuju dengan kesimpulan Peter . Tapi saya ingin tahu di mana Anda merasa cacat itu dalam logikanya - atau mungkin premisnya . Ini adalah bagian yang terasa bagi saya untuk tidak ditangani secara langsung.
Silverfish