Saya memiliki beberapa data yang saya tidak bisa berasumsi diambil dari distribusi normal, dan saya ingin melakukan tes kesetaraan antar kelompok. Untuk data normal, ada teknik seperti TOST (dua uji satu sisi). Apakah ada yang analog dengan TOST untuk data yang tidak normal?
hypothesis-testing
equivalence
tost
Ryan C. Thompson
sumber
sumber
Jawaban:
Logika TOST yang digunakan untuk statistik uji tipe- t dan z Wald (yaituθ/sθ dan θ/σθ , masing-masing) dapat diterapkan pada pendekatan z untuk uji nonparametrik seperti tes tanda, peringkat, dan jumlah peringkat. Untuk kesederhanaan saya mengasumsikan bahwa ekuivalensi dinyatakan secara simetris dengan satu istilah, tetapi memperluas jawaban saya ke istilah ekuivalen asimetris adalah mudah.
Salah satu masalah yang muncul ketika melakukan ini adalah bahwa jika seseorang terbiasa mengekspresikan istilah ekivalensi (katakanlah,Δ ) dalam unit yang sama dengan θ , maka istilah ekivalensi harus dinyatakan dalam unit tanda tertentu, pangkat yang ditandatangani, atau pangkat sum statistik, yang baik muskil, dan tergantung pada N .
Namun, seseorang juga dapat mengekspresikan istilah kesetaraan TOST dalam satuan statistik uji itu sendiri. Pertimbangkan bahwa dalam TOST, jikaz=θ/σθ , maka z1=(Δ−θ)/σθ , dan z2=(θ+Δ)/σθ . Jika kita membiarkan ε=Δ/σθ , maka z1=ε−z , dan z2=z+ε . (Statistik yang dinyatakan di sini keduanya dievaluasi dalamekorkanan:hal1= P ( Z> z1) danhal2= P ( Z> z2) .) Menggunakan unit-unit daridistribusizuntuk menentukan ambang kesetaraan / relevansi dapat lebih disukai untuk tes non-parametrik, karena alternatifnya mendefinisikan ambang dalam satuan peringkat atau jumlah peringkat yang ditandatangani, yang mungkin secara substansial tidak berarti bagi para peneliti dan sulit untuk ditafsirkan.
Jika kita mengakui bahwa (untuk interval kesetaraan simetris) tidak mungkin untuk menolak hipotesis TOST nol ketikaε ≤ z1 - α , maka kita dapat melanjutkan untuk membuat keputusan tentang ukuran yang sesuai dari istilah ekuivalensi sesuai. Misalnya ε = z1 - α+ 0,5 .
Pendekatan ini telah diterapkan dengan opsi untuk koreksi kontinuitas, dll. Dalam paket tost untuk Stata (yang sekarang termasuk implementasi TOST khusus untuk tes Shapiro-Wilk dan Shapiro-Francia), yang dapat Anda akses dengan mengetikkan Stata:Sunting: Mengapa logika TOST masuk akal, dan formasi uji kesetaraan telah diterapkan pada tes omnibus, saya telah diyakinkan bahwa solusi saya didasarkan pada kesalahpahaman yang mendalam tentang perkiraan statistik untuk uji Shapiro-Wilk dan Shapiro-Francia
sumber
Ini bukan TOST per se, tetapi uji Komolgorov-Smirnov memungkinkan seseorang untuk menguji signifikansi perbedaan antara distribusi sampel dan distribusi referensi kedua yang dapat Anda tentukan. Anda dapat menggunakan tes ini untuk mengesampingkan jenis tertentu dari distribusi yang berbeda, tetapi tidak distribusi yang berbeda secara umum (setidaknya, bukan tanpa mengendalikan inflasi kesalahan di semua tes dari semua alternatif yang mungkin ... jika itu entah bagaimana mungkin itu sendiri). Hipotesis alternatif untuk setiap tes akan tetap menjadi hipotesis "catch-all" yang kurang spesifik, seperti biasa.
Jika Anda dapat menerima uji perbedaan distribusi antara dua kelompok di mana hipotesis nolnya adalah bahwa kedua kelompok terdistribusi secara setara, Anda dapat menggunakan tes Komolgorov-Smirnov untuk membandingkan distribusi satu kelompok dengan distribusi kelompok lainnya. Itu mungkin pendekatan konvensional: abaikan perbedaan jika tidak signifikan secara statistik, dan benarkan keputusan ini dengan statistik uji.
Bagaimanapun, Anda mungkin ingin mempertimbangkan beberapa masalah yang lebih dalam yang timbul dari pendekatan "semua-atau-tidak sama sekali" untuk menolak hipotesis nol. Salah satu masalah tersebut sangat populer di sini di Cross Validated: " Apakah pengujian normal 'pada dasarnya tidak berguna'? " Orang-orang suka menjawab pertanyaan pengujian normalitas dengan pertanyaan: "Mengapa Anda ingin menguji ini?" Niat, saya berasumsi, umumnya untuk membatalkan alasan pengujian, yang pada akhirnya dapat mengarah ke arah yang benar. Inti dari tanggapan yang berguna untuk pertanyaan yang saya tautkan di sini tampaknya sebagai berikut:
Jika Anda masih ingin melanjutkan uji kesetaraan, berikut ini adalah diskusi populer tentang Cross Validated yang melibatkan pengujian kesetaraan.
sumber
fail to
/reject
pendekatan paksa sudah mapan, sebagian besar sampel tidak dapat sepenuhnya menghalangi kemungkinan bahwa nol itu benar. Hampir selalu ada kemungkinan kesalahan penolakan palsu jika seseorang bersikeras penolakan, yang biasanya tidak diperlukan secara harfiah. Itu mungkin poin lebih penting yang saya maksudkan pada awalnya. Semoga sedikit lebih jelas sekarang tanpa barang yang dihapusmemberi
Di sisi lain jika kita mengambil:
Memberi:
Seperti halnya NHST, ada masalah kekuatan dan tingkat kesalahan positif palsu yang harus dieksplorasi dengan simulasi sebelum membuat kesimpulan definitif.
Saya pikir yang serupa (mungkin metode yang lebih umum) menggunakan statistik Bayesian untuk membandingkan estimasi posterior di bawah salah satu model probabilitas.
sumber