Tes kesetaraan untuk data yang tidak normal?

Saya memiliki beberapa data yang saya tidak bisa berasumsi diambil dari distribusi normal, dan saya ingin melakukan tes kesetaraan antar kelompok. Untuk data normal, ada teknik seperti TOST (dua uji satu sisi). Apakah ada yang analog dengan TOST untuk data yang tidak normal?

hypothesis-testing equivalence tost Ryan C. Thompson
sumber

Saya tidak terbiasa dengan TOST, tetapi apakah Anda mencari Mann-Whitney? Ini adalah tes nonparametrik (dalam arti tidak ada asumsi pada distribusi dibuat) yang dapat memberikan bukti bahwa dua kelompok berasal dari distribusi yang berbeda.

Nick Sabbe

Saya mencari tes di mana hipotesis nol adalah bahwa ada perbedaan, dan hipotesis alternatif adalah bahwa ada (hampir) tidak ada perbedaan.

Ryan C. Thompson

Untuk sampel kecil, Anda dapat melihat jawaban di stats.stackexchange.com/questions/49782/… . Untuk sampel yang lebih besar, pendekatan klasik dengan uji t baik-baik saja berkat Teorema Batas Pusat.

Michael M

Tidak ada dalam ungkapan "Dua tes satu sisi" - atau logika yang mendasarinya tidak menyiratkan teori normal. Seharusnya sangat mungkin untuk mengadaptasinya ke alternatif pergeseran lokasi dengan distribusi yang tidak normal. Namun berhati-hatilah - dalam banyak kasus dengan data tidak normal yang Anda inginkan adalah uji kesetaraan skala-pergeseran , dan dengan jenis data lainnya, yang lainnya justru sebaliknya. Mengetahui apa yang dibutuhkan benar-benar tergantung pada apa yang Anda ukur dan masalah apa yang Anda selesaikan. Alih-alih mencoba meremas pasak Anda ke dalam lubang bundar, lebih baik memeriksa pasak.

Glen_b -Reinstate Monica

Jawaban:

Logika TOST yang digunakan untuk statistik uji tipe- t dan z Wald (yaitu $\theta / s_{\theta}$ dan $\theta / \sigma_{\theta}$ , masing-masing) dapat diterapkan pada pendekatan z untuk uji nonparametrik seperti tes tanda, peringkat, dan jumlah peringkat. Untuk kesederhanaan saya mengasumsikan bahwa ekuivalensi dinyatakan secara simetris dengan satu istilah, tetapi memperluas jawaban saya ke istilah ekuivalen asimetris adalah mudah.

Salah satu masalah yang muncul ketika melakukan ini adalah bahwa jika seseorang terbiasa mengekspresikan istilah ekivalensi (katakanlah, $\Delta$ ) dalam unit yang sama dengan $\theta$ , maka istilah ekivalensi harus dinyatakan dalam unit tanda tertentu, pangkat yang ditandatangani, atau pangkat sum statistik, yang baik muskil, dan tergantung pada N .

Namun, seseorang juga dapat mengekspresikan istilah kesetaraan TOST dalam satuan statistik uji itu sendiri. Pertimbangkan bahwa dalam TOST, jika $z = \theta/\sigma_{\theta}$ , maka $z_{1} = (\Delta - \theta)/\sigma_{\theta}$ , dan $z_{2} = (\theta + \Delta)/\sigma_{\theta}$ . Jika kita membiarkan $\varepsilon = \Delta / \sigma_{\theta}$ , maka $z_{1} = \varepsilon - z$ , dan $z_{2} = z + \varepsilon$ . (Statistik yang dinyatakan di sini keduanya dievaluasi dalamekorkanan: $p_{1} = \text{P}(Z > z_{1})$ dan $p_{2} = \text{P}(Z > z_{2})$ .) Menggunakan unit-unit daridistribusizuntuk menentukan ambang kesetaraan / relevansi dapat lebih disukai untuk tes non-parametrik, karena alternatifnya mendefinisikan ambang dalam satuan peringkat atau jumlah peringkat yang ditandatangani, yang mungkin secara substansial tidak berarti bagi para peneliti dan sulit untuk ditafsirkan.

Jika kita mengakui bahwa (untuk interval kesetaraan simetris) tidak mungkin untuk menolak hipotesis TOST nol ketika $\varepsilon \le z_{1-\alpha}$ , maka kita dapat melanjutkan untuk membuat keputusan tentang ukuran yang sesuai dari istilah ekuivalensi sesuai. Misalnya $\varepsilon = z_{1-\alpha} + 0.5$ .

Pendekatan ini telah diterapkan dengan opsi untuk koreksi kontinuitas, dll. Dalam paket tost untuk Stata (yang sekarang termasuk implementasi TOST khusus untuk tes Shapiro-Wilk dan Shapiro-Francia), yang dapat Anda akses dengan mengetikkan Stata:

Sunting: Mengapa logika TOST masuk akal, dan formasi uji kesetaraan telah diterapkan pada tes omnibus, saya telah diyakinkan bahwa solusi saya didasarkan pada kesalahpahaman yang mendalam tentang perkiraan statistik untuk uji Shapiro-Wilk dan Shapiro-Francia

Alexis
sumber

Ini bukan TOST per se, tetapi uji Komolgorov-Smirnov memungkinkan seseorang untuk menguji signifikansi perbedaan antara distribusi sampel dan distribusi referensi kedua yang dapat Anda tentukan. Anda dapat menggunakan tes ini untuk mengesampingkan jenis tertentu dari distribusi yang berbeda, tetapi tidak distribusi yang berbeda secara umum (setidaknya, bukan tanpa mengendalikan inflasi kesalahan di semua tes dari semua alternatif yang mungkin ... jika itu entah bagaimana mungkin itu sendiri). Hipotesis alternatif untuk setiap tes akan tetap menjadi hipotesis "catch-all" yang kurang spesifik, seperti biasa.

Jika Anda dapat menerima uji perbedaan distribusi antara dua kelompok di mana hipotesis nolnya adalah bahwa kedua kelompok terdistribusi secara setara, Anda dapat menggunakan tes Komolgorov-Smirnov untuk membandingkan distribusi satu kelompok dengan distribusi kelompok lainnya. Itu mungkin pendekatan konvensional: abaikan perbedaan jika tidak signifikan secara statistik, dan benarkan keputusan ini dengan statistik uji.

Bagaimanapun, Anda mungkin ingin mempertimbangkan beberapa masalah yang lebih dalam yang timbul dari pendekatan "semua-atau-tidak sama sekali" untuk menolak hipotesis nol. Salah satu masalah tersebut sangat populer di sini di Cross Validated: " Apakah pengujian normal 'pada dasarnya tidak berguna'? " Orang-orang suka menjawab pertanyaan pengujian normalitas dengan pertanyaan: "Mengapa Anda ingin menguji ini?" Niat, saya berasumsi, umumnya untuk membatalkan alasan pengujian, yang pada akhirnya dapat mengarah ke arah yang benar. Inti dari tanggapan yang berguna untuk pertanyaan yang saya tautkan di sini tampaknya sebagai berikut:

Jika Anda khawatir tentang pelanggaran asumsi uji parametrik, Anda harus menemukan tes nonparametrik yang tidak membuat asumsi distribusi. Jangan menguji apakah Anda perlu menggunakan tes nonparametrik; gunakan saja!
Anda harus mengganti pertanyaan, "Apakah distribusi saya secara signifikan tidak normal?" dengan, "Seberapa tidak normal distribusi saya, dan bagaimana ini akan memengaruhi analisis minat saya?" Sebagai contoh, tes mengenai kecenderungan sentral (terutama yang melibatkan cara) mungkin lebih sensitif terhadap skewness daripada kurtosis, dan sebaliknya untuk tes mengenai varians (co). Meskipun demikian, ada alternatif yang kuat untuk sebagian besar tujuan analitik yang tidak terlalu sensitif terhadap kedua jenis non-normalitas.

Jika Anda masih ingin melanjutkan uji kesetaraan, berikut ini adalah diskusi populer tentang Cross Validated yang melibatkan pengujian kesetaraan.

Nick Stauner
sumber

_{0}^{-} : | θ - θ_{0} | \geq Δ

$^{-}_{0}: |\theta-\theta_{0}| \ge \Delta$

_{01}^{-} : θ - θ_{0} \geq Δ

$^{-}_{01}: \theta-\theta_{0} \ge \Delta$

_{01}^{-} : θ - θ_{0} \leq - Δ

$^{-}_{01}: \theta-\theta_{0} \le -\Delta$

_{01}^{-}

$^{-}_{01}$

_{02}^{-}

$^{-}_{02}$

- Δ < θ - θ_{0} < Δ

$-\Delta < \theta - \theta_{0} < \Delta$

[- Δ, Δ]

$[-\Delta,\Delta]$

Cukup adil; Saya mungkin agak menyesatkan. Saya telah menghapus bagian-bagian yang menurut Anda keberatan. Namun, saya pikir Anda terlalu banyak berkomentar. Terlepas dari kenyataan bahwa dikotomi fail to/ rejectpendekatan paksa sudah mapan, sebagian besar sampel tidak dapat sepenuhnya menghalangi kemungkinan bahwa nol itu benar. Hampir selalu ada kemungkinan kesalahan penolakan palsu jika seseorang bersikeras penolakan, yang biasanya tidak diperlukan secara harfiah. Itu mungkin poin lebih penting yang saya maksudkan pada awalnya. Semoga sedikit lebih jelas sekarang tanpa barang yang dihapus

Nick Stauner

_{0}^{-}

$^{-}_{0}$

_{0}^{+}

$^{+}_{0}$

_{0}^{+}

$^{+}_{0}$

_{0}^{-}

$^{-}_{0}$

_{0}^{+}

$^{+}_{0}$

_{0}^{-}

$^{-}_{0}$

Δ

$\Delta$

_{0}^{+}

$^{+}_{0}$

_{0}^{-}

$^{-}_{0}$

_{0}^{+}

$^{+}_{0}$

_{0}^{-}

$^{-}_{0}$

Tentu saja, masalah sensitivitas dan spesifisitas, PPV dan NPV tidak hilang.

Alexis

-1

$\mathcal{H}_0: f_x \ne f_y$ $\mathcal{H}_1: f_x = f_y$ $\mathcal{H}_0$ $f_x \sim \mathcal{N}(0, 1)$ $\hat{f}_x$ $\hat{f}_y$ $X=Y$ $f_y \approx f_x$

$\mathcal{H}_0$ $\mathcal{H}_1$

set.seed(123)
p <- replicate(1000, { ## generate data under the null
  x <- rnorm(100)
  g <- sample(0:1, 100, replace=T)
  BIC(lm(x~1)) > BIC(lm(x~g))
})
mean(p)

memberi

> mean(p)
[1] 0.034

$p$

Di sisi lain jika kita mengambil:

set.seed(123)
p <- replicate(1000, { ## generate data under the null
  x <- rnorm(100)
  g <- sample(0:1, 100, replace=T)
  x <- x + 0.4*g
  BIC(lm(x~1)) > BIC(lm(x~g))
})
mean(p)

Memberi:

> mean(p)
[1] 0.437

Seperti halnya NHST, ada masalah kekuatan dan tingkat kesalahan positif palsu yang harus dieksplorasi dengan simulasi sebelum membuat kesimpulan definitif.

Saya pikir yang serupa (mungkin metode yang lebih umum) menggunakan statistik Bayesian untuk membandingkan estimasi posterior di bawah salah satu model probabilitas.

AdamO
sumber

AdamO Anda tampaknya menyatu "menguji kesetaraan" dengan "pengujian kesetaraan". Ada beberapa dekade dan literatur yang solid dalam metode dan penerapan yang terakhir.

Alexis

Lihat, misalnya, Wellek, S. (2010). Menguji Hipotesis Statistik Kesetaraan dan Noninferioritas . Chapman dan Hall / CRC Press, edisi kedua.

Alexis

@Alexis hmm, sayangnya kami tidak memiliki akses ke perpustakaan. Apakah Anda mengatakan kesetaraan sama dengan non-inferioritas sejauh perkiraan yang berada dalam margin dianggap setara?

AdamO

Tidak sepenuhnya: non-inferioritas adalah tes satu sisi apakah pengobatan baru berkinerja tidak lebih buruk daripada beberapa standar dikurangi perbedaan relevan terkecil yang ditentukan apriori . Tes untuk ekivalensi adalah tes hipotesis nol bahwa dua (atau lebih) kuantitas berbeda — di kedua arah — dengan lebih dari perbedaan relevan terkecil yang ditentukan apriori . Beberapa makalah mani:

Alexis

Schuirmann, DA (1987). Perbandingan dua prosedur tes satu sisi dan pendekatan daya untuk menilai kesetaraan bioavailabilitas rata-rata . Jurnal Farmakokinetik dan Biofarmasi , 15 (6): 657-680.

Alexis