Perhitungan ukuran sampel parametrik dan analisis non-parametrik

12

Saya ingin tahu apakah ada yang memiliki referensi khusus (teks atau artikel jurnal) untuk mendukung praktik umum dalam literatur medis dalam melakukan perhitungan ukuran sampel menggunakan metode yang parametrik (yaitu dengan asumsi distribusi normal dan varian pengukuran tertentu) ketika analisis hasil uji coba primer akan dilakukan dengan menggunakan metode non-parametrik.

Contoh: hasil primer adalah waktu untuk muntah setelah memberikan obat tertentu, yang diketahui memiliki nilai rata-rata 20 menit (SD 6 menit), tetapi memiliki distribusi miring yang benar. Perhitungan ukuran sampel dilakukan dengan asumsi yang tercantum di atas, menggunakan rumus

,n(per-group)=f(α,β)×(2σ2/(μ1μ2)2)

di mana berubah berdasarkan α yang diinginkanf(α,β)α kesalahan dan .β

Namun, karena kemiringan distribusi, analisis hasil primer akan didasarkan pada peringkat (metode non-parametrik seperti tes Mann Whitney U).

Apakah skema ini didukung oleh penulis dalam literatur statistik, atau haruskah estimasi ukuran sampel non-parametrik dilakukan (dan bagaimana ini akan dilakukan)?

Pikiran saya adalah bahwa, untuk kemudahan perhitungan, dapat diterima untuk melakukan praktik di atas. Setelah semua, perkiraan ukuran sampel hanya itu - perkiraan yang sudah membuat beberapa asumsi - yang semuanya kemungkinan sedikit (atau sangat!) Tidak tepat. Namun, saya ingin tahu apa yang dipikirkan orang lain, dan secara khusus untuk mengetahui apakah ada referensi untuk mendukung alur pemikiran ini.

Terima kasih banyak atas bantuannya.

pmgjones
sumber

Jawaban:

4

Kedengarannya cerdik bagi saya. Metode nonparametrik hampir selalu melibatkan lebih banyak derajat kebebasan daripada metode parametrik dan karenanya membutuhkan lebih banyak data. Dalam contoh khusus Anda, uji Mann-Whitney memiliki daya yang lebih rendah daripada uji-t sehingga lebih banyak data diperlukan untuk daya dan ukuran yang sama.

Cara sederhana untuk melakukan perhitungan ukuran sampel untuk metode apa pun (non-parametrik atau lainnya) adalah dengan menggunakan pendekatan bootstrap.

Rob Hyndman
sumber
5
Saya setuju dengan Anda, meskipun sebagian besar perhitungan ukuran sampel yang dilakukan ketika merancang RCT didasarkan pada model parametrik. Saya suka pendekatan bootstrap, tetapi tampaknya sangat sedikit penelitian yang mengandalkannya. Saya baru saja menemukan kertas-kertas yang mungkin menarik: bit.ly/djzzeS , bit.ly/atCWz3 , dan yang ini berjalan di arah yang berlawanan bit.ly/cwjTHe untuk skala pengukuran kesehatan.
chl
6
Saya setuju tentang pendekatan bootstrap. Tetapi kekuasaan bukanlah fungsi dari derajat kebebasan. Dalam banyak kasus, termasuk yang ini, tes Mann-Whitney sering memiliki kekuatan lebih besar daripada uji-t. Lihat tbf.coe.wayne.edu/jmasm/sawilowsky_misconceptions.pdf . Secara umum, kekuatan uji parametrik baik ketika asumsi parametrik benar tetapi bisa lebih rendah - kadang-kadang secara drastis - ketika asumsi tersebut dilanggar, sedangkan tes nonparametrik yang baik mempertahankan kekuatannya.
Whuber
@RobHyndman - maaf untuk menggali utas lama dari 6 tahun yang lalu, tapi saya ingin tahu apakah Anda dapat memberikan referensi untuk kalimat terakhir Anda. Bagaimana saya bisa menggunakan pendekatan bootstrap untuk mendapatkan perhitungan ukuran sampel? Saya berasumsi di sini bahwa saya belum mengumpulkan data (karena saya mencoba mencari tahu berapa banyak yang harus dikumpulkan), tetapi saya tahu kekuatan yang saya inginkan, tingkat signifikansi, dan ukuran efek yang ingin saya deteksi. Terima kasih!
David White
Oke, saya kira ini hanya bisa berfungsi jika Anda memiliki studi pendahuluan untuk dijadikan sampel. Untuk studi pertama kali tanpa pengetahuan sebelumnya, yang terbaik adalah menghitung ukuran efek dari distribusi normal (atau dari distribusi yang berbeda jika teori menyarankan data harus didistribusikan dengan cara itu) dan menambahkan sedikit ke akun untuk kemungkinan non-normalitas. Setelah Anda memiliki satu studi, Anda dapat menggunakan boostrapping untuk menghitung ukuran sampel untuk mendeteksi berbagai ukuran efek dalam studi selanjutnya. Anda bahkan dapat menyesuaikan kurva ukuran efek vs n berdasarkan bootstrap beberapa nilai n.
David White
4

Beberapa orang tampaknya menggunakan konsep Pitman Asymptotic Relative Efficiency (ARE) untuk mengembang ukuran sampel yang diperoleh dengan menggunakan rumus ukuran sampel untuk uji parametrik. Ironisnya, untuk menghitungnya, kita harus mengasumsikan distribusi lagi ... lihat misalnya Ukuran sampel untuk uji Mann-Whitney U Ada beberapa tautan di akhir artikel yang menyediakan petunjuk untuk dibaca lebih lanjut.

psj
sumber