Saya melakukan uji statistik independen dengan hipotesis nol yang sama, dan ingin menggabungkan hasilnya menjadi satu nilai. Tampaknya ada dua metode yang "diterima": metodeFisher dan metode Stouffer.
Pertanyaan saya adalah tentang metode Stouffer. Untuk setiap tes terpisah saya mendapatkan z-score . Di bawah hipotesis nol, masing-masing didistribusikan dengan distribusi normal standar, sehingga jumlah Σ z i mengikuti distribusi normal dengan varians N . Oleh karena itu metode Stouffer menyarankan untuk menghitung Σ z i / √ , yang seharusnya didistribusikan secara normal dengan varians unit, dan kemudian menggunakan ini sebagai skor-z bersama.
Ini masuk akal, tetapi di sini ada pendekatan lain yang saya buat dan itu juga masuk akal bagi saya. Karena masing-masing berasal dari distribusi normal standar, jumlah kuadrat S = Σ z 2 saya harus berasal dari distribusi chi-kuadrat dengan derajat kebebasan N. Jadi seseorang dapat menghitung S dan mengubahnya menjadi p- nilai menggunakan fungsi distribusi chi-kuadul kumulatif dengan N derajat kebebasan ( p = 1 - X N ( S ) , di mana X N adalah CDF).
Namun, tidak ada yang bisa saya temukan dalam pendekatan ini. Apakah ini pernah digunakan? Apakah itu mempunyai nama? Apa yang akan menjadi keuntungan / kerugian dibandingkan dengan metode Stouffer? Atau adakah kesalahan dalam alasan saya?
sumber
Jawaban:
Salah satu kelemahan yang muncul adalah metode Stouffer dapat mendeteksi pergeseran sistematis dalam , yang biasanya diharapkan terjadi ketika satu alternatif secara konsisten benar, sedangkan metode chi-squared tampaknya memiliki daya yang lebih kecil untuk melakukannya. Simulasi cepat menunjukkan hal ini; metode chi-squared kurang kuat untuk mendeteksi alternatif sepihak. Berikut adalah histogram nilai-p dengan kedua metode (merah = Stouffer, biru = chi-kuadrat) untuk 10 5 iterasi independen dengan N = 10 dan berbagai efek standar satu sisi μ mulai dari tidak ada ( μ = 0 ) hingga 0,6 SD ( μ =zi 105 N=10 μ μ=0 0.6 ).μ=0.6
Kode r
Ini termasuk metode Fisher (dikomentari) untuk perbandingan.
sumber
R
simulasi untuk menguji ini. Ini akan menjadi cara yang baik untuk memperkenalkan diri Anda pada platform komputasi statistik ini. :-)Salah satu cara umum untuk mendapatkan wawasan tentang statistik uji adalah untuk memperoleh asumsi yang mendasari (biasanya implisit) yang akan menyebabkan statistik uji menjadi yang paling kuat. Untuk kasus khusus ini, seorang siswa dan saya baru-baru ini melakukan ini: http://arxiv.org/abs/1111.1210v2 (versi revisi akan muncul dalam Annals of Applied Statistics).
Untuk meringkas secara singkat (dan konsisten dengan hasil simulasi dalam jawaban lain) Metode Stouffer akan paling kuat ketika efek yang mendasari "benar" semuanya sama; jumlah Z ^ 2 akan paling kuat ketika efek yang mendasarinya terdistribusi secara normal sekitar 0. Ini adalah sedikit penyederhanaan yang menghilangkan detail: lihat bagian 2.5 dalam preprint arxiv yang ditautkan di atas untuk detail lebih lanjut.
sumber
Sedikit: salah satu masalah dengan kedua pendekatan ini adalah hilangnya kekuasaan karena derajat kebebasan (N untuk stouffer; 2N untuk Fisher). Ada beberapa pendekatan meta-analitis yang lebih baik yang dikembangkan untuk ini, yang mungkin ingin Anda pertimbangkan (meta-analisis berbobot invers-varians, misalnya).
Jika Anda mencari bukti beberapa tes alternatif dalam suatu kelompok, Anda mungkin ingin melihat statistik kritik Donoho dan Jin yang lebih tinggi: https://projecteuclid.org/euclid.aos/1085408492
sumber
Untuk menjawab pertanyaan dan untuk pembaca lebih lanjut: apakah pernah digunakan ?, ada makalah lengkap oleh Cousins (2008) tentang arXiv, yang mendaftar dan meninjau beberapa pendekatan alternatif. Yang diusulkan sepertinya tidak muncul.
sumber