Apa yang dilakukan mitra Bayesian terhadap uji-t dua sampel dengan varian yang tidak sama?

11

Saya mencari mitra bayesian dari uji dua sampel dengan varians yang tidak sama (tes Welch). Saya juga mencari tes multivarian, seperti statistik T Hotelling. Referensi dihargai.

Untuk kasus multivarian, misalkan kita memiliki dan , di mana (resp ) adalah jalan pintas untuk mean sampel, simpangan baku sampel, dan jumlah titik. Kita dapat mengasumsikan bahwa jumlah poin konstan di seluruh dataset, standar deviasi yang sama untuk semua (resp ) dan bahwa rata-rata sampel (resp ) berkorelasi. Jika Anda memplot rata-rata sampel, mereka mengikuti satu sama lain dan dengan menghubungkannya, Anda mendapatkan fungsi yang bervariasi. Sekarang pada beberapa bagian, fungsi setuju dengan(y1,,yN)(z1,,zN)yiziyiziyiziyzberfungsi, tetapi pada yang lain tidak, karena menjadi besar. Saya ingin mengukur pernyataan ini. mean(yi)mean(zi)std(yi)+std(zi)

yannick
sumber
Saya telah memperbarui jawaban saya.
John Salvatier
Mengetik "behrens fisher" di kotak pencarian mengarahkan ke informasi berharga tentang pendekatan bayesian pada dua sampel independen dengan varian yang tidak sama.
Stéphane Laurent

Jawaban:

6

Meskipun Anda dapat melakukan ini dengan cara Bayesian, apakah Anda sudah mempertimbangkan apakah sebenarnya akan lebih baik untuk memperkirakan perbedaan dalam cara daripada menguji apakah mereka berbeda? Inilah yang sering direkomendasikan Andrew Gelman . Saya dapat membayangkan beberapa alasan yang mungkin untuk ingin melakukan pengujian hipotesis, tetapi saya pikir itu tidak umum.

Saya tidak berpikir Anda memerlukan sesuatu seperti uji-t, karena Anda dapat memperkirakan deviasi standar dengan baik karena Anda mengatakan kelompok memiliki standar deviasi yang sangat mirip.

Jika itu masalahnya maka saya pikir tautan ini harus sesuai dengan yang Anda butuhkan. Ini menunjukkan bagaimana memperkirakan perbedaan dalam cara atau melakukan tes hipotesis (meskipun saya tidak merekomendasikan ini). Anda juga dapat melihat bagian yang mereka rujuk dalam buku bolstad (Anda dapat menemukan salinan elektronik online). Mungkin untuk menggabungkan estimasi varians juga tetapi lebih kompleks, jadi saya kira Anda lebih baik menggabungkan informasi sebelumnya yang Anda miliki tentang varians dengan cara yang naif (misalnya, menggunakan estimator Stdev yang tidak bias pada setiap set dan kemudian rata-rata mereka dan berpura-puralah itu adalah stdev 'yang dikenal' Anda).

John Salvatier
sumber
ya, tapi itu mengarah ke masalah lain. Bagaimana Anda bisa tahu apakah perbedaan rata-rata berarti? Saya akan membandingkannya dengan jumlah SD dari setiap sampel, tetapi itu tidak terlalu ketat.
yannick
@yannick: "signifikan", secara statistik atau dunia nyata?
Wayne
@Wayne dunia nyata kurasa.
yannick
3
@yannick: Signifikansi dunia nyata adalah masalah pengetahuan domain, bukan masalah statistik. Yaitu, saya dapat memberitahu Anda bahwa saya memiliki beberapa data berat dan ada perbedaan 10 gram yang signifikan secara statistik dalam bobot rata-rata antara dua kelompok, pada tingkat 95%, tetapi apakah itu memiliki signifikansi dunia nyata? Untuk ikan kecil, ya, untuk pria dewasa, tidak. Jika Anda berbicara signifikansi dunia nyata, saya bayangkan membandingkan dengan SD atau menentukan kuantil akan menjawab pertanyaan Anda bahkan jika itu tampaknya tidak ketat dan memberi ruang bagi seseorang untuk tidak setuju dengan Anda.
Wayne
@Wayne Misalkan saya melihat , Anda mengatakan bahwa keputusan kapan kita dapat mengatakan ukuran efek "signifikan" adalah arbitrer? Dan begitu juga pilihan fungsi tautan yang akan memetakan kuantitas itu ke [0: 1]? Apakah tidak ada hal-hal praktis yang dilakukan orang? m1m2s1+s2
yannick
12

John Kruschke telah mengembangkan rutinitas Bayesian yang dimaksudkan sebagai penurunan pengganti untuk uji-t dua sampel. Rutin disebut BEST (Bayesian Estimation Supersedes the T-test) dan dijelaskan di sini . Saya juga membuat versi javascript online yang berjalan di browser yang tersedia di sini .

Rasmus Bååth
sumber