Saya punya dua sampel ( dalam kedua kasus). Berarti berbeda sekitar dua kali lipat dari std. dev. Nilai dihasilkan adalah sekitar 10. Sementara itu bagus untuk mengetahui bahwa saya telah meyakinkan menunjukkan bahwa berarti tidak sama, menurut saya ini didorong oleh n besar. Melihat histogram data saya tentu tidak merasa bahwa nilai-p kecil benar-benar mewakili data dan jujur saja tidak benar-benar merasa nyaman mengutipnya. Saya mungkin mengajukan pertanyaan yang salah. Apa yang saya pikirkan adalah: ok, artinya berbeda tetapi apakah itu benar-benar penting karena distribusi memiliki tumpang tindih yang signifikan?T
Apakah ini tempat pengujian Bayesian berguna? Jika demikian, di mana tempat yang baik untuk memulai, sedikit googling belum menghasilkan sesuatu yang bermanfaat, tetapi saya mungkin tidak mengajukan pertanyaan yang tepat. Jika ini salah, adakah yang punya saran? Atau apakah ini hanya sebuah poin untuk diskusi yang bertentangan dengan analisis kuantitatif?
sumber
Jawaban:
Biarkan menunjukkan rata-rata populasi pertama dan menunjukkan rata-rata populasi kedua. Tampaknya Anda telah menggunakan dua sampel -test untuk menguji apakah . Hasil signifikan menyiratkan bahwa , tetapi perbedaannya tampaknya kecil untuk aplikasi Anda.μ 2 t μ 1 = μ 2 μ 1 ≠ μ 2μ1 μ2 t μ1= μ2 μ1≠ μ2
Apa yang Anda temui adalah fakta bahwa signifikan secara statistik seringkali dapat menjadi sesuatu yang lain daripada signifikan untuk aplikasi . Walaupun perbedaannya mungkin signifikan secara statistik, mungkin masih belum bermakna .
Pengujian Bayesian tidak akan menyelesaikan masalah itu - Anda masih akan menyimpulkan bahwa ada perbedaan.
Namun mungkin ada jalan keluar. Misalnya, untuk hipotesis satu sisi Anda dapat memutuskan bahwa jika adalah unit lebih besar dari maka itu akan menjadi perbedaan yang berarti yang cukup besar untuk masalah bagi aplikasi Anda. Δ μ 2μ1 Δ μ2
Dalam hal ini Anda akan menguji apakah daripada apakah . The -statistic (dengan asumsi varians yang sama) akan dalam kasus itu menjadi di mana adalah estimasi standar deviasi yang dikumpulkan. Di bawah hipotesis nol, statistik ini - dengan derajat kebebasan.μ 1 - μ 2 = 0 tμ1- μ2≤ Δ μ1- μ2= 0 t sptn1+n2-2
Cara mudah melaksanakan tes ini adalah untuk mengurangi dari pengamatan Anda dari populasi pertama dan kemudian melaksanakan rutin satu sisi dua-sample -test.tΔ t
sumber
Adalah sah untuk membandingkan beberapa pendekatan, tetapi tidak dengan tujuan memilih salah satu yang mendukung keinginan / kepercayaan kita.
Jawaban saya untuk pertanyaan Anda adalah: Ada kemungkinan bahwa dua distribusi tumpang tindih sementara mereka memiliki cara yang berbeda, yang tampaknya menjadi masalah Anda (tetapi kami perlu melihat data dan konteks Anda untuk memberikan jawaban yang lebih tepat).
Saya akan menggambarkan ini menggunakan beberapa pendekatan untuk membandingkan cara normal .
1. -testt
Pertimbangkan dua sampel simulasi ukuran dari dan , maka nilai- kira-kira seperti dalam kasus Anda (Lihat kode R di bawah).N ( 10 , 1 ) N ( 12 , 1 ) t 1070 N(10,1) N(12,1) t 10
Namun kepadatan menunjukkan tumpang tindih yang cukup besar. Tetapi ingat bahwa Anda menguji hipotesis tentang cara, yang dalam hal ini jelas berbeda tetapi, karena nilai , ada tumpang tindih kepadatan.σ
2. Kemungkinan profilμ
Untuk definisi kemungkinan dan kemungkinan Profil, lihat 1 dan 2 .
Dalam kasus ini, kemungkinan profil dari sampel ukuran dan rata-rata sampel hanyalah .n ˉ x R p ( μ ) = exp [ - n ( ˉ x - μ ) 2 ]μ n x¯ Rp(μ)=exp[−n(x¯−μ)2]
Untuk data yang disimulasikan, ini dapat dihitung dalam R sebagai berikut
Seperti yang Anda lihat, interval kemungkinan dan tidak tumpang tindih pada tingkat yang wajar.μ 2μ1 μ2
3. Posterior menggunakan Jeffrey sebelumnyaμ
Pertimbangkan Jeffreys sebelum dari(μ,σ)
Poster untuk setiap set data dapat dihitung sebagai berikutμ
Sekali lagi, interval kredibilitas untuk sarana tidak tumpang tindih pada tingkat yang wajar.
Sebagai kesimpulan, Anda dapat melihat bagaimana semua pendekatan ini menunjukkan perbedaan berarti (yang merupakan kepentingan utama), meskipun tumpang tindih distribusi.
Menilai oleh kekhawatiran Anda tentang tumpang tindih kepadatan, kuantitas lain yang menarik mungkin , probabilitas bahwa variabel acak pertama lebih kecil dari variabel kedua. Kuantitas ini dapat diperkirakan secara nonparametrik seperti pada jawaban ini . Perhatikan bahwa tidak ada asumsi distribusi di sini. Untuk data yang disimulasikan, penaksir ini adalah , menunjukkan beberapa tumpang tindih dalam pengertian ini, sedangkan berbeda secara signifikan. Silakan, lihat kode R yang ditunjukkan di bawah ini.0,8823825P(X<Y) 0.8823825
Saya harap ini membantu.
sumber
Menjawab Pertanyaan yang Tepat
Setiap tes yang menanyakan apakah cara kelompok berbeda akan, ketika berfungsi dengan benar, memberi tahu Anda apakah cara berbeda. Ini tidak akan memberi tahu Anda bahwa distribusi data itu sendiri berbeda, karena itu adalah pertanyaan yang berbeda. Itu pertanyaan tentu tergantung pada apakah cara yang berbeda tetapi juga pada banyak hal lain yang mungkin (tidak lengkap) diringkas sebagai varians, miring, dan kurtosis.
Anda mencatat dengan benar bahwa kepastian di mana rata-rata bergantung pada jumlah data yang harus Anda perkirakan, sehingga memiliki lebih banyak data akan memungkinkan Anda melihat perbedaan rata-rata dalam distribusi yang hampir tumpang tindih. Tapi Anda bertanya-tanya apakah
Memang tidak, setidaknya tidak secara langsung. Dan ini dengan desain. Ini mewakili (kira-kira berbicara) tentang kepastian yang dapat Anda miliki bahwa pasangan statistik sampel tertentu dari data (bukan data itu sendiri) berbeda.
Jika Anda ingin merepresentasikan data itu sendiri dengan cara yang lebih formal daripada sekadar menunjukkan histogram dan menguji momen itu, maka mungkin sepasang plot kepadatan mungkin bisa membantu. Ini lebih tergantung pada argumen yang Anda gunakan untuk membuat tes.
Versi Bayesian
Dalam semua hal ini, 'tes' perbedaan dan uji-T Bayes akan berperilaku dengan cara yang sama karena mereka mencoba melakukan hal yang sama. Satu-satunya keuntungan yang dapat saya pikirkan untuk menggunakan pendekatan Bayesian adalah: a) bahwa akan mudah untuk melakukan tes yang memungkinkan varians yang mungkin berbeda untuk masing-masing kelompok, dan b) bahwa itu akan fokus pada memperkirakan kemungkinan ukuran perbedaan dalam rata-rata daripada menemukan nilai p untuk beberapa uji perbedaan. Yang mengatakan, keuntungan ini sangat kecil: misalnya dalam b) Anda selalu dapat melaporkan interval kepercayaan untuk perbedaan.
Tanda kutip di atas 'tes' disengaja. Tentu saja mungkin untuk melakukan pengujian hipotesis Bayesian, dan orang-orang melakukannya. Namun, saya akan menyarankan bahwa keunggulan komparatif dari pendekatan ini adalah dalam fokus membangun model data yang masuk akal dan mengkomunikasikan aspek-aspek penting dengan tingkat ketidakpastian yang sesuai.
sumber
Pertama-tama ini bukan masalah untuk menguji pengujian yang sering dilakukan. Masalahnya terletak pada hipotesis nol bahwa artinya sama persis. Oleh karena itu jika populasi berbeda dalam berarti dengan jumlah kecil dan ukuran sampel cukup besar peluang untuk menolak hipotesis nol ini sangat tinggi. Oleh karena itu nilai p untuk tes Anda ternyata sangat kecil. Pelakunya adalah pilihan hipotesis nol. Pilih d> 0 dan ambil hipotesis nol untuk menjadi bahwa berarti berbeda dengan kurang dari d dalam nilai absolut dengan kurang dari d. Anda memilih d sehingga perbedaan nyata harus cukup besar untuk ditolak. Masalahmu hilang. Pengujian Bayesian tidak menyelesaikan masalah Anda jika Anda bersikeras pada hipotesis nol tentang persamaan hak yang berarti.
sumber