Apakah distribusi sampel sah untuk inferensi?

15

Beberapa orang Bayesian menyerang kesimpulan sering yang menyatakan bahwa "tidak ada distribusi pengambilan sampel yang unik" karena itu tergantung pada niat peneliti (Kruschke, Aguinis, & Joo, 2012, p. 733).

Misalnya, seorang peneliti memulai pengumpulan data, tetapi pendanaannya tiba-tiba terpotong setelah 40 peserta. Bagaimana distribusi sampling (dan CI dan nilai-p) selanjutnya bahkan didefinisikan di sini? Apakah kita akan menganggap setiap sampel konstituen memiliki N = 40? Atau apakah itu terdiri dari sampel dengan N berbeda, dengan masing-masing ukuran ditentukan oleh waktu acak lain dananya mungkin telah dipotong?

Distribusi t, F, chi-square (dll), null yang ditemukan dalam buku teks semuanya mengasumsikan bahwa N adalah tetap dan konstan untuk semua sampel konstituen, tetapi dalam praktiknya hal ini mungkin tidak benar. Dengan setiap prosedur penghentian yang berbeda (misalnya, setelah interval waktu tertentu atau sampai asisten saya lelah) tampaknya ada distribusi pengambilan sampel yang berbeda, dan menggunakan distribusi tetap-N yang 'dicoba dan benar' ini tidak pantas.

Seberapa merusak kritik ini terhadap legitimasi CI dan nilai-p yang sering terjadi? Apakah ada bantahan teoretis? Tampaknya dengan menyerang konsep distribusi sampling, seluruh bangunan inferensi frequentist lemah.

Referensi ilmiah sangat dihargai.

ATJ
sumber
1
Kutipan untuk: Kruschke, JK, Aguinis, H., & Joo, H. (2012). Waktunya telah tiba: metode Bayesian untuk analisis data dalam ilmu organisasi. Tetapi Kruschke telah menggunakannya sebelumnya dalam: (2010) analisis data Bayesian dan (2010) Apa yang harus dipercaya: metode Bayesian untuk analisis data.
ATJ

Jawaban:

21

n

n

xnx¯kμ=0μ0L.(0)L.(x¯)e-k2/2kKadane (1996), "Penalaran ke kesimpulan sebelumnya", JASA , 91 , 435

Menunjukkan ketergantungan pada kesimpulan yang sering pada niat peneliti adalah penggalian yang berguna pada orang (jika masih ada) yang menaiki kuda mereka tentang "subjektivitas" kesimpulan Bayesian. Secara pribadi, saya bisa hidup dengannya; kinerja suatu prosedur dalam serangkaian pengulangan yang panjang akan selalu menjadi sesuatu yang lebih atau kurang nosional, yang tidak mengurangi dari itu menjadi hal yang berguna untuk dipertimbangkan ("kalibrasi kemungkinan" adalah bagaimana Cox menggambarkan nilai-p ). Dari tanggal referensi Anda mungkin telah memperhatikan bahwa masalah ini tidak terlalu baru; upaya untuk menyelesaikannya dengan argumentasi apriori sebagian besar mereda (kecuali di Internet, selalu ketinggalan zaman kecuali dalam hal-hal sepele) &

PS: Berpikir untuk menambah keseimbangan saldo pada Berger & Wolpert saya terjadi pada Cox & Mayo (2010), "Objektivitas dan Persyaratan dalam Inferensi Frequentist" dalam Kesalahan dan Inferensi . Kemungkinan besar ada unsur angan-angan dalam pernyataan saya bahwa debat telah mereda, tetapi sangat mengejutkan betapa sedikit hal baru yang bisa dikatakan tentang masalah ini setelah setengah abad. (Semua sama, ini adalah pembelaan singkat dan fasih dari ide-ide frequentist.)

Scortchi - Reinstate Monica
sumber
1
+1 (dahulu kala). Saya bertanya-tanya apakah alasan Armitage dapat disesuaikan dengan contoh binomial vs neg-binomial yang terkenal; misalnya mengamati urutan TTTTTH dari pelemparan koin menghasilkan p = 0,03 atau p = 0,1 tergantung pada aturan penghentian. Jadi, jika kita sekarang mempertimbangkan aturan penghentian lain, misalnya "Terus melempar sampai binomial p <0,05 dan ada setidaknya satu H dan setidaknya satu T", maka menjadi agak intuitif bahwa seseorang seharusnya tidak mengabaikan aturan penghentian ini untuk inferensi (Meskipun melanggar Prinsip Kemungkinan). Apakah ini masuk akal?
Amoeba berkata Reinstate Monica
4

Jawaban singkat untuk pertanyaan Anda adalah: itu tergantung siapa yang Anda tanya ;-) Orang Bayesian yang keras akan menyatakan kemenangan atas, atau setidaknya setara dengan, metodologi yang sering terjadi. Sering-sering mati-keras akan default ke "Ini tidak bisa dijawab". 99% ahli statistik lainnya akan menggunakan metode apa pun yang terbukti andal di bawah eksperimen yang salah.

Saya tahu bahwa kepekaan distribusi sampel terhadap niat peneliti dapat mengganggu, dan benar-benar tidak ada solusi yang baik untuk masalah itu. Bayesians dan frequentist sama-sama harus menggunakan beberapa subjektivitas dan penilaian dalam memutuskan bagaimana membentuk inferensi. Namun, saya pikir Anda mengambil contoh dari daerah yang umumnya kontroversial dan meletakkan masalah semata-mata di kaki kesimpulan yang sering. Eksperimen berurutan dan / atau terhenti adalah contoh klasik dari sifat subyektif dari inferensi ... dan yang tidak ada jawaban yang sepenuhnya objektif dan disepakati.

Bagaimana dengan inferensi reguler, di mana Anda benar-benar mengumpulkan sampel yang ingin Anda dapatkan? Di sini, saya pikir para frequentist berada di atas angin, karena CI dan nilai-p dikalibrasi dengan baik dengan sifat pengambilan sampel berulang mereka, sedangkan inferensi Bayesian mempertahankan sifat pribadi dan subjektifnya.

Jika Anda menginginkan penjelasan yang lebih teoretis dari respons Bayesian, saya akan membaca tentang "inferensi bersyarat" dengan para peneliti utama adalah Nancy Reid dan Lehmann.

Scortchi - Reinstate Monica
sumber