Dalam sebuah artikel baru-baru ini yang membahas kerugian bergantung pada nilai-p untuk inferensi statistik, yang disebut "Matrixx v. Siracusano dan Student v. Fisher signifikansi statistik pada percobaan" (DOI: 10.1111 / j.1740-9713.2011.00511.x), Stephen T. Ziliak menentang penggunaan nilai-p. Dalam paragraf penutup dia berkata:
Data adalah satu hal yang sudah kita ketahui, dan pasti. Apa yang sebenarnya ingin kita ketahui adalah sesuatu yang sangat berbeda: probabilitas hipotesis itu benar (atau setidaknya berguna secara praktis), mengingat data yang kita miliki. Kami ingin mengetahui probabilitas bahwa kedua obat itu berbeda, dan seberapa banyak, berdasarkan bukti yang tersedia. Tes signifikansi - yang didasarkan pada kekeliruan dari kondisi bersyarat, perangkap yang dijebak Fisher - tidak dan tidak bisa memberi tahu kita kemungkinan itu. Fungsi kekuasaan, fungsi kerugian yang diharapkan, dan banyak metode pengambilan keputusan lainnya - teoretis dan Bayesian turun dari Student dan Jeffreys, sekarang tersedia secara luas dan gratis secara online, lakukan.
Apa fungsi kekuasaan, fungsi kerugian yang diharapkan dan "metode pengambilan keputusan-teori lainnya dan Bayesian"? Apakah metode ini banyak digunakan? Apakah mereka tersedia dalam R? Bagaimana metode baru yang disarankan ini diterapkan? Bagaimana, misalnya, bagaimana saya akan menggunakan metode ini untuk menguji hipotesis saya dalam set data yang saya akan menggunakan uji-t dua sampel konvensional dan nilai-p?
Jawaban:
Ini kedengarannya seperti kertas nyaring lainnya oleh orang yang bingung. Fisher tidak jatuh ke dalam perangkap seperti itu, meskipun banyak siswa statistik melakukannya.
Pengujian hipotesis adalah masalah keputusan teoritik. Secara umum, Anda berakhir dengan tes dengan ambang batas yang diberikan antara dua keputusan (hipotesis benar atau hipotesis salah). Jika Anda memiliki hipotesis yang sesuai dengan satu titik, seperti , maka Anda dapat menghitung probabilitas data Anda dihasilkan ketika itu benar. Tapi apa yang Anda lakukan jika itu bukan satu poin? Anda mendapatkan fungsi θ . Hipotesis θ ≠ 0 adalah hipotesis seperti itu, dan Anda mendapatkan fungsi seperti itu untuk probabilitas menghasilkan data yang Anda amati mengingat itu benar. Fungsi itu adalah fungsi daya. Sangat klasik. Fisher tahu semua tentang itu.θ = 0 θ θ ≠ 0
Kehilangan yang diharapkan adalah bagian dari mesin dasar teori keputusan. Anda memiliki berbagai keadaan alamiah, dan berbagai kemungkinan data yang dihasilkan darinya, dan beberapa kemungkinan keputusan yang dapat Anda buat, dan Anda ingin menemukan fungsi yang baik dari data hingga keputusan. Bagaimana Anda mendefinisikan yang baik? Mengingat keadaan alam tertentu yang mendasari data yang telah Anda peroleh, dan keputusan yang dibuat oleh prosedur itu, apa kerugian yang Anda harapkan? Ini paling mudah dipahami dalam masalah bisnis (jika saya melakukan ini berdasarkan penjualan yang saya amati dalam tiga kuartal terakhir, apa kerugian moneter yang diharapkan?).
Prosedur Bayesian adalah bagian dari prosedur teoretis keputusan. Kerugian yang diharapkan tidak cukup untuk menentukan prosedur terbaik yang unik dalam semua kasus kecuali sepele. Jika satu prosedur lebih baik daripada yang lain di kedua negara A dan B, jelas Anda akan lebih suka, tetapi jika satu lebih baik di negara A dan satu lebih baik di negara B, yang Anda pilih? Di sinilah ide-ide tambahan seperti prosedur Bayes, minimaxity, dan ketidakberpihakan masuk.
Saya juga sedikit bingung mengapa dia menamai Student dan Jeffreys bersama-sama, mengingat Fisher bertanggung jawab atas penyebaran luas karya Student.
Pada dasarnya, penggunaan buta nilai-p adalah ide yang buruk, dan mereka adalah konsep yang agak halus, tetapi itu tidak membuat mereka tidak berguna. Haruskah kita menolak penyalahgunaan mereka oleh peneliti dengan latar belakang matematika yang buruk? Tentu saja, tapi mari kita ingat seperti apa sebelum Fisher mencoba menyaring sesuatu untuk digunakan oleh orang di lapangan.
sumber
Saya merekomendasikan fokus pada hal-hal seperti interval kepercayaan dan pengecekan model. Andrew Gelman telah melakukan pekerjaan besar dalam hal ini. Saya merekomendasikan buku-buku pelajarannya tetapi juga memeriksa barang-barang yang dia masukkan online, misalnya http://andrewgelman.com/2011/06/the_holes_in_my/
sumber
The ez paket menyediakan rasio kemungkinan ketika Anda menggunakan
ezMixed()
fungsi untuk melakukan pemodelan efek campuran. Rasio kemungkinan bertujuan untuk mengkuantifikasi bukti untuk suatu fenomena dengan membandingkan kemungkinan (mengingat data yang diamati) dari dua model: model "terbatas" yang membatasi pengaruh fenomena menjadi nol dan model "tidak terbatas" yang memungkinkan pengaruh bukan nol dari fenomena. Setelah mengoreksi kemungkinan yang diamati untuk kompleksitas diferensial model '(melalui Akaike Information Criterion, yang secara asimtotik setara dengan cross-validasi), rasio mengukur bukti untuk fenomena tersebut.sumber
Semua teknik tersebut tersedia dalam R dalam arti yang sama bahwa semua aljabar tersedia dalam pensil Anda. Bahkan nilai-p tersedia melalui banyak fungsi berbeda dalam R, memutuskan fungsi mana yang digunakan untuk mendapatkan nilai-p atau posterior Bayesian lebih kompleks daripada penunjuk ke fungsi tunggal atau paket.
Setelah Anda mempelajari teknik-teknik tersebut dan memutuskan pertanyaan apa yang sebenarnya Anda inginkan jawabannya juga maka Anda dapat melihat (atau kami dapat memberikan lebih banyak bantuan) bagaimana melakukannya dengan menggunakan R (atau alat lain). Hanya mengatakan bahwa Anda ingin meminimalkan fungsi kerugian Anda, atau mendapatkan distribusi posterior sama bermanfaatnya dengan menjawab "makanan" ketika ditanya apa yang ingin Anda makan untuk makan malam.
sumber