Apa topik statistik frequentist yang harus saya ketahui sebelum mempelajari statistik Bayesian?

8

Saya bertanya-tanya apakah ada bagian dari topik statistik frequentist yang harus diketahui sebelum mulai mempelajari statistik Bayesian. Suatu kali saya membaca bahwa kedua tren itu saling bertentangan; seperti misalnya analisis frequentist sangat didasarkan pada asumsi (hipotesis) yang dibuat lebih dari data yang diamati; sementara statistik Bayesian lebih mengandalkan pembangunan model sebelumnya untuk menyimpulkan informasi posterior tentang hal itu.

Bagaimanapun, topik statistik umum atau umum manakah yang harus saya ketahui sebelum memulai statistik Bayesian?

Layla
sumber
"antagonis satu sama lain" -> "antagonis satu sama lain"?
Faheem Mitha

Jawaban:

6

Tidak perlu menyebutnya materi yang sering, melainkan materi dari probabilitas dan statistik secara umum.

Berikut adalah beberapa contoh pengetahuan sebelumnya yang, menurut pendapat saya, akan berguna:

  1. Apa itu kepadatan, distribusi (bersyarat), ekspektasi dll.?
  2. Beberapa keluarga distribusi tertentu (Beta, normal, seragam, dll.)
  3. Kemungkinan besar Anda akan ingin menerapkan metode Bayesian ke data nyata, sehingga perangkat lunak statistik. Favorit saya: R
  4. Beberapa matematika: Matriks aljabar, integrasi, ...
  5. Juga, mungkin berguna untuk terbiasa dengan beberapa model statistik, seperti model linear .y=Xβ+u
  6. Mengingat penekanan yang berat pada kemungkinan, tidak ada salahnya untuk mendengar tentang kemungkinan maksimum sebelumnya

Paradigma Bayes menjadi subyektif, saya yakin orang lain akan tidak setuju atau menambah daftar ini ...

Christoph Hanck
sumber
Jadi jawaban Anda untuk pertanyaan "topik apa yang sering saya pelajari" pada dasarnya adalah "tidak ada"? Karena Anda secara eksplisit mengabaikan topik umum seperti hipotesis nol, p-Nilai, atau penaksir tidak bias
nikie
1
Yah, saya harus mengatakan saya belum pernah bertemu (atau setidaknya berbicara dengan tentang) siapa pun yang belajar statistik Bayesian sebelum statistik sering, tetapi itu akan menjadi pendapat saya, ya, karena memang, topik ini relatif kurang penting dari sudut pandang Bayesian . Tentu saja, ada hasil pada tes hipotesis Bayesian, dan sifat-sifat frequentist dari estimator Bayes (seperti ketidakberpihakan). Tapi saya berpendapat ini tidak perlu untuk mulai belajar, seperti yang Anda minta.
Christoph Hanck
10

Anda tidak perlu belajar statistik 'sering' atau Bayesian dalam urutan tertentu. Anda harus terlebih dahulu mempelajari apa pun yang Anda butuhkan untuk memahami temuan di bidang Anda, dan kemudian Anda harus memahami hubungan matematika (komputasi) dan filosofis (interpretasi) antara teknik. Tidak ada guru yang suka data nyata, jadi itu selalu menjadi perhatian pertama.

Tidak ada alasan khusus mengapa Anda tidak dapat mempelajarinya secara bersamaan. Sangat membantu untuk mengetahui inti kalkulus untuk Bayes, yang mungkin berasal dari mana reputasinya sebagai "lebih keras" berasal, tetapi saya tidak akan menyebutnya perlu sekarang karena kami memiliki perangkat lunak yang jauh lebih baik daripada hanya beberapa tahun yang lalu. Jika Anda baru dalam statistik dan ingin bermain-main dengan kerangka kerja frequentist dan Bayesian, saya dapat merekomendasikan perangkat lunak JASP baru . Jika Anda suka R, paket BayesFactor solid.

Jika Anda ingin memulai dari frequentism, saya sarankan mengetahui yang berikut:

  1. Penafsiran lengkap dan tepat untuk semua item berikut.
  2. Hubungan antara nilai-p, interval kepercayaan, ukuran sampel, tingkat daya dan kesalahan.
  3. Hubungan antara uji-Z, uji-t, analisis varian dan regresi linier.
  4. Hubungan antara regresi linier dan regresi nonlinier, serta uji parametrik versus nonparametrik.
  5. Hubungan antara variabel dummy, kontras dan pengkodean efek.
  6. Penafsiran lengkap dan tepat untuk semua item sebelumnya.

Kedengarannya seperti banyak, tetapi semua ini terhubung secara mendasar. Setiap kesimpulan menyimpulkan hal penting yang sama: kami ingin membuat prediksi yang benar tentang data yang tidak teramati, berdasarkan pada model data yang diamati, dengan membandingkan dua atau lebih model. Kami melakukan ini dengan menghitung kepercayaan kami, untuk beberapa definisi "kepercayaan," dalam dua model atau lebih dan mengambil rasio. Pada dasarnya, itu saja.

Banyak kontroversi sebenarnya hanya tentang memformalkan "kepercayaan diri," dan sementara ini merupakan diskusi penting yang saya senang kita alami, itu juga bukan sesuatu yang perlu Anda ketahui saat ini. Dalam kerangka frequentist, langkah-langkah khusus diambil untuk membuat model nol implisit untuk dimasukkan ke dalam penyebut, sedangkan dalam kerangka Bayesian, kedua model dinyatakan secara eksplisit, tetapi output aktual dan interpretasi untuk kedua kerangka kerja melibatkan tingkat subjektivitas yang substansial. Untuk frequentism, itu dalam pembangunan kemungkinan maksimum dan pilihan tingkat kesalahan, dan untuk Bayesian, itu di prioritas sebelumnya. Semua orang harus mempelajari keduanya, dalam pandangan saya.

Christian Hummeluhr
sumber