Apakah ada "standar" untuk notasi model statistik?

10

Sebagai contoh, dalam manual BUGS atau buku yang akan datang oleh Lee dan Wagenmakers ( pdf ) dan di banyak tempat lain jenis notasi digunakan yang bagi saya tampaknya sangat fleksibel karena dapat digunakan untuk menggambarkan secara ringkas sebagian besar model statistik. Contoh dari notasi ini adalah sebagai berikut:

yiBinomial(pi,ni)log(pi1pi)=bibiNormal(μp,σp)

yang akan menggambarkan model logistik hierarkis tanpa prediktor, tetapi dengan grup. Cara menggambarkan model ini tampaknya berfungsi sama baiknya untuk menggambarkan model frequentist dan Bayesian, misalnya, untuk membuat deskripsi model ini sepenuhnya Bayesian Anda hanya perlu menambahkan prior pada dan .μ p σ pi=1nμpσp

Apakah jenis notasi model / formalisme ini dijelaskan secara rinci dalam beberapa artikel atau buku?

Jika Anda ingin menggunakan notasi ini untuk menulis model, ada banyak cara berbeda dalam melakukan sesuatu dan akan sangat berguna dengan panduan komprehensif untuk mengikuti dan merujuk orang lain. Beberapa perbedaan yang saya temukan dalam cara orang menggunakan jenis notasi ini:

  • Apa yang Anda sebut distribusi? Misalnya, saya telah melihat , dll.N,N,Norm,Normal
  • Bagaimana Anda menangani indeks? Misalnya saya pernah melihat , , , dll. y i [ j ] y j | sayayijyi[j]yj|i
  • Simbol parameter mana yang biasanya digunakan untuk parameter. Sebagai contoh, adalah umum untuk menggunakan sebagai mean untuk distribusi normal, tetapi bagaimana dengan distribusi lainnya? (Untuk ini saya biasanya memeriksa distribusi Wikipedia )μ

Pertanyaan tindak lanjut: Apakah notasi ini memiliki nama? (Karena kurangnya nama yang lebih baik saya menyebutnya konvensi distribusi probabilitas sentris dalam posting blog yang saya tulis ...)

Rasmus Bååth
sumber

Jawaban:

2

Beberapa standar yang direkomendasikan untuk notasi statistik disajikan dalam Halperin, Hartley dan Hoel (1965) dan Sanders and Pugh (1972) . Sebagian besar notasi saat ini berasal dari konvensi yang didirikan oleh ahli statistik biometrik pada akhir abad ke-19 dan awal abad ke-20 (sebagian besar dilakukan oleh Pearson dan Fisher dan rekan-rekan mereka). Daftar berguna penggunaan notasi awal dipelihara oleh ekonom John Aldrich di sini , dan catatan sejarah sekolah biometrik Inggris diterbitkan dalam Aldrich (2003) . (Jika Anda memiliki pertanyaan lebih lanjut tentang topik ini, Aldrich mungkin adalah pakar hidup terkemuka di dunia dalam sejarah notasi dalam statistik.)

Selain dari karya eksplisit ini, ada banyak buku yang memberikan pengantar untuk bidang ini, dan ini hati-hati untuk mendefinisikan notasi yang konsisten dengan konvensi umum, mendefinisikan notasi saat berjalan. Ada banyak konvensi terkenal di bidang ini yang dijalankan secara konsisten melalui literatur, dan ahli statistik sangat mengenal ini melalui praktik, bahkan tanpa harus membaca rekomendasi dari para peneliti ini.

hubungan dengan makna "... memiliki distribusi ..." atau "... memiliki ukuran probabilitas ...", dll. Di bawah interpretasi ini relasi membandingkan dua set benda yang berbeda; objek di sisi kiri adalah variabel acak dan objek di sisi kanan adalah deskripsi ukuran probabilitas.

Ini memberikan dua kemungkinan interpretasi (dan sama-sama valid) dari pernyataan seperti:

XN(μ,σ2).
  • XN(μ,σ2)

  • XN(μ,σ2)


Aldrich, J. (2003) Bahasa Inggris Biometric School International Statistical Review 71 (1) , hlm. 109-131.

Halperin, M., Hartley, HO dan Hoel, PG (1965) Rekomendasi Standar untuk Simbol dan Notasi Statistik . The American Statistician 19 (3) , hlm. 12-14.

Sanders, JR and Pugh, RC (1972) Rekomendasi untuk Satu Set Standar Simbol dan Notasi Statistik . Peneliti Pendidikan 1 (11) , hlm. 15-16.

Ben - Pasang kembali Monica
sumber