Di mana saya bisa membaca tentang justifikasi untuk penggunaan distribusi probabilitas parametrik?

8

Saya ingin mencari referensi, lebih disukai gratis di internet, di mana saya bisa membaca tentang pembenaran teoretis atau praktis untuk penggunaan distribusi probabilitas parametrik / analitik.

Yang saya maksud dengan distribusi parametrik adalah yang bernama seperti Normal, Weibull, dll.

Neil McGuigan
sumber

Jawaban:

4

Pertanyaan yang bagus Saya suka uraian Ben Bolker dari bukunya, Model Ekologis dan Data dalam R ( pracetak bab yang relevan ; bestiary of distribution mulai di halaman 19).

Untuk setiap distribusi, ia memiliki beberapa kalimat pada halaman dari mana asalnya dan untuk apa ia digunakan, ditambah beberapa matematika dan grafik.

David J. Harris
sumber
1

Dalam beberapa hal tidak ada statistik tanpa "parameter" dan "model". Ini adalah pelabelan sewenang-wenang sampai batas tertentu, tergantung pada apa yang Anda kenal sebagai "model" atau "parameter". Parameter dan model pada dasarnya cara menerjemahkan asumsi dan pengetahuan tentang dunia nyata ke dalam sistem matematika. Tetapi ini berlaku untuk semua algoritma matematika. Anda harus mengubah masalah Anda dari dunia nyata menjadi kerangka matematika apa pun yang ingin Anda gunakan untuk menyelesaikannya.

Menggunakan distribusi probabilitas yang telah ditetapkan berdasarkan beberapa prinsip adalah salah satu cara untuk melakukan konversi ini secara sistematis dan transparan. Prinsip-prinsip terbaik yang saya tahu adalah prinsip entropi maksimum (MaxEnt) dan prinsip kelompok transformasi (yang saya pikir bisa juga disebut prinsip "invarian" atau "masalah-ketidakpedulian").

Setelah ditetapkan, Anda dapat menggunakan teori probabilitas Bayesian untuk memanipulasi probabilitas "input" yang koheren yang berisi informasi dan asumsi Anda ke dalam probabilitas "keluaran" yang memberi tahu Anda seberapa besar ketidakpastian yang ada dalam analisis yang Anda minati.

Beberapa pengantar dari perspektif Bayes / MaxEnt yang dijelaskan di atas dapat ditemukan di sini , di sini , dan di sini . Ini didasarkan pada interpretasi probabilitas sebagai perpanjangan dari logika deduktif. Mereka lebih pada sisi teoretis.

Sebagai catatan akhir kecil, saya merekomendasikan metode ini terutama karena mereka tampaknya paling menarik bagi saya - saya tidak bisa memikirkan alasan teoretis yang baik untuk meninggalkan perilaku normatif yang ada di balik pemikiran Bayes / MaxEnt. Tentu saja, Anda mungkin tidak dipaksa seperti saya, dan saya dapat memikirkan beberapa kompromi praktis tentang kelayakan dan keterbatasan perangkat lunak. Statistik "dunia nyata" sering kali tentang ideologi mana yang Anda dekati (kira-kira Bayes vs kira-kira Kemungkinan Maksimum vs kira-kira berdasarkan Desain) atau ideologi mana yang Anda pahami dan dapat Anda jelaskan kepada klien Anda.

probabilityislogic
sumber
Saya pikir pernyataan pertama Anda tidak benar. Kami memiliki statistik non-parametrik dan melakukan resampling untuk menyelesaikan masalah.
Neil McGuigan
1
Ini adalah contoh dari apa yang saya maksud dengan itu tergantung pada apa yang Anda maksud ketika Anda mengatakan "parameter" dan "model". Statistik non-parametrik lebih didasarkan pada bentuk fungsi model yang fleksibel daripada tidak memiliki "parameter". Bahkan banyak metode statistik non-parametrik sangat parameter. Dan resampling adalah metode parametrik berdasarkan cdf empiris dan ekspansi seri taylor - setidaknya itu yang saya dapatkan dari kertas Efrons pada bootstrap dan jacknife.
probabilityislogic
1

Cara Bayesian untuk memperkenalkan dan memotivasi model parametrik adalah melalui Pertukaran dan Teorema Representasi De Finetti. Ada beberapa diskusi dalam pertanyaan ini:

Apa yang keren tentang teorema representasi de Finetti?

Pengantar yang bagus diberikan dalam bab pertama Teori Statistik Schervish . Semua ukuran teoretis bahasa yang diperlukan untuk diskusi diberikan dalam tour de force-nya Lampiran (dengan bukti lengkap!). Saya telah belajar banyak dari buku ini, dan saya sangat menyarankan Anda untuk membelinya.

Makalah ini mempelajari generalisasi konstruksi Bayesian:

Sandra Fortini, Lucia Ladelli dan Eugenio Regazzini

Sankhyā: Jurnal Statistik India, Seri A (1961-2002)

Vol. 62, No. 1 (Feb., 2000), hlm. 86-109

Ini tersedia untuk diunduh di sini: http://sankhya.isical.ac.in/search/62a1/62a17092.pdf

Zen
sumber