Masalah: Saya distribusi parameterisasi untuk digunakan sebagai prior dan data dalam meta-analisis Bayesian. Data disediakan dalam literatur sebagai statistik ringkasan, hampir secara eksklusif diasumsikan berdistribusi normal (walaupun tidak ada variabel yang dapat <0, beberapa adalah rasio, beberapa adalah massa, dan lain-lain).
Saya telah menemukan dua kasus yang saya tidak punya solusi. Terkadang parameter yang menarik adalah kebalikan dari data atau rasio dari dua variabel.
Contoh:
- rasio dua variabel yang terdistribusi normal:
- data: mean dan sd untuk persen nitrogen dan persen karbon
- parameter: rasio karbon terhadap nitrogen.
- kebalikan dari variabel yang terdistribusi normal:
- data: massa / area
- parameter: area / massa
Pendekatan saya saat ini adalah menggunakan simulasi:
misalnya untuk satu set data persen karbon dan nitrogen dengan cara: xbar.n, c, varians: se.n, c, dan ukuran sampel: nn, nc:
set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N
Saya ingin membuat parameter ratio.cn = perc.c / perc.n
# parameter of interest
ratio.cn <- perc.c / perc.n
Kemudian pilih distribusi yang paling cocok dengan kisaran untuk saya sebelumnya
library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}
Pertanyaan: Apakah ini pendekatan yang valid? Apakah ada pendekatan lain yang lebih baik?
Terima kasih sebelumnya!
Pembaruan: distribusi Cauchy, yang didefinisikan sebagai rasio dua normals dengan , memiliki utilitas terbatas karena saya ingin memperkirakan varians. Mungkin saya bisa menghitung varians simulasi n menarik dari Cauchy?
Saya memang menemukan perkiraan bentuk tertutup berikut tetapi saya belum menguji untuk melihat apakah mereka memberikan hasil yang sama ... Hayya et al, 1975 σ 2 y : x =σ 2 x ×μy/mu 4
Hayya, J. dan Armstrong, D. dan Gressis, N., 1975. Catatan tentang rasio dua variabel yang terdistribusi normal. Ilmu Manajemen 21: 1338--1341
sumber
Jawaban:
Anda mungkin ingin melihat beberapa referensi di bawah artikel Wikipedia tentang Distribusi Rasio . Mungkin saja Anda akan menemukan perkiraan atau distribusi yang lebih baik untuk digunakan. Kalau tidak, pendekatan Anda tampaknya baik.
Pembaruan Saya pikir referensi yang lebih baik mungkin:
Lihat rumus 2-4 di halaman 195.
Perbarui 2
Pada pertanyaan Anda yang terbaru tentang varians dari Cauchy - seperti yang ditunjukkan John Cook dalam komentar, varians tidak ada. Jadi, mengambil varians sampel tidak akan berfungsi sebagai "penaksir". Bahkan, Anda akan menemukan bahwa varians sampel Anda tidak konvergen sama sekali dan berfluktuasi liar saat Anda terus mengambil sampel.
sumber
Bisakah Anda tidak berasumsi bahwa Untuk kebalikan dari variabel acak normal dan melakukan perhitungan bayesian yang diperlukan setelah mengidentifikasi parameter yang sesuai untuk distribusi normal.y−1∼N(.,.)
Saran saya di bawah ini untuk menggunakan Cauchy tidak berfungsi seperti yang ditunjukkan dalam komentar oleh ars dan John.
Rasio dua variabel normal acak mengikuti distribusi Cauchy . Anda mungkin ingin menggunakan ide ini untuk mengidentifikasi parameter cauchy yang paling cocok dengan data yang Anda miliki.sumber