Bagaimana parameter parameter rasio dua variabel yang terdistribusi normal, atau kebalikan dari satu?

12

Masalah: Saya distribusi parameterisasi untuk digunakan sebagai prior dan data dalam meta-analisis Bayesian. Data disediakan dalam literatur sebagai statistik ringkasan, hampir secara eksklusif diasumsikan berdistribusi normal (walaupun tidak ada variabel yang dapat <0, beberapa adalah rasio, beberapa adalah massa, dan lain-lain).

Saya telah menemukan dua kasus yang saya tidak punya solusi. Terkadang parameter yang menarik adalah kebalikan dari data atau rasio dari dua variabel.

Contoh:

  1. rasio dua variabel yang terdistribusi normal:
    • data: mean dan sd untuk persen nitrogen dan persen karbon
    • parameter: rasio karbon terhadap nitrogen.
  2. kebalikan dari variabel yang terdistribusi normal:
    • data: massa / area
    • parameter: area / massa

Pendekatan saya saat ini adalah menggunakan simulasi:

misalnya untuk satu set data persen karbon dan nitrogen dengan cara: xbar.n, c, varians: se.n, c, dan ukuran sampel: nn, nc:

set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N

Saya ingin membuat parameter ratio.cn = perc.c / perc.n

# parameter of interest
ratio.cn <- perc.c / perc.n

Kemudian pilih distribusi yang paling cocok dengan kisaran untuk saya sebelumnya0

library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
    dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}

Pertanyaan: Apakah ini pendekatan yang valid? Apakah ada pendekatan lain yang lebih baik?

Terima kasih sebelumnya!

Pembaruan: distribusi Cauchy, yang didefinisikan sebagai rasio dua normals dengan , memiliki utilitas terbatas karena saya ingin memperkirakan varians. Mungkin saya bisa menghitung varians simulasi n menarik dari Cauchy?μ=0

Saya memang menemukan perkiraan bentuk tertutup berikut tetapi saya belum menguji untuk melihat apakah mereka memberikan hasil yang sama ... Hayya et al, 1975 σ 2 y : x =σ 2 x ×μy/mu 4

μ^y:x=μy/mux+σx2μy/μx3+cov(x,y)σx2σy2/μx2
σ^y:x2=σx2×μy/mux4+σy2/mux22cov(x,y)σx2σy2/mux3

Hayya, J. dan Armstrong, D. dan Gressis, N., 1975. Catatan tentang rasio dua variabel yang terdistribusi normal. Ilmu Manajemen 21: 1338--1341

David LeBauer
sumber
saya harus mengirim pertanyaan Pembaruan tentang menghitung varians pada undian acak dari Cauchy sebagai pertanyaan terpisah?
David LeBauer
david - karena variabel Anda semuanya positif, mengapa Anda ingin repot dengan ? btw - dalam simulasi Anda, Anda tampaknya menghasilkan variabel per.c dan per.n yang independen. apakah itu benar - dan jika demikian, apakah itu yang Anda inginkan? μ=0
ronaf
tidak, saya tidak ingin ribut dengan = 0; variabel-variabel ini umumnya diperlakukan sebagai independen, dan data kovarian jarang tersedia. Karena C cukup konstan, independensi adalah asumsi yang masuk akal. μ
David LeBauer
Saya tidak mengerti mengapa ekspektasi rasio tidak ada. Jika dan secara bersama-sama terdistribusi normal dengan rata-rata berbeda dari nol, maka rata-rata diberikan oleh , apa yang saya lewatkan? Y Z = XXYxZ=XYxyp(x,y)dxdy
Royi

Jawaban:

6

Anda mungkin ingin melihat beberapa referensi di bawah artikel Wikipedia tentang Distribusi Rasio . Mungkin saja Anda akan menemukan perkiraan atau distribusi yang lebih baik untuk digunakan. Kalau tidak, pendekatan Anda tampaknya baik.

Pembaruan Saya pikir referensi yang lebih baik mungkin:

Lihat rumus 2-4 di halaman 195.

Perbarui 2

Pada pertanyaan Anda yang terbaru tentang varians dari Cauchy - seperti yang ditunjukkan John Cook dalam komentar, varians tidak ada. Jadi, mengambil varians sampel tidak akan berfungsi sebagai "penaksir". Bahkan, Anda akan menemukan bahwa varians sampel Anda tidak konvergen sama sekali dan berfluktuasi liar saat Anda terus mengambil sampel.

ars
sumber
Terima kasih untuk referensi, di situlah saya menemukan referensi Haaya 1975 dan persamaan dalam pertanyaan saya, meskipun saya akan menghargai jaminan bahwa persamaan tersebut sesuai untuk masalah saya.
David LeBauer
Melihat sekilas pada Haaya, tampaknya mereka khawatir dengan memperoleh perkiraan Normal untuk rasio dan menggunakan simulasi untuk menentukan kapan itu berlaku (menggunakan koefisien variasi, cv). Apakah cv dalam kasus Anda memenuhi kriteria? Jika demikian, perkiraan tersebut berlaku.
ars
1
@ David: gunakan Marsaglia 1965 sebagai gantinya diperbarui dalam jawabannya.
ars
NB: Marsaglia menerbitkan pembaruan di JSS pada tahun 2004 .
David LeBauer
Saya tidak mengerti mengapa ekspektasi rasio tidak ada. Jika dan secara bersama-sama terdistribusi normal dengan rata-rata berbeda dari nol, maka rata-rata diberikan oleh , apa yang saya lewatkan? Y Z = XXYxZ=XYxyp(x,y)dxdy
Royi
0

Bisakah Anda tidak berasumsi bahwa Untuk kebalikan dari variabel acak normal dan melakukan perhitungan bayesian yang diperlukan setelah mengidentifikasi parameter yang sesuai untuk distribusi normal.y1N(.,.)

Saran saya di bawah ini untuk menggunakan Cauchy tidak berfungsi seperti yang ditunjukkan dalam komentar oleh ars dan John.

Rasio dua variabel normal acak mengikuti distribusi Cauchy . Anda mungkin ingin menggunakan ide ini untuk mengidentifikasi parameter cauchy yang paling cocok dengan data yang Anda miliki.


sumber
Sebuah. Saya perlu memperkirakan varians dan varians dari distribusi Cauchy tidak didefinisikan.
David LeBauer
b. Jika saya mengerti poin kedua Anda, ya, saya bisa berasumsi bahwa y-1 ~ N (mu, sigma), tetapi saya masih perlu menghitung mu dan sigma dari ringkasan statistik yang diberikan untuk y; juga, saya memilih untuk tidak mempertimbangkan distribusi dengan nilai <0 untuk variabel yang hanya didefinisikan> 0 (meskipun dalam banyak kasus p (X <0 | X ~ N (mu, s)) -> 0)
David LeBauer
Bukankah Cauchy berlaku untuk normals rata-rata nol?
ars
@ars Anda benar. Cauchy kemudian dapat digunakan secara terbatas.
Ars: Ya, saya percaya hasil Cauchy membutuhkan nol berarti. Tetapi itu tetap berarti bahwa setidaknya dalam kasus khusus itu, varian yang coba diperkirakan oleh David TIDAK ADA.
John D. Cook