Menggabungkan informasi dari berbagai penelitian untuk memperkirakan rata-rata dan ragam data yang terdistribusi normal - pendekatan Bayesian vs meta-analitik

21

Saya telah meninjau satu set makalah, masing-masing melaporkan rata-rata yang diamati dan SD pengukuran dalam masing-masing sampel dengan ukuran yang diketahui, . Saya ingin membuat tebakan terbaik tentang kemungkinan distribusi ukuran yang sama dalam studi baru yang saya rancang, dan seberapa besar ketidakpastian dalam tebakan itu. Saya senang menganggap ).XnXN(μ,σ2

Pikiran pertama saya adalah meta-analisis, tetapi model biasanya menggunakan fokus pada estimasi titik dan interval kepercayaan yang sesuai. Namun, saya ingin mengatakan sesuatu tentang distribusi penuh , yang dalam hal ini juga termasuk membuat tebakan tentang varians, . Xσ2

Saya telah membaca tentang kemungkinan pendekatan Bayeisan untuk memperkirakan set lengkap parameter dari distribusi yang diberikan mengingat pengetahuan sebelumnya. Ini secara umum lebih masuk akal bagi saya, tetapi saya tidak memiliki pengalaman dengan analisis Bayesian. Ini juga tampak seperti masalah sederhana dan relatif mudah untuk memotong gigi saya.

1) Mengingat masalah saya, pendekatan mana yang paling masuk akal dan mengapa? Meta-analisis atau pendekatan Bayesian?

2) Jika menurut Anda pendekatan Bayesian adalah yang terbaik, dapatkah Anda mengarahkan saya ke cara untuk mengimplementasikan ini (lebih disukai dalam R)?

Pertanyaan terkait

EDIT:

Saya telah mencoba untuk menyelesaikan ini dengan apa yang saya pikir adalah cara Bayesian yang 'sederhana'.

Seperti yang saya nyatakan di atas, saya tidak hanya tertarik pada estimasi rata-rata, , tetapi juga varians, , mengingat informasi sebelumnya, yaituμσ2P(μ,σ2|Y)

Sekali lagi, saya tidak tahu apa-apa tentang Bayeianisme dalam praktiknya, tetapi tidak butuh waktu lama untuk menemukan bahwa posterior dari distribusi normal dengan mean yang tidak diketahui dan varian memiliki solusi bentuk tertutup melalui konjugasi , dengan distribusi gamma normal-invers.

Masalahnya dirumuskan ulang sebagai .P(μ,σ2|Y)=P(μ|σ2,Y)P(σ2|Y)

P(μ|σ2,Y) diperkirakan dengan distribusi normal; dengan distribusi gamma terbalik.P(σ2|Y)

Butuh beberapa saat untuk menyiasatinya, tetapi dari tautan ini ( 1 , 2 ) saya dapat, menurut saya, memilah cara melakukan ini di R.

Saya mulai dengan kerangka data yang terdiri dari satu baris untuk masing-masing 33 studi / sampel, dan kolom untuk rata-rata, varians, dan ukuran sampel. Saya menggunakan mean, varians, dan ukuran sampel dari studi pertama, di baris 1, sebagai informasi saya sebelumnya. Saya kemudian memperbarui ini dengan informasi dari studi berikutnya, menghitung parameter yang relevan, dan mengambil sampel dari gamma normal-terbalik untuk mendapatkan distribusi dan . Ini diulang sampai 33 studi telah dimasukkan.μσ2

# Loop start values values

  i <- 2
  k <- 1

# Results go here

  muL      <- list()  # mean of the estimated mean distribution
  varL     <- list()  # variance of the estimated mean distribution
  nL       <- list()  # sample size
  eVarL    <- list()  # mean of the estimated variance distribution
  distL    <- list()  # sampling 10k times from the mean and variance distributions

# Priors, taken from the study in row 1 of the data frame

  muPrior  <- bayesDf[1, 14]    # Starting mean
  nPrior   <- bayesDf[1, 10]    # Starting sample size
  varPrior <- bayesDf[1, 16]^2  # Starting variance

  for (i in 2:nrow(bayesDf)){

# "New" Data, Sufficient Statistics needed for parameter estimation

    muSamp    <- bayesDf[i, 14]          # mean
    nSamp     <- bayesDf[i, 10]          # sample size
    sumSqSamp <- bayesDf[i, 16]^2*(nSamp-1)  # sum of squares (variance * (n-1))

# Posteriors

    nPost   <- nPrior + nSamp
    muPost  <- (nPrior * muPrior + nSamp * muSamp) / (nPost)  
    sPost   <- (nPrior * varPrior) + 
                sumSqSamp + 
               ((nPrior * nSamp) / (nPost)) * ((muSamp - muPrior)^2)
    varPost <- sPost/nPost
    bPost   <- (nPrior * varPrior) + 
                sumSqSamp + 
               (nPrior * nSamp /  (nPost)) * ((muPrior - muSamp)^2)
# Update 

    muPrior   <- muPost
    nPrior    <- nPost
    varPrior  <- varPost

# Store

    muL[[i]]   <-  muPost
    varL[[i]]  <-  varPost
    nL[[i]]    <-  nPost
    eVarL[[i]] <- (bPost/2) / ((nPost/2) - 1)

# Sample

    muDistL  <- list()  
    varDistL <- list()

    for (j in 1:10000){
      varDistL[[j]] <- 1/rgamma(1, nPost/2, bPost/2)
      v             <- 1/rgamma(1, nPost/2, bPost/2)
      muDistL[[j]]  <- rnorm(1, muPost, v/nPost)
    }

# Store 

    varDist    <- do.call(rbind, varDistL)
    muDist     <- do.call(rbind, muDistL)
    dist       <- as.data.frame(cbind(varDist, muDist))
    distL[[k]] <- dist

# Advance

    k <- k+1 
    i <- i+1

  }

  var     <- do.call(rbind, varL)
  mu      <- do.call(rbind, muL)
  n       <- do.call(rbind, nL)
  eVar    <- do.call(rbind, eVarL)
  normsDf <- as.data.frame(cbind(mu, var, eVar, n)) 
  colnames(seDf) <- c("mu", "var", "evar", "n")
  normsDf$order <- c(1:33)

Berikut adalah diagram jalur yang menunjukkan bagaimana dan berubah saat setiap sampel baru ditambahkan.E(μ)E(σ2)

masukkan deskripsi gambar di sini

Berikut adalah desnitas berdasarkan pengambilan sampel dari estimasi distribusi untuk rata-rata dan varians pada setiap pembaruan.

masukkan deskripsi gambar di sini

masukkan deskripsi gambar di sini

Saya hanya ingin menambahkan ini jika bermanfaat bagi orang lain, dan agar orang yang tahu bisa memberi tahu saya apakah ini masuk akal, cacat, dll.

DL Dahly
sumber

Jawaban:

11

Dua pendekatan (meta-analisis dan pembaruan Bayesian) tidak terlalu berbeda. Model meta-analitik sebenarnya sering dibingkai sebagai model Bayesian, karena gagasan menambahkan bukti untuk pengetahuan sebelumnya (mungkin cukup samar) tentang fenomena yang ada cocok untuk meta-analisis. Artikel yang menjelaskan hubungan ini adalah:

Brannick, MT (2001). Implikasi dari meta-analisis Bayes empiris untuk validasi tes. Jurnal Psikologi Terapan, 86 (3) , 468-480.

(penulis menggunakan korelasi sebagai ukuran hasil untuk meta-analisis, tetapi prinsipnya sama terlepas dari ukurannya).

Artikel yang lebih umum tentang metode Bayesian untuk meta-analisis adalah:

Sutton, AJ, & Abrams, KR (2001). Metode Bayesian dalam meta-analisis dan sintesis bukti. Metode Statistik dalam Penelitian Medis, 10 (4) , 277-303.

Apa yang tampaknya Anda kejar (selain dari beberapa perkiraan gabungan) adalah interval prediksi / kredibilitas yang menggambarkan di mana dalam penelitian selanjutnya hasil / efek sebenarnya cenderung turun. Seseorang dapat memperoleh interval seperti itu dari meta-analisis "tradisional" atau dari model meta-analitik Bayesian. Pendekatan tradisional dijelaskan, misalnya, dalam:

Riley, RD, Higgins, JP, & Deeks, JJ (2011). Interpretasi meta analisis efek acak. British Medical Journal, 342 , d549.

θsayaθsayasayaθsaya

Wolfgang
sumber
3
Selain itu, banyak prior Bayesian telah dibuat dari hasil meta-analisis.
Fomite
2

ysayajN(μ,σ2)saya=1,...njj=1,...,Kμ

μ^=1Nj=1Knjy¯j,N=j=1Knj.
σσ2
σ~2=1N-Kj=1K(nj-1)sj2
NK
Pusto
sumber