Saya perlu mendapatkan semacam "rata-rata" di antara daftar varian, tetapi mengalami masalah dengan solusi yang masuk akal. Ada diskusi menarik tentang perbedaan di antara tiga cara Pythagoras (aritmatika, geometris, dan harmonik) di utas ini ; Namun, saya masih tidak merasa ada di antara mereka yang akan menjadi kandidat yang baik. Ada saran?
PS Some context - Varians ini adalah varian sampel dari subyek, masing-masing melalui desain eksperimen yang sama dengan ukuran sampel yang kira-kira sama . Dengan kata lain, ada varians sampel , , ..., , sesuai dengan subjek tersebut. Analisis meta telah dilakukan di tingkat populasi. Alasan saya perlu mendapatkan beberapa jenis sampel "rata-rata" atau "diringkas" adalah karena saya ingin menggunakannya untuk menghitung indeks seperti ICC setelah analisis meta.
PPS Agar diskusi lebih konkret, izinkan saya menjelaskan masalah ini dengan contoh berikut dalam R:
library(metafor)
dat <- get(data(dat.konstantopoulos2011))
dat$district <- as.factor(dat$district)
dat$school <- as.factor(dat$school)
Dalam dataset ada perbedaan yang terkait dengan skor kinerja masing-masing sekolah:
str(dat)
Classes ‘escalc’ and 'data.frame': 56 obs. of 6 variables:
$ district: Factor w/ 11 levels "11","12","18",..: 1 1 1 1 2 2 2 2 3 3 ...
$ school : Factor w/ 11 levels "1","2","3","4",..: 1 2 3 4 1 2 3 4 1 2 ...
$ year : int 1976 1976 1976 1976 1989 1989 1989 1989 1994 1994 ...
$ yi : atomic -0.18 -0.22 0.23 -0.3 0.13 -0.26 0.19 0.32 0.45 0.38 ...
$ vi : num 0.118 0.118 0.144 0.144 0.014 0.014 0.015 0.024 0.023 0.043 ...
Misalkan kita melakukan analisis meta dengan model hierarkis atau efek-campuran:
mana dan adalah efek acak untuk th sekolah dan th kabupaten, masing-masing, dan adalah kesalahan pengukuran dengan distribusi Gaussian dikenal . Model ini dapat dianalisis seperti di bawah ini:
(fm <- rma.mv(yi, vi, random = list(~1 | district, ~1 | school), data=dat))
render estimasi varians berikut untuk dua komponen varians:
Multivariate Meta-Analysis Model (k = 56; method: REML)
Variance Components:
estim sqrt nlvls fixed factor
sigma^2.1 0.0814 0.2853 11 no district
sigma^2.2 0.0010 0.0308 11 no school
Dua varian dalam hasil, sigma ^ 2.1 dan sigma ^ 2.2, sesuai dengan dua variabel efek-acak (distrik dan sekolah).
Saya ingin menghitung ICC untuk distrik, dan itulah sebabnya saya ingin mendapatkan varians yang dirangkum di tempat pertama untuk varian individual tersebut, , dari istilah pengukuran . Karena total varians adalah
Pendekatan asli saya (dan sederhana) adalah hanya menggunakan rata-rata aritmatika:
tapi saya tidak yakin jika aritmatika berarti, , sesuai dalam konteks ini.
Jawaban:
Memperluas komentar yang Anda dapatkan, jawaban untuk pertanyaan dalam judul Anda sudah diberikan di Cara 'menjumlahkan' standar deviasi? utas, dan baca sebagai berikut: untuk mendapatkan simpangan baku rata-rata, pertama ambil rata-rata varians dan kemudian ambil akar kuadratnya.
Pada nilai nominal, pendekatan ini valid, tetapi mengabaikan sifat hierarkis data Anda. Contoh serupa dibahas dalam Bab 5 dari Analisis Data Bayesian oleh Andrew Gelman et al (lihat juga di sini ), yang menunjukkan bahwa sebenarnya lebih bijaksana untuk menggunakan model hierarkis yang mengandalkan perkiraan yang dikumpulkan. Dalam kasus Anda, Anda punyan × k pengamatan, untuk n subyek dalam k perawatan dan saya kira dapat diasumsikan bahwa ada semacam kesamaan antara hasil yang diperoleh oleh setiap subjek dan antara setiap perawatan. Ini sudah menyarankan model hierarkis dengan efek tingkat atas yang dilintasi untuk perawatan dan untuk subjek. Dengan menggunakan model seperti itu, Anda akan memperhitungkan kedua sumber variasi.
Perhatikan bahwa formulasi modern ICC sebenarnya mendefinisikannya dalam hal model efek-campuran dari jenis seperti yang dijelaskan di atas, jadi menggunakan model tersebut memecahkan banyak masalah untuk Anda dan sering kali merupakan pendekatan yang direkomendasikan untuk meta-analisis (tetapi perhatikan bahwa ICC dapat menyesatkan ).
Mengenai hasil edit Anda, jika model Anda adalah
kemudianαsaya∼ N(μα,σ2α) , βj∼ N(μβ,σ2β) dan ϵsaya j∼ N( 0 ,σ2ϵ) , jadi ICC Anda
Rerata kesalahan tidak masuk ke persamaan pada titik mana pun. Apa yang datang ke persamaan adalah varian dari masing-masing efek acakα , β dan "kebisingan" global ϵ . Idenya adalah untuk memperkirakan bagian varian yang diambil olehα , yaitu berapa banyak dari total varians yang diperhitungkan. Ini adalah bagaimana ICC didefinisikan oleh penciptanya Ronald A. Fisher (1966) dalam Metode Statistik untuk Pekerja Penelitian :
Jadi pembilang dalam rumus ICC adalah varians dari efek bunga dan penyebutnya adalah total varians. Perhatikan bahwa mean varians tidak ada hubungannya dengan total varians (jumlah varians), jadi kecuali saya salah paham sesuatu, saya tidak dapat melihat mengapa mean adalah minat Anda di sini.
sumber