Menggabungkan dua perkiraan interval / titik kepercayaan

17

Misalkan seseorang memiliki dua sampel independen dari populasi yang sama, dan metode yang berbeda digunakan pada dua sampel untuk memperoleh estimasi titik dan interval kepercayaan. Dalam kasus-kasus sepele orang yang masuk akal hanya akan mengumpulkan dua sampel dan menggunakan satu metode untuk melakukan analisis, tetapi anggaplah untuk saat ini bahwa metode yang berbeda harus digunakan karena keterbatasan salah satu sampel seperti data yang hilang. Dua analisis terpisah ini akan menghasilkan estimasi independen yang sama validnya untuk atribut populasi yang diminati. Secara intuitif saya pikir harus ada cara untuk menggabungkan dua estimasi ini dengan benar, baik dalam hal estimasi titik dan interval kepercayaan, sehingga menghasilkan prosedur estimasi yang lebih baik. Pertanyaan saya adalah apa yang harus menjadi cara terbaik untuk melakukannya? Saya bisa membayangkan rata-rata tertimbang dari beberapa jenis sesuai dengan informasi / ukuran sampel dalam setiap sampel, tetapi bagaimana dengan interval kepercayaan?

pengguna1600
sumber

Jawaban:

9

Anda dapat melakukan taksiran gabungan sebagai berikut. Anda kemudian dapat menggunakan taksiran gabungan untuk menghasilkan interval kepercayaan gabungan. Secara khusus, biarkan:

x1¯N(μ,σ2n1)

x2¯N(μ,σ2n2)

Menggunakan interval kepercayaan untuk kedua kasus, Anda dapat membangun kembali kesalahan standar untuk taksiran dan mengganti yang di atas dengan:

x1¯N(μ,SE1)

x2¯N(μ,SE2)

Taksiran gabungan adalah:

x¯=n1x1¯+n2x2¯n1+n2

Jadi,

x¯N(μ,n12SE1+n22SE2(n1+n2)2)=N(μ,σ2n1+n2)

Komunitas
sumber
1
β^±ZαSE
@ user1600 Poin bagus.
Jawaban ini dapat diterapkan untuk dua distribusi, hanya saja produk normal adalah normal, memberikan solusi yang bagus. Simulasi MCMC dapat digunakan dengan pasangan distribusi tanpa solusi bentuk tertutup, menggunakan pendekatan Bayesian dengan satu sampel sebagai yang sebelumnya dan yang lainnya kemungkinan.
David LeBauer
Jika kembali ke interval kepercayaan dari SE gabungan, apa derajat kebebasan untuk distribusi T nantinya? Apakah ini akan berubah jika menggabungkan lebih dari 2 interval kepercayaan?
DocBuckets
3

Kedengarannya sangat mirip meta-analisis bagi saya. Asumsi Anda bahwa sampel berasal dari populasi yang sama berarti Anda dapat menggunakan meta-analisis efek-tetap (bukan meta-analisis efek-acak). Metode varians invers-generik mengambil satu set estimasi independen dan varians mereka sebagai input, sehingga tidak memerlukan data lengkap dan berfungsi bahkan jika estimator yang berbeda telah digunakan untuk sampel yang berbeda. Estimasi gabungan kemudian merupakan rata-rata tertimbang dari estimasi yang terpisah, yang menimbang setiap estimasi dengan kebalikan variansnya. Varian dari estimasi gabungan adalah kebalikan dari jumlah bobot (invers dari varian).

Anda ingin bekerja pada skala di mana distribusi pengambilan sampel dari estimasi tersebut mendekati normal, atau setidaknya skala di mana interval kepercayaan kira-kira simetris, sehingga skala transformasi log biasanya untuk estimasi rasio (rasio risiko, rasio odds, rasio rasio ...). Dalam kasus lain, transformasi penstabil varian akan berguna, misalnya transformasi akar kuadrat untuk data Poisson, transformasi akar arcsin-kuadrat untuk data binomial, dll.

onestop
sumber
1

Ini tidak seperti sampel bertingkat. Jadi, mengumpulkan sampel untuk estimasi titik dan kesalahan standar sepertinya merupakan pendekatan yang masuk akal. Dua sampel akan ditimbang berdasarkan proporsi sampel.

Brett
sumber