Baru-baru ini saya mulai membaca Gelman and Hill, "Analisis Data Menggunakan Regresi dan Model Bertingkat / Hirarki" dan pertanyaannya didasarkan pada:
Sampel berisi 6 pengamatan pada proporsi:
Setiap memiliki mean dan varians , di mana adalah jumlah pengamatan yang digunakan untuk menghitung proporsi .
Statistik uji adalah sampel standar deviasi dari proporsi ini.
Buku itu mengatakan bahwa nilai yang diharapkan dari varians sampel dari keenam proporsi, , adalah . Saya mengerti semua ini.
Yang ingin saya ketahui adalah distribusi dan ? Akan sangat menghargai jika seseorang dapat memberi tahu saya apa itu, atau membimbing saya ke buku atau artikel yang berisi informasi ini.
Terima kasih banyak.
distributions
binomial
standard-deviation
Curious2learn
sumber
sumber
Jawaban:
Distribusi tepat untuk proporsi adalah , dan proporsi dapat mengambil nilai . Distribusi yang dihasilkan dari standar deviasi sampel adalah distribusi diskrit yang rumit. Membiarkan , dapat ditulis dalam bentuk yang paling sepele seperti:pi ~ Bin(ni,πi)/ni pi=0,1ni,2ni,...,ni−1ni,1 T p≡(p1,p2,...,p6)
di mana adalah himpunan semua vektor proporsi yang mengarah ke varians sampel yang tidak lebih besar dari . Sebenarnya tidak ada cara untuk menyederhanakan ini dalam kasus umum. Mendapatkan probabilitas yang tepat dari distribusi ini akan mengharuskan Anda untuk menghitung vektor proporsi yang menghasilkan varians sampel dalam rentang minat, dan kemudian menjumlahkan produk binomial pada rentang yang disebutkan. Ini akan menjadi latihan perhitungan yang berat bahkan untuk nilai .P(t)≡{p|T⩽t} t n1,...,n6
Sekarang, jelas distribusi di atas bukanlah bentuk yang sangat membantu. Yang benar-benar memberitahu Anda adalah bahwa Anda perlu menyebutkan hasil yang menarik dan kemudian menjumlahkan probabilitas mereka. Itulah mengapa tidak biasa untuk menghitung probabilitas yang tepat dalam kasus ini, dan jauh lebih mudah untuk menarik bentuk asimtotik untuk distribusi varians sampel.
sumber