Katakanlah kita tahu rata-rata distribusi yang diberikan. Apakah ini mempengaruhi estimasi interval varians dari variabel acak (yang jika tidak dihitung menggunakan varians sampel)? Seperti, bisakah kita mendapatkan interval yang lebih kecil untuk tingkat kepercayaan yang sama?
normal-distribution
confidence-interval
variance
martianwars
sumber
sumber
Jawaban:
Saya tidak sepenuhnya yakin jawaban saya benar, tetapi saya berpendapat tidak ada hubungan umum. Inilah poin saya:
Mari kita pelajari kasus di mana interval kepercayaan varians dipahami dengan baik, yaitu. mengambil sampel dari distribusi normal (seperti yang Anda tunjukkan dalam tag pertanyaan, tetapi sebenarnya bukan pertanyaan itu sendiri). Lihat diskusi di sini dan di sini .
Interval kepercayaan untuk mengikuti dari pivot , di mana . (Ini hanyalah cara lain untuk menulis ungkapan yang mungkin lebih familiar , di mana )σ2 T=nσ^2/σ2∼χ2n−1 σ^2=1/n∑i(Xi−X¯)2 T=(n−1)s2/σ2∼χ2n−1 s2=1/(n−1)∑i(Xi−X¯)2
Dengan demikian, kita memiliki Oleh karena itu, interval kepercayaan adalah . Kita dapat memilih dan sebagai kuantil dan .
(Perhatikan secara sepintas bahwa untuk estimasi varians mana pun yang, karena condong, kuantil akan menghasilkan ci dengan probabilitas cakupan yang tepat, tetapi tidak optimal, yaitu bukan yang sesingkat mungkin. Untuk kepercayaan diri Interval menjadi sesingkat mungkin, kami memerlukan kerapatan yang identik di ujung bawah dan atas ci, mengingat beberapa kondisi tambahan seperti unimodality. Saya tidak tahu apakah menggunakan ci optimal itu akan mengubah hal-hal dalam jawaban ini.)χ2
Seperti yang dijelaskan dalam tautan, , di mana menggunakan yang dikenal berarti. Karenanya, kami mendapatkan interval kepercayaan yang valid lagi Di sini, dan akan menjadi kuantil dari .T′=ns20/σ2∼χ2n s20=1n∑i(Xi−μ)2
Lebar interval kepercayaan adalah dan Lebar relatif adalah Kita tahu itu sebagai mean sampel meminimalkan jumlah penyimpangan kuadrat. Di luar itu, saya melihat beberapa hasil umum mengenai lebar interval, karena saya tidak menyadari hasil yang jelas bagaimana perbedaan dan produk dari atas dan bawah quantiles berperilaku seperti yang kita meningkatkan derajat kebebasan per satu (tapi lihat gambar di bawah).
Misalnya, membiarkan
Dengan menggunakan kode di bawah ini, saya menjalankan studi simulasi kecil yang menunjukkan bahwa interval berdasarkan akan memenangkan sebagian besar waktu. (Lihat tautan yang diposting dalam jawaban Aksakal untuk rasionalisasi sampel besar dari hasil ini.)s20
Peluangnya tampaknya stabil dalam , tetapi saya tidak mengetahui penjelasan sampel hingga analitis:n
Gambar berikut memplot terhadap , mengungkapkan (seperti yang akan disarankan oleh intuisi) bahwa rasio cenderung 1. Seperti, apalagi, untuk besar, perbedaan antara lebar kedua cis akan lenyap sebagai . (Lihat lagi tautan yang diposting dalam jawaban Aksakal untuk rasionalisasi sampel besar dari hasil ini.)rn n X¯→pμ n n→∞
sumber
Biarkan saya yang pertama mengatur masalahnya. Kita tahu artinya populasi. Ini adalah poin yang sangat penting untuk dibuat di awal, karena tanpanya, kita tidak akan memiliki jawaban yang berarti.
Saya akan menjelaskan alasannya. Katakanlah kita memiliki sampel dan tidak tahu mean populasi. Kami memiliki penaksir varian yang biasa:
Sekarang, kami diberitahu bahwa rata-rata populasi adalah . Naluri pertama kami adalah menghubungkannya ke penaksir varians:μ
Perhatikan, bahwa ini adalah penaksir yang berbeda sekarang! Ini memiliki penyebut yang berbeda dll. Ia memiliki varian yang berbeda itu sendiri.
Namun, apakah benar untuk membandingkan dan ? Tidak, BUKAN.Var[σ] Var[σ′]
Kita harus membandingkan dan . Dengan kata lain kita harus membandingkan varian dari dua penaksir ini dengan syarat pengetahuan rata-rata populasi! Kalau tidak, kita akan jatuh ke dalam paradoks @ Scortchi.Var[σ|E[xi]=μ] Var[σ′|E[xi]=μ]
Ketika Anda mendapatkan informasi baru, yaitu , Anda harus memasukkannya dalam perkiraan ! Ini memecahkan paradoks @ Scortchi dalam komentarnya secara langsung. Persamaan yang saya lihat sejauh ini dalam jawaban tidak termasuk pengetahuan ke dalam CI atau varians dari estimator varians . Dalam contoh @ Scortchi mengetahui bahwa akan menyebabkan revisi CI of .E[xi]=μ Var[σ] μ σ x¯>>μ σ
Oleh karena itu, jawaban saya di sini mengikuti pengaturan yang saya jelaskan dijelaskan.
Ya, interval kepercayaan diri akan lebih sempit.
Secara filosofis, mengetahui rata-rata populasi adalah informasi tambahan, sehingga ketidakpastian harus lebih kecil dalam kasus ini.
Contoh: jika distribusi Anda adalah Poisson, maka varians adalah rata-rata sama. Oleh karena itu, mengetahui berarti Anda mengetahui varians juga, dan interval kepercayaan menyusut ke suatu titik. Tidak ada interval.
UPDATE: Lihatlah makalah ini : "Memperkirakan Varians Populasi dengan Mean Mean" oleh Zhang, 1996. Dia membandingkan estimasi standar varians vs yang menggunakan pengetahuan tentang mean populasi . Dia sampai pada kesimpulan yang sama: varians dari estimasi yang terakhir lebih kecil dari yang sebelumnya, yaitu interval kepercayaan estimasi varians akan lebih sempit. Dia juga menunjukkan bahwa keuntungan menghilang ketika ukuran sampel cenderung tak terbatas.1n−1∑i(xi−x¯)2 1n∑i(xi−μ)2
Saya pikir makalah ini adalah jawaban pasti untuk pertanyaan Anda.
sumber
Memperpanjang sedikit jawaban @Cristoph Hanck , & mengadaptasi kodenya ...
Misalkan Mr A tidak mengetahui rata-rata yang sebenarnya, atau statistik, & Mr B tidak mengetahui keduanya. Mungkin tampak aneh, bahkan tidak adil, bahwa Mr A dapat memperoleh interval kepercayaan yang lebih pendek untuk varians menggunakan pivot daripada Mr B menggunakan pivot . Tetapi dalam jangka panjang Mr B menang dalam agak rasa yang kuat: interval kepercayaan dirinya yang stokastik sempit-untuk lebar setiap Anda peduli untuk menentukan, proporsi Mr B CI sempit daripada lebih besar dari proporsi Mr A.T T′ w w
Mengumpulkan bersama-sama bagian dari kasus di mana Mr A's CI keluar lebih sempit menunjukkan bahwa dalam ini dia mendapat cakupan yang lebih rendah (sekitar 91%); tetapi ia membayar untuk itu dengan cakupan yang lebih tinggi (sekitar 96%) dalam subset kasus di mana intervalnya keluar lebih luas, mendapatkan cakupan yang benar (95%) secara keseluruhan. Tentu saja Tuan A tidak tahu kapan CI-nya berada di bagian mana. Dan Tuan C yang licik yang mengetahui nilai sebenarnya & mengambil atau menurutnya menghasilkan CI tersempit pada akhirnya akan terungkap ketika intervalnya gagal mempertahankan cakupan yang seharusnya 95%.T T′
sumber
Saya tidak bisa berkomentar tetapi pernyataan Aksakal yang menyapu "mengetahui rata-rata populasi adalah informasi tambahan, sehingga ketidakpastian harus lebih kecil dalam kasus ini" tidak jelas.
Dalam kasus terdistribusi normal, penaksir kemungkinan maksimum varians ketika tidak diketahui:μ
memiliki varian yang lebih rendah daripada
untuk setiap nilaiμ,σ
sumber