Menurut artikel Wikipedia tentang estimasi bias dari standar deviasi sampel SD
adalah penaksir yang bias dari SD populasi. Ini menyatakan bahwa .
NB. Variabel acak independen dan setiap
Pertanyaan saya ada dua:
- Apa bukti dari bias itu?
- Bagaimana seseorang menghitung ekspektasi deviasi standar sampel
Pengetahuan saya tentang matematika / statistik hanya menengah.
estimation
standard-deviation
Dav Weps
sumber
sumber
Jawaban:
@ NRH menjawab pertanyaan ini memberikan bukti yang bagus dan sederhana tentang bias dari standar deviasi sampel. Di sini saya akan secara eksplisit menghitung ekspektasi deviasi standar sampel (pertanyaan kedua poster asli) dari sampel yang terdistribusi normal, pada titik mana biasnya jelas.
Varians sampel yang tidak bias dari serangkaian poin adalahx1,...,xn
Jika didistribusikan secara normal, itu adalah fakta bahwaxi
di mana adalah varian sebenarnya. The distribusi memiliki kepadatan probabilitasσ2 χ2k
menggunakan ini kita dapat memperoleh nilai yang diharapkan dari ;s
yang mengikuti dari definisi nilai yang diharapkan dan fakta bahwa adalah akar kuadrat dari variabel terdistribusi . Kuncinya sekarang adalah mengatur ulang istilah sehingga integrand menjadi kepadatan :s2(n−1)σ2−−−−−−√ χ2 χ2
sekarang kita tahu integrand baris terakhir sama dengan 1, karena itu adalah kepadatan . Konstanta penyederhanaan sedikit memberiχ2n
Oleh karena itu bias adalahs
Tidak sulit untuk melihat bahwa bias ini bukan 0 untuk setiap terbatas , sehingga membuktikan standar deviasi sampel bias. Di bawah biasnya adalah plot sebagai fungsi dari untuk berwarna merah bersama dengan berwarna biru:n n σ=1 1/4n
sumber
Anda tidak perlu normal. Yang Anda butuhkan adalah adalah penaksir tidak bias dari varian . Kemudian gunakan bahwa fungsi akar kuadrat benar - benar cekung sedemikian rupa sehingga (dengan bentuk ketimpangan Jensen yang kuat ) kecuali distribusi merosot di .
sumber
Melengkapi jawaban NRH, jika seseorang mengajarkan ini kepada sekelompok siswa yang belum mempelajari ketidaksetaraan Jensen, satu cara untuk pergi adalah dengan mendefinisikan standar deviasi sampel. anggaplah bahwa adalah non degenerasi (oleh karena itu, ), dan perhatikan persamaan
sumber