Bagaimana memahami bahwa MLE of Variance bias dalam distribusi Gaussian?

12

Ilustrasi PRML tentang bagaimana bias muncul dalam menggunakan kemungkinan maksimum untuk menentukan varian dari Gaussian

Saya membaca PRML dan saya tidak mengerti gambarnya. Bisakah Anda memberikan beberapa petunjuk untuk memahami gambar dan mengapa MLE varians dalam distribusi Gaussian bias?

rumus 1.55: rumus 1.56 σ 2 M L E =1

μMLE=1Nn=1Nxn
σMLE2=1Nn=1N(xnμMLE)2
ningyuwhut
sumber
Silakan tambahkan tag belajar sendiri.
StatsStudent
2
mengapa untuk setiap grafik, hanya satu titik data biru yang terlihat oleh saya? btw, ketika saya mencoba untuk mengedit limpahan dua subskrip dalam posting ini, sistem membutuhkan "setidaknya 6 karakter" ... memalukan.
Zhanxiong
Apa yang benar-benar ingin Anda pahami, gambaran atau mengapa estimasi varian MLE bias? Yang pertama sangat membingungkan tetapi saya bisa menjelaskan yang terakhir.
TrynnaDoStat
ya, saya menemukan dalam versi baru setiap grafik memiliki dua data biru, pdf saya sudah tua
ningyuwhut
@TrynnaDoStat maaf untuk pertanyaan saya tidak jelas. apa yang ingin saya ketahui adalah mengapa estimasi varian MLE bias. dan bagaimana ini diungkapkan dalam grafik ini
ningyuwhut

Jawaban:

25

Intuisi

Biasnya "berasal dari" (sama sekali bukan istilah teknis) fakta bahwa bias untuk . Pertanyaan alami adalah, "baik, apa intuisi mengapa bias untuk "? Intuisi adalah bahwa dalam mean sampel non-kuadrat, kadang-kadang kita kehilangan nilai sebenarnya dengan menaksir berlebihan dan kadang-kadang dengan taksiran lebih rendah. Tetapi, tanpa kuadratkan, kecenderungan untuk menaksir terlalu tinggi dan kurang menaksir akan membatalkan satu sama lain. Namun, ketika kami menyamakan kecenderungan untuk di bawah perkiraan (kehilangan nilai sebenarnya dariμ 2 E [ ˉ x 2 ] μ 2 μ ˉ x μE[x¯2]μ2E[x¯2]μ2μx¯μdengan angka negatif) juga akan kuadrat dan dengan demikian menjadi positif. Dengan demikian, tidak lagi dibatalkan dan ada sedikit kecenderungan untuk memperkirakan terlalu tinggi.

Jika intuisi di balik mengapa bias untuk masih belum jelas, cobalah untuk memahami intuisi di balik ketidaksetaraan Jensen (penjelasan intuitif yang baik di sini ) dan menerapkannya pada .μ 2 E [ x 2 ]x2μ2E[x2]

Mari kita buktikan bahwa MLE varians untuk sampel iid bias. Kemudian kami akan secara analitis memverifikasi intuisi kami.

Bukti

Biarkan .σ^2=1Nn=1N(xnx¯)2

Kami ingin menunjukkan .E[σ^2]σ2

E[σ^2]=E[1Nn=1N(xnx¯)2]=1NE[n=1N(xn22xnx¯+x¯2)]=1NE[n=1Nxn2n=1N2xnx¯+n=1Nx¯2]

Menggunakan fakta bahwa dan ,n=1Nxn=Nx¯n=1Nx¯2=Nx¯2

1NE[n=1Nxn2n=1N2xnx¯+n=1Nx¯2]=1NE[n=1Nxn22Nx¯2+Nx¯2]=1NE[n=1Nxn2Nx¯2]=1NE[n=1Nxn2]E[x¯2]=1Nn=1NE[xn2]E[x¯2]=E[xn2]E[x¯2]

Dengan langkah terakhir mengikuti sejak karena sama di karena berasal dari distribusi yang sama.E[xn2]n

Sekarang, ingat definisi varian yang mengatakan . Dari sini, kita mendapatkan yang berikut iniσx2=E[x2]E[x]2

E[xn2]E[x¯2]=σx2+E[xn]2σx¯2E[xn]2=σx2σx¯2=σx2Var(x¯)=σx2Var(1Nn=1Nxn)=σx2(1N)2Var(n=1Nxn)

Perhatikan bahwa kami telah dengan tepat menguadratkan konstanta ketika mengeluarkannya dari . Berikan perhatian khusus untuk itu!1NVar()

σx2(1N)2Var(n=1Nxn)=σx2(1N)2Nσx2=σx21Nσx2=N1Nσx2

yang tentu saja tidak sama dengan .σx2

Verifikasi Secara Analitik Intuisi kita

Kita dapat memverifikasi intuisi dengan mengasumsikan kita tahu nilai dan menghubungkannya dengan bukti di atas. Karena kita sekarang tahu , kita tidak perlu lagi memperkirakan dan karenanya kita tidak pernah memperkirakannya dengan . Mari kita lihat bahwa ini "menghapus" bias di .μμμ2E[x¯2]σ^2

Biarkan .σ^μ2=1Nn=1N(xnμ)2

Dari bukti di atas, mari kita ambil dari mengganti dengan nilai sebenarnya .ˉ x μE[xn2]E[x¯2]x¯μ

E[xn2]E[μ2]=E[xn2]μ2=σx2+E[xn]2μ2=σx2

yang tidak bias!

TrynnaDoStat
sumber
3
+1 Mungkin perlu dicatat bahwa demonstrasi Anda tidak mengharuskan memiliki distribusi Gaussian. (Namun, untuk distribusi lain varians sampel mungkin bukan MLE untuk parameter varians.)X
whuber
1
Terima kasih atas penjelasan anda Saya perlu waktu untuk memahaminya. Selain itu, saya menemukan beberapa kesalahan dalam persamaan. Bisakah Anda memverifikasinya? Terima kasih!
ningyuwhut
@ whuber - Tidak yakin mengapa Anda mengatakan "..demonstration tidak mengharuskan memiliki distribusi Gaussian.". Kami tidak akan berbicara tentang solusi varian ML untuk setiap distribusi, katakanlah distribusi binomial. Jadi secara implisit kami mengasumsikan distribusi X memiliki varian sebagai salah satu parameter. X
KGhatak