Saya membaca PRML dan saya tidak mengerti gambarnya. Bisakah Anda memberikan beberapa petunjuk untuk memahami gambar dan mengapa MLE varians dalam distribusi Gaussian bias?
rumus 1.55: rumus 1.56 σ 2 M L E =1
machine-learning
self-study
maximum-likelihood
ningyuwhut
sumber
sumber
Jawaban:
Intuisi
Biasnya "berasal dari" (sama sekali bukan istilah teknis) fakta bahwa bias untuk . Pertanyaan alami adalah, "baik, apa intuisi mengapa bias untuk "? Intuisi adalah bahwa dalam mean sampel non-kuadrat, kadang-kadang kita kehilangan nilai sebenarnya dengan menaksir berlebihan dan kadang-kadang dengan taksiran lebih rendah. Tetapi, tanpa kuadratkan, kecenderungan untuk menaksir terlalu tinggi dan kurang menaksir akan membatalkan satu sama lain. Namun, ketika kami menyamakan kecenderungan untuk di bawah perkiraan (kehilangan nilai sebenarnya dariμ 2 E [ ˉ x 2 ] μ 2 μ ˉ x μE[x¯2] μ2 E[x¯2] μ2 μ x¯ μ dengan angka negatif) juga akan kuadrat dan dengan demikian menjadi positif. Dengan demikian, tidak lagi dibatalkan dan ada sedikit kecenderungan untuk memperkirakan terlalu tinggi.
Jika intuisi di balik mengapa bias untuk masih belum jelas, cobalah untuk memahami intuisi di balik ketidaksetaraan Jensen (penjelasan intuitif yang baik di sini ) dan menerapkannya pada .μ 2 E [ x 2 ]x2 μ2 E[x2]
Mari kita buktikan bahwa MLE varians untuk sampel iid bias. Kemudian kami akan secara analitis memverifikasi intuisi kami.
Bukti
Biarkan .σ^2=1N∑Nn=1(xn−x¯)2
Kami ingin menunjukkan .E[σ^2]≠σ2
Menggunakan fakta bahwa dan ,∑Nn=1xn=Nx¯ ∑Nn=1x¯2=Nx¯2
Dengan langkah terakhir mengikuti sejak karena sama di karena berasal dari distribusi yang sama.E[x2n] n
Sekarang, ingat definisi varian yang mengatakan . Dari sini, kita mendapatkan yang berikut iniσ2x=E[x2]−E[x]2
Perhatikan bahwa kami telah dengan tepat menguadratkan konstanta ketika mengeluarkannya dari . Berikan perhatian khusus untuk itu!1N Var()
yang tentu saja tidak sama dengan .σ2x
Verifikasi Secara Analitik Intuisi kita
Kita dapat memverifikasi intuisi dengan mengasumsikan kita tahu nilai dan menghubungkannya dengan bukti di atas. Karena kita sekarang tahu , kita tidak perlu lagi memperkirakan dan karenanya kita tidak pernah memperkirakannya dengan . Mari kita lihat bahwa ini "menghapus" bias di .μ μ μ2 E[x¯2] σ^2
Biarkan .σ^2μ=1N∑Nn=1(xn−μ)2
Dari bukti di atas, mari kita ambil dari mengganti dengan nilai sebenarnya .ˉ x μE[x2n]−E[x¯2] x¯ μ
yang tidak bias!
sumber