Kesamaannya lebih dari dangkal.
"Tradeoff varians-bias" dapat diartikan sebagai Teorema Pythagoras yang diterapkan pada dua vektor Euclidean tegak lurus: panjang satu adalah standar deviasi dan panjang yang lain adalah bias. Panjang sisi miring adalah akar kuadrat kesalahan.
Hubungan yang mendasar
Sebagai titik tolak, pertimbangkan perhitungan yang mengungkapkan ini, valid untuk variabel acak dengan momen kedua terbatas dan bilangan real apa pun . Karena momen kedua adalah terbatas, memiliki mean hingga yang , dari manaa X μ = E ( X ) E ( X - μ ) = 0XSebuahXμ = E ( X)E (X- μ ) = 0
E ((X- a )2)= E ( ( X- μ+μ - a )2)= E ( ( X- μ )2) + 2 E ( X- μ ) ( μ - a ) + ( μ - a )2= Var( X)+(μ−a)2.(1)
Menunjukkan ini bagaimana deviasi mean kuadrat antara dan setiap nilai "dasar" bervariasi dengan : itu adalah fungsi kuadrat dari dengan minimal di , di mana rata-rata deviasi kuadrat adalah varian .sebuah sebuah sebuah μ XXaaaμX
Koneksi dengan estimator dan bias
Setiap estimator adalah variabel acak karena (menurut definisi) ini adalah fungsi (terukur) variabel acak. Membiarkannya memainkan peran dalam sebelumnya, dan membiarkan estimand (hal seharusnya perkiraan) menjadi , kita memiliki X θ θθ^Xθ^θ
MSE( θ^) = E ( ( θ^- θ )2) = Var( θ^) + ( E ( θ^) - θ )2.
Mari kita kembali ke sekarang kita telah melihat bagaimana pernyataan tentang bias + varians untuk estimator secara harfiah adalah kasus . Pertanyaannya mencari "analogi matematika dengan objek matematika." Kita dapat melakukan lebih dari itu dengan menunjukkan bahwa variabel acak kuadrat-integrasi dapat secara alami dibuat menjadi ruang Euclidean.( 1 )( 1 )( 1 )
Latar belakang matematika
Dalam arti yang sangat umum, variabel acak adalah fungsi bernilai nyata (terukur) pada ruang probabilitas . Himpunan fungsi-fungsi seperti itu yang integrable persegi, yang sering ditulis (dengan struktur probabilitas yang diberikan dipahami), hampir merupakan ruang Hilbert. Untuk membuatnya menjadi satu, kita harus conflate dua variabel acak dan yang tidak benar-benar berbeda dalam hal integrasi: yaitu, kita katakan dan yang setara kapanpunL 2 ( Ω ) X Y X Y( Ω , S , P )L.2( Ω )XYXY
E ( | X- Y|2) = ∫Ω| X( ω ) - Y( ω ) |2dP (ω)=0.
Ini mudah untuk memeriksa bahwa ini adalah relasi ekivalen benar: yang paling penting, ketika setara dengan dan setara dengan , maka tentu akan setara dengan . Karena itu kami dapat mempartisi semua variabel acak kuadrat-integrable ke dalam kelas kesetaraan. Kelas-kelas ini membentuk set . Selain itu, mewarisi struktur ruang vektor dari didefinisikan oleh penambahan nilai secara pointwise dan multiplikasi skalar pointwise. Pada ruang vektor ini, fungsinyaY Y Z X Z L 2 ( Ω ) L 2 L 2XYYZXZL2(Ω)L2L2
X→(∫Ω|X(ω)|2dP(ω))1/2=E(|X|2)−−−−−−√
adalah norma , sering ditulis . Norma ini membuat menjadi ruang Hilbert. Pikirkan ruang Hilbert sebagai "ruang Euclidean dimensi tak terbatas." Setiap subruang dimensi hingga mewarisi norma dari dan , dengan norma ini, adalah ruang Euclidean: kita dapat melakukan geometri Euclidean di dalamnya.L 2 ( Ω ) H V ⊂ H H V||X||2L2(Ω)HV⊂HHV
Akhirnya, kita memerlukan satu fakta yang khusus untuk ruang probabilitas (daripada ruang ukuran umum): karena adalah probabilitas, dibatasi (oleh ), di mana fungsi konstan (untuk setiap bilangan real tetap ) adalah variabel acak persegi yang dapat diintegrasikan dengan norma hingga. 1 ohm → a aP1ω→aa
Penafsiran geometris
Pertimbangkan variabel acak persegi-integrable , dianggap sebagai perwakilan dari kelas ekivalennya dalam . Ini memiliki mean yang (sebagai salah satu dapat memeriksa) hanya bergantung pada kelas kesetaraan . Misalkan menjadi kelas dari variabel acak konstan.L 2 ( Ω ) μ = E ( X ) X 1 : ω → 1XL2(Ω)μ=E(X)X1:ω→1
1 V ⊂ L 2 ( Ω ) 2 | | X | | 2 2 = E ( X 2 ) X | | SebuahX dan menghasilkan subruang Euclidean yang dimensinya paling banyak . Dalam subruang ini, adalah panjang kuadrat dari dan adalah panjang kuadrat dari variabel acak konstan . Sangat mendasar bahwa tegak lurus terhadap . (Salah satu definisi dari adalah nomor unik yang menjadi kasusnya.) Hubungan dapat ditulis1V⊂L2(Ω)2||X||22=E(X2)X ω → a X - μ 1 1 μ ( 1 )||a1||22=a2ω→aX−μ11μ(1)
||X−a1||22=||X−μ1||22+||(a−μ)1||22.
Ini memang merupakan tepatnya Teorema Pythagoras, di dasarnya bentuk yang sama diketahui 2500 tahun yang lalu. Objek adalah sisi miring dari segitiga siku-siku dengan kaki dan . X - μ 1 ( a - μ ) 1
X−a1=(X−μ1)−(a−μ)1
X−μ1(a−μ)1
Jika Anda ingin analogi matematika, maka, Anda dapat menggunakan apa pun yang dapat diekspresikan dalam kaitannya dengan sisi miring dari segitiga siku-siku dalam ruang Euclidean. Hypotenuse akan mewakili "kesalahan" dan kaki akan mewakili bias dan penyimpangan dari rata-rata.
Ini adalah cara untuk berpikir secara visual tentang keakuratan dan bias varians trade off. Misalkan Anda sedang melihat target dan Anda membuat banyak tembakan yang semuanya tersebar dekat dengan pusat target sedemikian rupa sehingga tidak ada bias. Kemudian akurasi hanya ditentukan oleh varians dan ketika varians kecil penembak akurat.
Sekarang mari kita perhatikan kasus di mana ada presisi besar tetapi bias besar. Dalam hal ini tembakan tersebar di sekitar titik yang jauh dari pusat. Sesuatu mengacaukan aimpoint tetapi di sekitar titik tujuan ini setiap tembakan dekat dengan titik tujuan baru. Penembaknya tepat tetapi sangat tidak akurat karena biasnya.
Ada situasi lain di mana tembakan akurat karena bias kecil dan presisi tinggi. Yang kita inginkan adalah tidak ada bias dan varians kecil atau varians kecil dengan bias kecil. Dalam beberapa masalah statistik Anda tidak dapat memiliki keduanya. Jadi MSE menjadi ukuran akurasi yang ingin Anda gunakan yang memainkan varians bias trade off dan meminimalkan MSE harus menjadi tujuannya.
sumber