Untuk variabel acak tertentu (atau populasi, atau proses stokastik), ekspektasi matematis adalah jawaban atas pertanyaan. Perkiraan titik apa yang meminimalkan kerugian kuadrat yang diharapkan? . Selain itu, ini adalah solusi optimal untuk game. Tebak realisasi berikutnya dari variabel acak (atau undian baru dari populasi), dan saya akan menghukum Anda dengan jarak kuadrat antara nilai dan tebakan Anda jika Anda memiliki disutilitas linear dalam hal hukuman. Median adalah jawaban untuk pertanyaan terkait di bawah kerugian absolut dan mode adalah jawaban di bawah kehilangan "semua atau tidak sama sekali".
Pertanyaan: Apakah varian dan standar deviasi menjawab pertanyaan serupa? Apakah mereka?
Motivasi untuk pertanyaan ini berasal dari pengajaran langkah-langkah dasar kecenderungan dan penyebaran pusat. Sementara ukuran-ukuran kecenderungan sentral dapat dimotivasi oleh masalah-masalah teoretis keputusan di atas, saya bertanya-tanya bagaimana seseorang dapat memotivasi ukuran-ukuran penyebaran.
sumber
Jawaban:
Jika saya telah memahami pertanyaan sebagaimana dimaksud, Anda harus mempertimbangkan pengaturan di mana Anda dapat memperoleh realisasi independen dari setiap variabel acak dengan sembarang distribusi (memiliki varian hingga ). "Game" ditentukan oleh fungsi dan untuk dijelaskan. Ini terdiri dari langkah-langkah dan aturan berikut:X F σ2(F) h L
Lawan Anda ("Alam") mengungkapkanF.
Sebagai tanggapan, Anda menghasilkan angka "prediksi" Anda.t(F),
Untuk mengevaluasi hasil permainan, perhitungan berikut dilakukan:
Sebuah sampel dari pengamatan iid diambil darin X=X1,X2,…,Xn F.
Fungsi telah ditentukan diterapkan pada sampel, menghasilkan angka "statistik."h h(X),
"Fungsi kerugian" membandingkan "prediksi" dengan statistik menghasilkan angka non-negatifL t(F) h(X), L(t(F),h(X)).
Hasil dari permainan adalah kerugian yang diharapkan (atau "risiko")R(L,h)(t,F)=E(L(t(F),h(X))).
Tujuan Anda adalah merespons gerakan Nature dengan menentukan beberapa yang meminimalkan risiko.t
Misalnya, dalam permainan dengan fungsi dan hilangnya bentuk untuk beberapa angka positif langkah optimal Anda adalah untuk memilih sebagai harapanh(X1)=X1 L(t,h)=λ(t−h)2 λ, t(F) F.
Pertanyaan di depan kita adalah,
Ini siap dijawab dengan menunjukkan varians sebagai harapan. Salah satu caranya adalah dengan menetapkan bahwa dan terus menggunakan kerugian kuadratik Setelah mengamati ituh(X1,X2)=12(X1−X2)2 L(t,h)=(t−h)2.
Misalnya memungkinkan kita untuk menyimpulkan bahwa ini dan ini menjawab pertanyaan tentang varians.h L
Bagaimana dengan standar deviasi ? Sekali lagi, kita hanya perlu menunjukkan ini sebagai harapan dari statistik sampel. Namun, itu tidak mungkin, karena bahkan ketika kita membatasi untuk keluarga distribusi Bernoulli kita hanya dapat memperoleh estimator yang tidak bias dari fungsi polinom tetapi bukan fungsi polinomial pada domain (Lihat Untuk distribusi binomial, mengapa tidak ada penaksir yang tidak bias untuk ? Untuk argumen umum tentang distribusi Binomial, di mana pertanyaan ini dapat dikurangi setelah rata-rataσ(F) F (p) p, σ(F)=p(1−p)−−−−−−−√ p∈(0,1). 11/p h atas semua permutasi)Xi.
sumber