Saya seorang ahli matematika yang mempelajari statistik dan berjuang terutama dengan bahasa.
Dalam buku yang saya gunakan, ada masalah berikut:
Variabel acak diberikan sebagai -distribusi dengan . (Tentu saja, Anda dapat mengambil distribusi apa pun tergantung pada satu parameter untuk kepentingan pertanyaan ini.) Kemudian sampel lima nilai 14 , 21 , 6 , 32 , 2 diberikan.
Bagian pertama: "Menggunakan metode kemungkinan maksimum, temukan perkiraan dari berdasarkan [sampel]." Ini tidak masalah. Jawabannya adalah .
Tapi kemudian: "Berikan perkiraan kesalahan standar ."
Apa yang dimaksud dengan ini? Karena hanyalah bilangan real yang tetap, saya tidak melihat dengan cara apa ia bisa memiliki kesalahan standar. Apakah saya harus menentukan standar deviasi dari ?
Jika Anda pikir pertanyaannya tidak jelas, informasi ini akan membantu saya juga.
sumber
Jawaban:
Jawaban lain telah mencakup derivasi dari kesalahan standar, saya hanya ingin membantu Anda dengan notasi:
Kebingungan Anda disebabkan oleh fakta bahwa dalam Statistik kami menggunakan simbol yang sama persis untuk menunjukkan Estimator (yang merupakan fungsi), dan estimasi spesifik (yang merupakan nilai yang diambil oleh estimator ketika menerima sebagai input sampel realisasi tertentu).
Jadi dan untuk . Jadi adalah fungsi dari variabel acak dan variabel acak itu sendiri, yang tentunya memiliki varian.α^=h(X) α^(X=x)=4.6931 x={14,21,6,32,2} α^(X)
Dalam estimasi ML, dalam banyak kasus yang dapat kita hitung adalah kesalahan standar asimptotik , karena distribusi sampel terbatas dari estimator tidak diketahui (tidak dapat diturunkan).
Sebenarnya, tidak memiliki distribusi asimptotik, karena konvergen ke bilangan real (angka sebenarnya dalam hampir semua kasus estimasi ML). Tetapi kuantitas konvergen ke variabel acak normal (dengan penerapan Central Limit Theorem).α^ n−−√(α^−α)
Poin kedua dari kebingungan notasi : sebagian besar, jika tidak semua teks, akan menulis ("Avar" = varians asimptotik ") sedangkan artinya adalah , yaitu mereka merujuk ke varian asimtotik dari kuantitas , bukan dari ... Untuk kasus Pareto dasar distribusi yang kami milikiAvar(α^) Avar(n−−√(α^−α)) n−−√(α^−α) α^
jadi
(tetapi yang akan Anda temukan tertulis adalah )Avar(α^)=α2
Sekarang, dalam arti apa Pengukur memiliki "varian asimtotik", karena seperti yang dikatakan, asimtotik konvergen ke konstanta? Nah, dalam perkiraan dan untuk sampel besar tapi terbatas . Yaitu di suatu tempat di antara sampel "kecil", di mana Pengukur adalah variabel acak dengan (biasanya) distribusi yang tidak diketahui, dan sampel "tak terbatas", di mana penaksirnya konstan, ada "wilayah sampel besar tapi terbatas" di mana Estimator belum menjadi konstanta dan di mana distribusi dan variansnya diturunkan secara bundaran, dengan terlebih dahulu menggunakan Teorema Limit Sentral untuk memperoleh distribusi asimtotik yang tepat dari kuantitasα^ Z=n−−√(α^−α) (yang normal karena CLT), dan kemudian membalikkan keadaan dan menulis (sambil mengambil satu langkah mundur dan memperlakukan sebagai terbatas) yang menunjukkan sebagai fungsi affine dari variabel acak normal , dan biasanya terdistribusi sendiri (selalu kurang-lebih).α^=1n√Z+α n α^ Z
sumber
Di mana adalah parameter dan adalah fungsi log-likelihood dari bersyarat pada sampel acak . Secara intuitif, informasi Fisher menunjukkan kecuraman kelengkungan permukaan log-kemungkinan di sekitar MLE, dan juga jumlah 'informasi' yang Anda tentang .θ L(θ|Y=y) θ y y θ
Untuk distribusi dengan realisasi tunggal , log-kemungkinan di mana diketahui:Pareto(α,y0) Y=y y0
sumber