Apa yang dimaksud dengan kesalahan standar dari estimasi kemungkinan maksimum?

21

Saya seorang ahli matematika yang mempelajari statistik dan berjuang terutama dengan bahasa.

Dalam buku yang saya gunakan, ada masalah berikut:

Variabel acak diberikan sebagai -distribusi dengan . (Tentu saja, Anda dapat mengambil distribusi apa pun tergantung pada satu parameter untuk kepentingan pertanyaan ini.) Kemudian sampel lima nilai 14 , 21 , 6 , 32 , 2 diberikan.XPareto(α,60)α>014216322

Bagian pertama: "Menggunakan metode kemungkinan maksimum, temukan perkiraan α^ dari α berdasarkan [sampel]." Ini tidak masalah. Jawabannya adalah α^4.6931 .

Tapi kemudian: "Berikan perkiraan kesalahan standar α^ ."

Apa yang dimaksud dengan ini? Karena α^ hanyalah bilangan real yang tetap, saya tidak melihat dengan cara apa ia bisa memiliki kesalahan standar. Apakah saya harus menentukan standar deviasi dari Pareto(α^,60) ?

Jika Anda pikir pertanyaannya tidak jelas, informasi ini akan membantu saya juga.

Stefan
sumber
Apa 60 singkatan?
Alecos Papadopoulos
Apakah Anda memiliki formula untuk α^ ? Itu akan membantu Anda memperkirakan kesalahan standarnya.
soakley
1
@ Glen_b Tetapi jika itu adalah batas bawah bagaimana mungkin semua nilai sampel yang disadari lebih kecil?
Alecos Papadopoulos
1
@Alecos Itu poin yang bagus. Komentar saya tidak masuk akal; Saya menghapusnya.
Glen_b -Reinstate Monica
1
@Alecos: adalah distribusi dengan densitas . Pareto(α,λ)f(x)=αλα(λ+x)α+1
Stefan

Jawaban:

17

Jawaban lain telah mencakup derivasi dari kesalahan standar, saya hanya ingin membantu Anda dengan notasi:

Kebingungan Anda disebabkan oleh fakta bahwa dalam Statistik kami menggunakan simbol yang sama persis untuk menunjukkan Estimator (yang merupakan fungsi), dan estimasi spesifik (yang merupakan nilai yang diambil oleh estimator ketika menerima sebagai input sampel realisasi tertentu).

Jadi dan untuk . Jadi adalah fungsi dari variabel acak dan variabel acak itu sendiri, yang tentunya memiliki varian. α^=h(X)α^(X=x)=4.6931x={14,21,6,32,2}α^(X)

Dalam estimasi ML, dalam banyak kasus yang dapat kita hitung adalah kesalahan standar asimptotik , karena distribusi sampel terbatas dari estimator tidak diketahui (tidak dapat diturunkan).

Sebenarnya, tidak memiliki distribusi asimptotik, karena konvergen ke bilangan real (angka sebenarnya dalam hampir semua kasus estimasi ML). Tetapi kuantitas konvergen ke variabel acak normal (dengan penerapan Central Limit Theorem).α^n(α^α)

Poin kedua dari kebingungan notasi : sebagian besar, jika tidak semua teks, akan menulis ("Avar" = varians asimptotik ") sedangkan artinya adalah , yaitu mereka merujuk ke varian asimtotik dari kuantitas , bukan dari ... Untuk kasus Pareto dasar distribusi yang kami milikiAvar(α^)Avar(n(α^α))n(α^α)α^

Avar[n(α^α)]=α2

jadi

Avar(α^)=α2/n

(tetapi yang akan Anda temukan tertulis adalah ) Avar(α^)=α2

Sekarang, dalam arti apa Pengukur memiliki "varian asimtotik", karena seperti yang dikatakan, asimtotik konvergen ke konstanta? Nah, dalam perkiraan dan untuk sampel besar tapi terbatas . Yaitu di suatu tempat di antara sampel "kecil", di mana Pengukur adalah variabel acak dengan (biasanya) distribusi yang tidak diketahui, dan sampel "tak terbatas", di mana penaksirnya konstan, ada "wilayah sampel besar tapi terbatas" di mana Estimator belum menjadi konstanta dan di mana distribusi dan variansnya diturunkan secara bundaran, dengan terlebih dahulu menggunakan Teorema Limit Sentral untuk memperoleh distribusi asimtotik yang tepat dari kuantitasα^Z=n(α^α)(yang normal karena CLT), dan kemudian membalikkan keadaan dan menulis (sambil mengambil satu langkah mundur dan memperlakukan sebagai terbatas) yang menunjukkan sebagai fungsi affine dari variabel acak normal , dan biasanya terdistribusi sendiri (selalu kurang-lebih).α^=1nZ+αnα^Z

Alecos Papadopoulos
sumber
+1 untuk membedakan antara dan - tentu saja notasinya dapat tidak konsisten. α^n(α^α)
Nate Pope
21

α^ - penaksir kemungkinan maksimum - adalah fungsi dari sampel acak, dan juga acak (tidak tetap). Perkiraan kesalahan standar dapat diperoleh dari informasi Fisher,α^

I(θ)=E[2L(θ|Y=y)θ2|θ]

Di mana adalah parameter dan adalah fungsi log-likelihood dari bersyarat pada sampel acak . Secara intuitif, informasi Fisher menunjukkan kecuraman kelengkungan permukaan log-kemungkinan di sekitar MLE, dan juga jumlah 'informasi' yang Anda tentang .θL(θ|Y=y)θyyθ

Untuk distribusi dengan realisasi tunggal , log-kemungkinan di mana diketahui:Pareto(α,y0)Y=yy0

L(α|y,y0)=logα+αlogy0(α+1)logyL(α|y,y0)=1α+logy0logyL(α|y,y0)=1α2
Memasukkan ke definisi informasi Fisher, Untuk sampel Estimasi kemungkinan maksimum didistribusikan secara asimptotik sebagai: Di mana adalah ukuran sampel. Karena tidak diketahui, kita bisa pasang
I(α)=1α2
{y1,y2,...,yn}α^
α^nN(α,1nI(α))=N(α,α2n), 
nαα^ untuk mendapatkan perkiraan kesalahan standar:
SE(α^)α^2/n4.69312/52.1
Nate Pope
sumber
1
Untuk baris kedua hingga terakhir Anda, , tidak muncul notasi yang benar. Jika , maka tidak dapat muncul di sisi kanan. Alih-alih, Anda inginα^nN(α,1nI(α))nnα^˙N(α,1nI(α))
user321627