Premis: ini mungkin pertanyaan bodoh. Saya hanya tahu pernyataan tentang sifat asimptotik MLE, tetapi saya tidak pernah mempelajari buktinya. Jika saya melakukannya, mungkin saya tidak akan menanyakan pertanyaan-pertanyaan ini, atau saya mungkin saya akan menyadari pertanyaan-pertanyaan ini tidak masuk akal ... jadi tolong mudahkan saya :)
Saya sering melihat pernyataan yang mengatakan bahwa penduga MLE dari parameter model adalah asimtotik normal dan efisien. Pernyataan ini biasanya ditulis sebagai
N→∞ sebagai
di mana adalah jumlah sampel, adalah informasi Fisher dan adalah parameter (vektor) nilai sebenarnya . Sekarang, karena ada referensi ke model yang benar, apakah ini berarti bahwa hasilnya tidak akan berlaku jika model tersebut tidak benar?I θ 0
Contoh: misalkan saya memodelkan output daya dari turbin angin sebagai fungsi dari kecepatan angin ditambah aditif Gaussian noiseV
Saya tahu modelnya salah, paling tidak karena dua alasan: 1) benar-benar sebanding dengan kekuatan ketiga dan 2) kesalahannya tidak bersifat aditif, karena saya mengabaikan prediktor lain yang tidak berkorelasi dengan kecepatan angin (saya juga tahu bahwa harus 0 karena pada 0 kecepatan angin tidak ada daya yang dihasilkan, tapi itu tidak relevan di sini). Sekarang, misalkan saya memiliki basis data daya dan kecepatan angin tak terbatas dari turbin angin saya. Saya bisa menggambar sebanyak mungkin sampel yang saya inginkan, dengan ukuran berapa pun. Misalkan saya menggambar 1000 sampel, masing-masing berukuran 100, dan menghitung \ hat {\ boldsymbol {\ beta}} _ {100} , perkiraan MLE dari \ boldsymbol {\ beta} = (\ beta_0, \ beta_1, \ beta_2)V β 0(yang di bawah model saya hanya akan menjadi estimasi OLS). Karena itu saya memiliki 1000 sampel dari distribusi . Saya dapat mengulangi latihan dengan . Sebagai , haruskah distribusi cenderung normal asimptotik, dengan mean dan varians yang dinyatakan? Atau apakah fakta bahwa model yang salah membuat hasil ini salah?
Alasan saya bertanya adalah bahwa jarang (jika pernah) model "benar" dalam aplikasi. Jika sifat asimptotik MLE hilang ketika model tidak benar, maka mungkin masuk akal untuk menggunakan prinsip estimasi yang berbeda, yang walaupun kurang kuat dalam pengaturan di mana model itu benar, dapat berkinerja lebih baik daripada MLE dalam kasus lain.
EDIT : tercatat dalam komentar bahwa gagasan tentang model yang benar dapat menjadi masalah. Saya memiliki definisi berikut dalam pikiran: diberikan keluarga model ditunjukkan oleh vektor parameter , untuk setiap model dalam keluarga Anda selalu dapat menulis
dengan hanya mendefinisikan sebagai . Namun, secara umum kesalahan tidak akan ortogonal ke , memiliki rata-rata 0, dan itu tidak serta merta memiliki distribusi diasumsikan dalam derivasi model. Jika ada nilai sedemikian rupa sehingga memiliki dua properti ini, serta distribusi yang diasumsikan, saya akan mengatakan model itu benar. Saya pikir ini berkaitan langsung dengan mengatakan bahwa , karena istilah kesalahan dalam dekomposisi
memiliki dua properti yang disebutkan di atas.
sumber
Jawaban:
Saya tidak percaya ada satu jawaban untuk pertanyaan ini.
Ketika kami mempertimbangkan kemungkinan kesalahan spesifikasi distribusi sambil menerapkan estimasi kemungkinan maksimum, kami mendapatkan apa yang disebut penaksir "Kuasi-Maksimum Kemungkinan" (QMLE). Dalam kasus-kasus tertentu QMLE konsisten dan asimptotik normal.
Yang hilang dengan pasti adalah efisiensi asimptotik. Ini karena varians asimptotik dari (ini adalah jumlah yang memiliki distribusi asimptotik, bukan hanya ), dalam semua kasus,n−−√(θ^−θ) θ^
di mana adalah matriks Hessian dari log-kemungkinan dan adalah gradien, dan topi menunjukkan perkiraan sampel.H S
Sekarang, jika kita memiliki spesifikasi yang benar , kita dapatkan, pertama, itu
di mana " " subskrip menunjukkan evaluasi pada parameter sebenarnya (dan perhatikan bahwa istilah tengah adalah definisi Informasi Fisher), dan kedua, bahwa " kesetaraan matriks informasi " berlaku dan menyatakan bahwa , yang berarti bahwa varian asimtotik akhirnya akan menjadi0 −E[H0]=E[S0ST0]
yang merupakan kebalikan dari informasi Fisher.
Tetapi jika kita memiliki kesalahan spesifikasi, ekspresi tidak mengarah pada ekspresi (karena turunan pertama dan kedua dalam diturunkan berdasarkan kemungkinan yang salah). Ini pada gilirannya menyiratkan bahwa ketidaksetaraan matriks informasi tidak berlaku, bahwa kita tidak berakhir dengan ekspresi , dan bahwa (Q) MLE tidak mencapai efisiensi asimptotik penuh.(1) (2) (1) (3)
sumber