Ada beberapa metode untuk estimasi parameter di luar sana. MLE, UMVUE, MoM, decision-theoretic, dan lain-lain semua sepertinya memiliki kasus yang cukup logis mengapa mereka berguna untuk estimasi parameter. Apakah ada satu metode yang lebih baik daripada yang lain, atau apakah itu hanya masalah bagaimana kita mendefinisikan apa penaksir "pas terbaik" (mirip dengan bagaimana meminimalkan kesalahan ortogonal menghasilkan perkiraan yang berbeda dari pendekatan kuadrat terkecil biasa)?
estimation
mathematical-statistics
maximum-likelihood
method-of-moments
umvue
Christopher Aden
sumber
sumber
Jawaban:
Ada sedikit kebingungan dari dua hal di sini: metode untuk memperoleh estimator, dan kriteria untuk mengevaluasi estimator. Kemungkinan maksimum (ML) dan metode saat (MoM) adalah cara untuk mendapatkan penduga; UMVU dan teori keputusan adalah kriteria untuk mengevaluasi estimator yang berbeda begitu Anda memilikinya, tetapi mereka tidak akan memberi tahu Anda cara menurunkannya.
Dari metode untuk memperoleh estimator, ML biasanya menghasilkan estimator yang lebih efisien (yaitu varians lebih rendah) daripada MoM jika Anda tahu model di mana data Anda berasal ('proses menghasilkan data' (DGP) dalam jargon). Tetapi Kemenaker membuat lebih sedikit asumsi tentang model; seperti namanya, ini hanya menggunakan satu atau lebih momen, biasanya hanya mean atau hanya mean dan varians, sehingga terkadang lebih kuat jika Anda tidak yakin tentang DGP. Mungkin ada lebih dari satu penaksir MoM untuk masalah yang sama, sedangkan jika Anda mengetahui DGP, hanya ada satu penaksir ML.
Dari metode untuk mengevaluasi estimator, decision-theoretic tergantung pada memiliki fungsi kerugian untuk digunakan untuk menilai estimator Anda, meskipun hasilnya bisa cukup kuat untuk berbagai fungsi kerugian yang 'masuk akal'. Penduga UMVU sering tidak ada; dalam banyak kasus ada adalah tidak ada berisi estimator yang selalu memiliki varians minimum. Dan kriteria ketidakberpihakan juga kegunaan dipertanyakan, karena itu tidak berubah untuk transformasi. Misalnya, apakah Anda lebih suka penaksir yang tidak bias dari rasio odds, atau rasio odds log? Keduanya akan berbeda.
sumber
Saya menyarankan bahwa jenis penduga bergantung pada beberapa hal:
Dua poin pertama bersifat spesifik konteks, dan dengan memikirkan aplikasi spesifik Anda, Anda biasanya dapat mendefinisikan properti tertentu yang Anda inginkan untuk dimiliki oleh estimator Anda. Anda kemudian memilih estimator yang sebenarnya dapat Anda hitung, yang memiliki banyak properti yang Anda inginkan.
Saya pikir kurangnya konteks yang dimiliki oleh kursus pengajaran dengan estimasi, berarti bahwa kriteria "default" yang sering digunakan, sama dengan informasi sebelumnya ("default" yang paling jelas adalah Anda mengetahui distribusi sampling dari data Anda). Karena itu, beberapa metode default bagus, terutama jika Anda tidak cukup tahu tentang konteksnya. Tapi jika Anda melakukan tahu konteks, dan Anda memiliki alat untuk menggabungkan konteks itu, maka Anda harus, karena kalau tidak Anda mungkin mendapatkan hasil kontra-intuitif (karena apa yang Anda diabaikan).
Saya bukan penggemar berat MVUE sebagai aturan umum, karena Anda sering harus mengorbankan terlalu banyak varians untuk mendapatkan ketidakberpihakan. Misalnya, bayangkan Anda melemparkan anak panah ke papan permainan, dan Anda ingin memukul mata sapi. Misalkan penyimpangan maksimum dari mata-banteng adalah 6 cm untuk strategi lemparan tertentu, tetapi pusat titik panah adalah 1 cm di atas bullseye. Ini bukan MVUE, karena pusat harus di bullseye. Tetapi anggap bahwa untuk menggeser distribusi turun 1cm (rata-rata), Anda harus meningkatkan jari-jari Anda menjadi setidaknya 10cm (sehingga kesalahan maksimum sekarang 10cm, dan bukan 6cm). Ini adalah hal yang dapat terjadi dengan MVUE, kecuali variansnya sudah kecil. Misalkan saya adalah lemparan yang jauh lebih akurat, dan dapat mempersempit kesalahan saya menjadi 0,1 cm. Sekarang bias benar-benar penting, karena saya tidak akan pernah memukul bullseye!
Singkatnya, bagi saya, bias hanya penting ketika itu kecil dibandingkan dengan varians. Dan Anda biasanya hanya akan mendapatkan varians kecil ketika Anda memiliki sampel besar.
sumber