- Apa yang dimaksud dengan properti oracle dari estimator?
- Apa tujuan pemodelan yang relevan dengan properti oracle (prediktif, jelas, ...)?
Baik penjelasan teoritis yang ketat dan (terutama) intuitif dipersilakan.
feature-selection
model-selection
estimators
oracle
Richard Hardy
sumber
sumber
Jawaban:
Seorang oracle tahu yang sebenarnya: ia tahu bagian yang sebenarnya dan bersedia untuk menindaklanjutinya. Properti oracle adalah bahwa distribusi asimtotik penduga sama dengan distribusi asimptotik MLE hanya pada dukungan yang sebenarnya. Artinya, estimator beradaptasi untuk mengetahui dukungan yang sebenarnya tanpa membayar harga (dalam hal distribusi asimptotik.)
Dengan sifat-sifat optimalitas asimptotik dari MLE yang dibahas, misalnya, statistik teoritis Keener dalam teorema 9.14, kita tahu, di bawah beberapa kondisi teknis yang berlaku ketika, misalnya, kesalahannya adalah Gaussian, yang mana kita mengasumsikan bahwa adalah koefisien sebenarnya pada yang benar dukungan . Perhatikan bahwa varian distribusi asimptotik adalah kebalikan dari informasi Fisher, menunjukkan bahwa efisien asimptotik. Karena MLE mengetahui dukungan yang sebenarnya mencapai ini, itu juga diperlukan sebagai bagian dari properti oracle.
Namun, kami membayar harga non-simtotik yang curam: lihat, misalnya,
yang menunjukkan bahwa risiko "penduga oracle" (dalam pengertian Fan dan Li, 2001) memiliki supremum yang menyimpang hingga tak terbatas.
sumber
Definisi properti Oracle sangat terkait dengan konteksnya. Jawaban yang sangat singkat namun tepat dalam regresi linier (tepatnya dimensi tinggi) adalah ini:
estimator oracle harus konsisten dalam estimasi parameter dan pemilihan variabel.
Perhatikan bahwa estimator yang konsisten dalam pemilihan variabel tidak selalu konsisten dalam estimasi parameter. Lihat kertas laso adaptif untuk definisi matematika atau cukup lihat slide ini .
sumber