Apakah OLS Efisien Asimptotik Di Bawah Heteroskedastisitas

9

Saya tahu bahwa OLS tidak bias tetapi tidak efisien di bawah heteroskedastisitas dalam pengaturan regresi linier.

Di Wikipedia

http://en.wikipedia.org/wiki/Minimum_mean_square_error

Estimator MMSE tidak bias asimtotik dan konvergen dalam distribusi ke distribusi normal: , di mana saya (x) adalah informasi Fisher dari x. Dengan demikian, estimator MMSE efisien asimptotik.n(x^x)dN(0,I1(x))

MMSE diklaim efisien asimptotik. Saya agak bingung di sini.

Apakah ini berarti OLS tidak efisien dalam sampel terbatas, tetapi efisien tanpa gejala di bawah heteroskedastisitas?

Kritik dari jawaban saat ini: Sejauh ini jawaban yang diajukan tidak membahas distribusi terbatas.

Terima kasih sebelumnya

Cagdas Ozgenc
sumber
Itu artikel wikipedia yang cukup panjang. Karena, di samping itu, ini dapat berubah, maukah Anda mengutip bagian yang menyebabkan kebingungan?
hejseb
1
Informasi Fisher berasal dari fungsi kemungkinan. Jadi secara implisit menyiratkan bahwa kemungkinan ditentukan dengan benar. yaitu pernyataan yang Anda rujuk berasumsi, jika ada heteroskedastisitas, regresi ditimbang sedemikian rupa sehingga heteroskedastisitas ditentukan dengan benar. Lihat en.wikipedia.org/wiki/Least_squares#Weighted_least_squares . Dalam praktiknya, kita sering tidak tahu bentuk heteroskedastisitas, jadi kita kadang-kadang menerima inefisiensi daripada mengambil kesempatan untuk membiasakan regresi dengan tidak menentukan skema pembobotan.
Zachary Blumenfeld
@ZacharyBlumenfeld Tidak ada asumsi tentang distribusi x dalam artikel. Bagaimana kita bisa mendapatkan informasi Fisher?
Cagdas Ozgenc
1
Lihat en.wikipedia.org/wiki/Fisher_information . Artikel ini menyiratkan distribusi pada dan e ketika dibutuhkan ekspektasi di bagian definisi. Perhatikan bahwa homoseksualitas tidak pernah diasumsikan di sana. Dalam konteks OLS, homoscedacticity diasumsikan eN ( 0 , σ I ) , I matriks identitas. Heteroscedacticity memungkinkan untuk eN ( 0 , D ) , setiap D diagonal positif semi-pasti. Menggunakan D akan menghasilkan informasi Fisher yang berbeda dari yang digunakanxeeN(0,σI)IeN(0,D)DD . σI
Zachary Blumenfeld
di mana saya dapat melihat bukti dari fakta ini bahwa "MMSE menyatu dalam distribusi ke distribusi normal?"
Hajir

Jawaban:

3

E{(x^x)(x^x)T}=σI
In×nσ

E{(x^x)(x^x)T}=D

Dex^eN(0,Σ)E{(x^x)(x^x)T}=Σ

log[L]=log[ϕ(x^x,Σ)]
ϕ

I(x)=E[(xlog[L])2|x]
n(x^x)dN(0,I1(x))

yx

E{y|x}=xβ
log[L]=log[ϕ(yxβ,σI)]
log[L]=i=1nlog[φ(yxβ,σ)]
φ
I(β)=[σ(xx)1]1

β

log[L]=log[ϕ(yxβ,D)]
β 1nI1(β)
Zachary Blumenfeld
sumber
Terima kasih untuk semua waktu yang Anda habiskan. Namun saya berpikir bahwa entri wiki adalah omong kosong total. MMSE tidak akan memberikan efisiensi, dan tidak ditentukan di mana sampel ditimbang dengan tepat. Selain itu bahkan jika kita mengasumsikan bahwa sampel tertimbang, itu masih bukan penaksir yang efisien kecuali distribusinya adalah Gaussian, yang juga tidak ditentukan.
Cagdas Ozgenc
@CagdasOzgenc Saya dengan hormat tidak setuju. Artikel ini diutarakan dengan cara Bayesian umum yang mungkin termasuk regresi, tetapi juga banyak model lainnya (tampaknya lebih ditujukan ke arah filter Kalman). Kemungkinan adalah penduga yang paling efisien ketika diketahui, ini adalah sifat dasar kemungkinan. Apa yang Anda katakan berlaku hanya untuk subset model regresi (meskipun di antara model yang paling banyak diterapkan) di mana normalitas diasumsikan ketika memperoleh kondisi urutan pertama.
Zachary Blumenfeld
1
Anda mengatakannya sendiri. Sayangnya artikel ini bukan tentang penduga kemungkinan. Ini adalah Minimum Mean Square Estimator, yang efisien ketika kondisi tertentu dipenuhi.
Cagdas Ozgenc
Baiklah saya setuju untuk tidak setuju :) Mungkin ada konflik dengan definisi MMSE antara bagaimana itu digunakan dalam regresi paling sering dan bagaimana itu diterapkan di sini dalam pengaturan yang lebih Bayesian. Mungkin mereka harus menciptakan nama baru untuk itu. Namun demikian kemungkinan (atau mungkin estimasi non-parametrik lainnya) tersirat ketika mengambil ekspektasi independen atas setiap residu kuadrat tunggal. terutama dalam pengaturan Bayesian (jika tidak, bagaimana kami memperkirakannya?). Setelah Googling saya menemukan banyak hasil yang mirip dengan yang ada di Wikipedia. Pokoknya saya setuju bahwa terminologi disalahgunakan.
Zachary Blumenfeld
2

Tidak, OLS tidak efisien dalam heteroskedastisitas. Efisiensi penduga diperoleh jika penduga memiliki varians paling kecil di antara penduga lain yang mungkin. Pernyataan tentang efisiensi dalam OLS dibuat terlepas dari membatasi distribusi estimator.

random_guy
sumber