Inferensi dalam model linier dengan heteroskedastisitas bersyarat

9

Misalkan saya mengamati vektor variabel independen dan dan variabel dependen . Saya ingin mencocokkan model formulir: mana adalah beberapa fungsi bernilai positif yang dapat dua kali, adalah parameter penskalaan yang tidak diketahui, dan adalah variabel rata-rata, varians unit Gaussian variabel acak (diasumsikan independen dari dan ). Ini pada dasarnya adalah pengaturan uji Koenker tentang heteroskedastisitas (setidaknya sejauh yang saya mengerti).z yy=xβ 1 +σg(zβ 2 )ϵ,gσϵx z xzy

y=xβ1+σg(zβ2)ϵ,
gσϵxz

Saya memiliki pengamatan dan , dan saya ingin memperkirakan dan . Saya punya beberapa masalah:x , z y β 1β 2nx,zyβ1β2

  1. Saya tidak yakin bagaimana mengajukan masalah estimasi sebagai sesuatu seperti kuadrat terkecil (saya berasumsi ada trik terkenal). Tebakan pertama saya adalah kira-kira seperti tapi saya Saya tidak yakin bagaimana menyelesaikannya secara numerik (mungkin metode kuasi-Newton berulang mungkin dilakukan).
    minβ1,β2(i=1n(yixiβ1)2g(ziβ2)2)(i=1n1g(ziβ2)2)1,
  2. Dengan asumsi saya dapat mengajukan masalah dengan cara yang waras dan menemukan beberapa perkiraan , saya ingin mengetahui distribusi perkiraan sehingga misalnya saya dapat melakukan tes hipotesis. Saya akan baik-baik saja dengan menguji dua koefisien koefisien secara terpisah, tetapi akan lebih memilih beberapa cara untuk menguji, misalnya H_0: \ vec {w_1} ^ {\ top} \ vec {\ beta_1} + \ vec {w_2} ^ {\ top} \ vec {\ beta_2} \ le c untuk diberikan \ vec {w_1}, \ vec {w_2}, c .β^1,β^2 H0:w1β1+w2β2cw1,w2,c
shabbychef
sumber
Pertanyaan bagus. Apakah Anda memiliki gambaran seperti apa ? apakah itu mulus telah melompat? Alih-alih paling tidak kuadratkah Anda mencoba kemungkinan maksimum (Anda tahu makalah ini projecteuclid.org/... ?)g
robin girard
@robin girard: MLE adalah ide yang bagus untuk pertanyaan 1. Saya menduga bahwa untuk kesalahan Gaussian, MLE akan memberikan perkiraan yang identik dengan minimalisasi ad hoc saya . Adapun , seperti yang saya catat, kita dapat menganggap itu bernilai positif dan dua kali dapat dibedakan. Kita mungkin dapat menganggap itu cembung juga, dan mungkin kita dapat menganggapnya analitik. g
shabbychef

Jawaban:

5

Dalam konteks yang sedikit lebih umum dengan sebuah dimensi vektor pengamatan (tanggapan, atau variabel dependen), dan matriks pengamatan (kovariat, atau variabel dependen) dan parameter sedemikian sehingga maka kemungkinan minus-log-kemungkinan adalah Dalam pertanyaan OP, adalah diagonal dengan YnyXn×pxθ=(β1,β2,σ)YN(Xβ1,Σ(β2,σ))

l(β1,β2,σ)=12(YXβ1)TΣ(β2,σ)1(YXβ1)+12log|Σ(β2,σ)|
Σ(β2,σ)
Σ(β2,σ)ii=σ2g(ziTβ2)2
sehingga penentu menjadi dan kemungkinan dikurangi-log-kemungkinan menjadi Ada beberapa cara untuk mendekati minimalisasi fungsi ini (dengan asumsi tiga parameter adalah variasi independen).σ2ni=1ng(ziTβ2)2
12σ2i=1n(yixiTβ1)2g(ziTβ2)2+nlogσ+i=1nlogg(ziTβ2)
  • Anda dapat mencoba meminimalkan fungsi dengan algoritma pengoptimalan standar mengingat batasan yang .σ>0
  • Anda dapat menghitung profil dikurangi log-kemungkinan dengan meminimalkan untuk diperbaiki , dan kemudian tancapkan fungsi yang dihasilkan ke dalam algoritma optimasi standar yang tidak dibatasi.(β1,β2)σ(β1,β2)
  • Anda dapat bergantian antara mengoptimalkan masing-masing dari tiga parameter secara terpisah. Mengoptimalkan lebih dari dapat dilakukan secara analitis, mengoptimalkan lebih dari adalah masalah regresi kuadrat terkecil, dan mengoptimalkan lebih dari setara dengan menyesuaikan model linier umum gamma dengan tautan terbalik.β 1 β 2 g 2σβ1β2g2

Saran terakhir menarik bagi saya karena itu dibangun di atas solusi yang sudah saya ketahui dengan baik. Selain itu, iterasi pertama adalah sesuatu yang saya akan pertimbangkan untuk dilakukan. Yaitu, pertama hitung estimasi awal dengan kuadrat terkecil biasa yang mengabaikan potensi heteroskedastisitas, lalu paskan gamma glm ke residu kuadrat untuk mendapatkan perkiraan awal hanya untuk memeriksa apakah model yang lebih rumit tampaknya bermanfaat. Iterasi menggabungkan heteroskedastisitas ke dalam solusi kuadrat terkecil karena bobot kemudian dapat meningkat pada estimasi.β 2 -β1β2

Mengenai bagian kedua dari pertanyaan, saya mungkin akan mempertimbangkan menghitung interval kepercayaan untuk kombinasi linear baik dengan menggunakan asimptotik MLE standar (memeriksa dengan simulasi bahwa asimptotik bekerja) atau dengan bootstrap.w1Tβ1+w2Tβ2

Sunting: Dengan asimptotik MLE standar yang saya maksud menggunakan perkiraan normal multivariat untuk distribusi MLE dengan matriks kovarians informasi invers Fisher. Informasi Fisher adalah definisi matriks kovarians dari gradien . Secara umum tergantung pada parameter. Jika Anda dapat menemukan ekspresi analitik untuk jumlah ini, Anda dapat mencoba mencolokkan MLE. Sebagai alternatif, Anda dapat memperkirakan informasi Fisher dengan informasi Fisher yang diamati , yang merupakan Hessian dari di MLE. Parameter yang Anda minati adalah kombinasi linear dari parameter dalam dual β ( y i , x i , z i )llβ-vektor, maka dari normal multivariat aproksimasi dari MLE Anda dapat menemukan perkiraan normal dari penduga penduga seperti yang dijelaskan di sini . Ini memberi Anda perkiraan kesalahan standar dan Anda dapat menghitung interval kepercayaan. Ini dijelaskan dengan baik di banyak buku statistik (matematis), tetapi presentasi yang cukup mudah diakses yang bisa saya rekomendasikan adalah Dalam Semua Kemungkinan oleh Yudi Pawitan. Bagaimanapun, derivasi formal dari teori asimptotik cukup rumit dan bergantung pada sejumlah kondisi keteraturan, dan itu hanya memberikan asimptotik yang validdistribusi. Oleh karena itu, jika ragu saya akan selalu melakukan beberapa simulasi dengan model baru untuk memeriksa apakah saya dapat mempercayai hasil untuk parameter realistis dan ukuran sampel. Bootstrap sederhana dan non-parametrik tempat Anda mencicipi tiga kali lipat dari kumpulan data yang diamati dengan penggantian dapat menjadi alternatif yang bermanfaat jika prosedur pemasangan tidak terlalu memakan waktu.(yi,xi,zi)

NRH
sumber
apa yang yang asymptotics MLE standar?
shabbychef
@ shabbychef, sudah terlambat. Saya sudah memberikan penjelasan yang lebih detail. Perhatikan bahwa agar asimptotik berfungsi dalam teori sebagaimana dijelaskan, model harus benar dan penduga harus MLE. Hasil yang lebih umum dapat diperoleh dalam kerangka fungsi estimasi umum dan estimasi persamaan, lihat, misalnya, buku Quasi-likelihood dan ... oleh Heyde.
NRH