Identifikasi masalah parameter

8

Saya selalu berjuang untuk mendapatkan esensi identifikasi sejati dalam ekonometrik. Saya tahu bahwa kami menyatakan bahwa parameter (katakanlahθ^) dapat diidentifikasi jika hanya dengan melihat distribusi (bersama) kita dapat menyimpulkan nilai parameter. Dalam kasus sederhanay=b1X+udimana E[u]=0,E[u|x]=0 kita bisa nyatakan itu b1 diidentifikasi jika kita tahu variansnya Var(b^)>0. Tetapi bagaimana jikaE[u|X]=a dimana aitu parameter yang tidak dikenal? Bisaa dan b1 diidentifikasi?

Jika saya memperluas model ke Y=b0+b1X+b2XD=u dimana D{0,1} dan E[u|X,D]=0, untuk menunjukkan itu b1,b2,b3diidentifikasi, apakah saya hanya perlu menyatakan kembali bahwa varians untuk ketiga parameter lebih besar dari nol?

Saya menghargai semua bantuan dalam menjernihkan pikiran saya tentang identifikasi.

CharlesM
sumber
Saya diberitahu bahwa untuk model dengan variabel dummy saya hanya harus menunjukkan itu [XX]1ada ... artinya penentu matriks ini tidak sama dengan 0. Benar?
CharlesM
Saya juga memposting pertanyaan tentang pertukaran matematika dan tidak ada ....
CharlesM
Apakah ini membantu atau hanya lebih dari apa yang sudah Anda ketahui? Catatan kursus UChicago
kirk

Jawaban:

3

Pertama-tama mari kita mendefinisikan objek berikut: Dalam model statistik M yang digunakan untuk memodelkan Y sebagai fungsi dari X, Ada p parameter dilambangkan dengan vektor θ. Parameter ini diperbolehkan bervariasi di dalam ruang parameterΘRp. Kami tidak tertarik pada estimasi semua parameter ini, tetapi hanya sebagian saja, katakan sajaqp dari parameter yang kami tunjukkan θ0 dan itu bervariasi dalam ruang parameter Θ0Rq. Dalam model kamiM variabel X dan parameternya θ sekarang akan dipetakan seperti untuk menjelaskan Y. Pemetaan ini didefinisikan olehM dan parameternya.

Dalam pengaturan ini, pengidentifikasian mengatakan sesuatu tentang Kesetaraan Observasional . Secara khusus, jika parameterθ0 dapat diidentifikasi wrt M maka itu akan menahannya θ1Θ0:θ1θ0,M(θ0)=M(θ1). Dengan kata lain, tidak ada vektor parameter yang berbedaθ1 yang akan menginduksi proses menghasilkan data yang sama, mengingat spesifikasi model kami M. Untuk membuat konsep-konsep ini lebih masuk akal, saya memberikan dua contoh.

Contoh 1 : Tentukan untukθ=(a,b); XN(μ,σ2In);εN(0,σe2In) model statistik sederhana M:

Y=a+Xb+ε
dan anggap itu (a,b)R2 (begitu Θ=R2). Jelas bahwa apakahθ0=(a,b) atau θ0=a, itu akan selalu berlaku θ0 dapat diidentifikasi: Proses menghasilkan Y dari X mempunyai sebuah 1:1 hubungan dengan parameter a dan b. Pemasangan(a,b), tidak mungkin menemukan tuple kedua di R menggambarkan Proses Pembuatan Data yang sama.

Contoh 2 : Tentukan untukθ=(a,b,c); XN(μ,σ2In);εN(0,σe2In) model statistik yang lebih rumit M:

Y=a+X(bc)+ε
dan anggap itu (a,b)R2 dan cR{0} (begitu Θ=R3{(l,m,0)|(l,m)R2}). Sementara untukθ0, ini akan menjadi model statistik yang dapat diidentifikasi, ini tidak berlaku jika seseorang memasukkan parameter lain (yaitu, b atau c). Mengapa? Karena untuk setiap pasangan(b,c), ada banyak pasangan lain yang tak terhingga dalam set B:={(x,y)|(x/y)=(b/c),(x,y)R2}. Solusi yang jelas untuk masalah dalam hal ini adalah memperkenalkan parameter barud=b/cmengganti fraksi untuk mengidentifikasi model. Namun, orang mungkin tertarikb dan csebagai parameter yang terpisah untuk alasan teoretis - parameter dapat sesuai dengan parameter yang menarik dalam pengertian teori (ekonomi). (Misalnya,b bisa menjadi 'kecenderungan untuk mengkonsumsi' dan cbisa jadi 'kepercayaan diri', dan Anda mungkin ingin memperkirakan dua kuantitas ini dari model regresi Anda. Sayangnya, ini tidak mungkin dilakukan.)
Jeremias K
sumber
1
"Tidak ada vektor parameter yang berbeda θ1yang akan menghasilkan data yang sama "kedengarannya tidak tepat, kecuali jika Anda mengartikan sesuatu yang tidak biasa dengan" menghasilkan. "Mungkin itu perlu dijabarkan atau mungkin makna Anda tentang" model statistik "perlu dibuat eksplisit. Dalam kebanyakan model, termasuk Anda gunakan dalam ilustrasi Anda, set data apa pun bisa saja dihasilkan oleh salah satu parameter yang mungkin
whuber
1
@whuber itu adalah poin yang bagus. Apa yang seharusnya saya katakan adalah bahwa "Tidak ada ... yang akan menyebabkan proses menghasilkan data yang sama ". Saya mengubah ini sekarang :)
Jeremias K