OLS dalam hal sarana dan ukuran sampel

8

Diberikan model:

y=β0+β1f+u

Di mana adalah dummy jika betina dan sebaliknya, y adalah tinggi dalam cm. Ukuran sampel adalah secara total. Selanjutnya dan . Hitung estimasi parameter.f=10nfemale=nmale=100200y¯male=175y¯female=165

Usaha saya:

Menggunakan rumus well know:

β^=(XX)1Xy
Saya mendapatkan:
[200100100100]1[170200165200]

Pertama elemen dalam (XX)1 , karena X hanya sekelompok satu, ada 100 perempuan dalam sampel dan ada total 200 pria dan wanita. Untuk Xy , elemen pertama adalah "rata-rata besar" dari 170, dan yang kedua adalah sampel rata-rata tinggi untuk wanita. Keduanya diperkecil 200, karena saya tidak "menurunkan skala" (XX)1 .

Apa itu benar? Saya bertanya, karena solusi (ketika mengalikan) menghasilkan beberapa (sangat) angka ganjil.

Repmat
sumber

Jawaban:

7

Pendekatannya benar, tetapi ada sedikit kesalahan numerik: hanya ada wanita, bukan . Ketinggian rata-rata untuk pria dan wanita dapat dikonversi ke jumlah melalui100200

Sum of male heights=100×175

dan

Sum of female heights=100×165.

Karena itu jumlah dari semua ketinggian adalah

Sum of all heights=100×175+100×165=200×170,

seperti yang ditunjukkan dalam pertanyaan. Akibatnya persamaan Normal adalah

(200100100100)(β^0β^1)=(200170100165)

( bukan di sisi kanan), dengan solusi165200

(β^0,β^1)=(175,10).
whuber
sumber
Sungguh kesalahan konyol ...
Repmat
1
Saya tidak akan menyebutnya konyol. Itu hal yang wajar untuk dilakukan. Saya harus menatap pertanyaan itu selama beberapa menit sebelum masalah menjadi jelas ....
whuber
1

Saya cukup bingung. Apa mean? Apakah ini residu? Jika demikian, makau

XX =[200100100100]

sejak

X=yβ=[y1β1y2β1...ynfβ1ynf+1β1ynf+2β1...ynnf+nmβ1y1β2y2β2...ynfβ2ynf+1β2ynf+2β2...ynnf+nmβ2]T

=

[11...111...100...011...1]T

Beberapa pemikiran:

Dengan persamaan Anda IMHO harus 175 dan = -10. Jadi untuk bagian pria dan wanita Anda mendapatkan:β1β2

fm=175(+)-10×0+kamu=175+kamu

ff=175(+)-10×1+kamu=165+kamu

Karena Anda bisa menggunakannya

β=(XX)-1XTy

untuk memecahkan dengan menggunakan Moore-Penrose Pseudoinverse .β

((XX)-1XT)+β=((XX)-1XT)+[175-10]=y

Sekarang berisi:y

y[165f1165f2...165f100175m1175m2...175m100]T

Semoga ini bisa membantu!

nali
sumber
5
Sementara statistik biasanya menggunakan dengan nama Kesalahan untuk non-menjelaskan bagian dari model, ekonometri sering berbicara tentang Kesalahan, (sementara) Guncangan atau Gangguan. Itu hanya notasi biasa. ϵkamu
mugen
1
@nali, Bisakah Anda menambahkan sedikit ke ini? Mengingat nomor Anda, solusi sistem tidak masuk akal. Dan ya kamu adalah residu.
Repmat
@Repmat: Saya memperbarui beberapa pemikiran yang awalnya saya miliki. Semoga ini bisa membantu.
nali
@Repmat: Mungkin Anda salah mengerti saya. X '* y bukan [170 82,5] ^ T
nali