Cara mendapatkan matriks varians-kovarians dari koefisien dalam regresi linier

36

Saya membaca buku tentang regresi linier dan mengalami kesulitan memahami matriks varians-kovarians dari :b

masukkan deskripsi gambar di sini

Item diagonal cukup mudah, tetapi item off-diagonal sedikit lebih sulit, yang membingungkan saya adalah

σ(b0,b1)=E(b0b1)-E(b0)E(b1)=E(b0b1)-β0β1

tetapi tidak ada jejak β0 dan β1 sini.

qed
sumber
3
Pertanyaan terkait: stats.stackexchange.com/questions/44838/…
ocram
2
Buku apa itu?
Konstantinos
Neter et al., Model Regresi Linier Terapan, 1983, halaman 216. Anda dapat menemukan bahan yang sama dalam Model Statistik Terapan Linier, Edisi 5, halaman 207.
akavalar

Jawaban:

53

Ini sebenarnya pertanyaan keren yang menantang pemahaman dasar Anda tentang regresi.

Pertama, keluarkan semua kebingungan awal tentang notasi. Kami melihat regresi:

y=b0+b1x+kamu^

di mana dan adalah penaksir dan , dan adalah residu dari regresi. Perhatikan bahwa regresi yang benar dan tidak dilindungi yang mendasarinya dengan demikian dilambangkan sebagai:b0b1β0β1ukamu^

y=β0+β1x+kamu

Dengan harapan dan varians . Beberapa buku menyatakan sebagai dan kami mengadaptasi konvensi ini di sini. Kami juga menggunakan notasi matriks, di mana b adalah vektor 2x1 yang menahan penaksir , yaitu . (Juga demi kejelasan, saya memperlakukan X sebagaimana ditetapkan dalam perhitungan berikut.)E[kamu]=0E[kamu2]=σ2bβ β = [ β 0 , ß 1 ]β^β=[β0,β1]b=[b0,b1]

Sekarang untuk pertanyaan Anda. Formula Anda untuk kovarians memang benar, yaitu:

σ(b0,b1)=E(b0b1)-E(b0)E(b1)=E(b0b1)-β0β1

Saya pikir Anda ingin tahu mengapa kami memiliki koefisien yang tidak teramati yang sebenarnya dalam rumus ini? Mereka benar-benar dibatalkan jika kita mengambil langkah lebih jauh dengan memperluas formula. Untuk melihat ini, perhatikan bahwa varians populasi estimator diberikan oleh:β0,β1

VSebuahr(β^)=σ2(XX)-1

Matriks ini menyimpan varian dalam elemen diagonal dan kovarian pada elemen off-diagonal.

Untuk sampai pada rumus di atas, mari generalisasi klaim Anda dengan menggunakan notasi matriks. Karena itu marilah kita menunjukkan varians dengan dan harapan dengan .VSebuahr[]E[]

VSebuahr[b]=E[b2]-E[b]E[b]

Pada dasarnya kami memiliki rumus varian umum, hanya menggunakan notasi matriks. Persamaan diselesaikan ketika mengganti dalam ekspresi standar untuk estimator . Juga asumsikan merupakan penaksir yang tidak bias. Oleh karena itu, kami memperoleh:b=(XX)-1XyE[b]=β

E[((XX)-1Xy)2]-β22×2

Perhatikan bahwa kita memiliki di sisi kanan - 2x2 matriks, yaitu , tetapi Anda mungkin sudah menebak apa yang akan terjadi dengan istilah ini segera.β2bb

Mengganti dengan ekspresi kami untuk proses pembuatan data mendasar yang sebenarnya di atas, kami memiliki:y

E[((XX)-1Xy)2]-β2=E[((XX)-1X(Xβ+kamu))2]-β2=E[((XX)-1XX=sayaβ+(XX)-1Xkamu)2]-β2=E[(β+(XX)-1Xkamu)2]-β2=β2+E[(XX)-1Xkamu)2]-β2

karena . Lebih lanjut, istilah kuadrat dibatalkan seperti yang diharapkan.E[kamu]=0β2

Jadi kita memiliki:

VSebuahr[b]=((XX)-1X)2E[kamu2]

Dengan linearitas harapan. Perhatikan bahwa dengan asumsi dan karena adalah matriks simetrik dan dengan demikian sama dengan transposnya. Akhirnya kami tiba diE[kamu2]=σ2((XX)1X)2=(XX)-1XX(XX)-1=(XX)-1XXK×K

VSebuahr[b]=σ2(XX)-1

Sekarang kita menyingkirkan semua istilah . Secara intuitif, varians estimator tidak tergantung pada nilai koefisien yang mendasari benar, karena ini bukan variabel acak per se. Hasilnya berlaku untuk semua elemen individu dalam matriks kovarians varians seperti yang ditunjukkan dalam buku sehingga juga berlaku untuk elemen diagonal off juga dengan untuk membatalkan masing-masing. Satu-satunya masalah adalah Anda telah menerapkan rumus umum untuk varian yang tidak mencerminkan pembatalan ini pada awalnya.ββ0β1

Pada akhirnya, varian koefisien berkurang menjadi dan independen dari . Tapi apa artinya ini? (Saya yakin Anda juga meminta pemahaman yang lebih umum tentang matriks kovarians umum)σ2(XX)-1β

Lihatlah formula dalam buku ini. Ini hanya menegaskan bahwa varians dari penaksir meningkat ketika istilah kesalahan mendasar yang sebenarnya lebih berisik ( meningkat), tetapi menurun ketika penyebaran X meningkat. Karena memiliki lebih banyak pengamatan yang tersebar di sekitar nilai sebenarnya, memungkinkan Anda secara umum membuat estimator yang lebih akurat dan dengan demikian lebih dekat dengan true . Di sisi lain, istilah kovarian pada off-diagonal menjadi relevan secara praktis dalam pengujian hipotesis hipotesis gabungan seperti . Selain itu, mereka sedikit fudge, sungguh. Semoga ini menjelaskan semua pertanyaan.σ2 β b 0 = b 1 = 0βb0=b1=0

Majte
sumber
dan ketika menjaga penyebaran konstan dan mengurangi x, kesalahan standar intersep menjadi lebih kecil, yang masuk akal.
Theta30
Saya tidak mengikuti perluasan alun-alun. Mengapa tidak disederhanakan menjadi ? ((XX)-1X)2=((XX)-1X)((XX)-1X)=X-2
David
2

Dalam kasus Anda, kami punya

XX=[nXsayaXsayaXsaya2]

Balikkan matriks ini dan Anda akan mendapatkan hasil yang diinginkan.

mpiktas
sumber
1

Tampaknya adalah nilai yang diprediksi (nilai yang diharapkan). Mereka beralih antara dan .β0β1E(b0)=β0E(b1)=β1

Drew75
sumber
β0 dan umumnya tidak diketahui, ke mana mereka dapat beralih? β1
qed
Saya rasa saya mengerti kebingungannya, dan saya pikir mereka mungkin seharusnya menulis daripada . Berikut ini pos lain yang melewati perhitungan: tautanβ0β0
Drew75
2
@qed: untuk sampel estimasi jumlah yang tidak diketahui.
Glen_b -Reinstate Monica