Kesalahan standar untuk koefisien regresi berganda?

18

Saya menyadari bahwa ini adalah pertanyaan yang sangat mendasar, tetapi saya tidak dapat menemukan jawaban di mana pun.

Saya menghitung koefisien regresi menggunakan persamaan normal atau dekomposisi QR. Bagaimana saya bisa menghitung kesalahan standar untuk setiap koefisien? Saya biasanya menganggap kesalahan standar dihitung sebagai:

SEx¯ =σx¯n

Apa itu untuk setiap koefisien? Apa cara paling efisien untuk menghitung ini dalam konteks OLS?σx¯

Belmont
sumber

Jawaban:

19

Ketika melakukan estimasi kuadrat terkecil (dengan asumsi komponen acak normal), estimasi parameter regresi biasanya didistribusikan dengan rata-rata sama dengan parameter regresi sebenarnya dan matriks kovarian mana adalah varian residual dan adalah matriks desain. adalah transpos dan didefinisikan oleh model persamaan dengan parameter regresi dan adalah istilah kesalahan. Perkiraan standar deviasi dari parameter beta didapat dengan mengambil istilah yang sesuai di s 2 X T X X T X X Y = X β + ϵ β ϵ ( X T X ) - 1Σ=s2(XTX)1s2XTXXTXXY=Xβ+ϵβϵ(XTX)1mengalikannya dengan estimasi sampel dari varian residual dan kemudian mengambil akar kuadrat. Ini bukan perhitungan yang sangat sederhana tetapi setiap paket perangkat lunak akan menghitungnya untuk Anda dan memberikannya dalam output.

Contoh

Pada halaman 134 Draper dan Smith (direferensikan dalam komentar saya), mereka memberikan data berikut untuk pas dengan kuadrat terkecil model mana .ε N ( 0 , I σ 2 )Y=β0+β1X+εεN(0,sayaσ2)

                      X                      Y                    XY
                      0                     -2                     0
                      2                      0                     0
                      2                      2                     4
                      5                      1                     5
                      5                      3                    15
                      9                      1                     9
                      9                      0                     0
                      9                      0                     0
                      9                      1                     9
                     10                     -1                   -10
                    ---                     --                   ---
Sum                  60                      5                    32
Sum of  Squares     482                     21                   528

Tampak seperti contoh di mana kemiringan harus mendekati 0.

Xt=(111111111102255999910).

Begitu

XtX=(nXiXiXi2)=(106060482)

dan

(XtX)1=(Xi2n(XiX¯)2X¯(XiX¯)2X¯(XiX¯)21(XiX¯)2)=(48210(122)612261221122)=(0.3950.0490.0490.008)

di mana .X¯=Xi/n=60/10=6

Perkirakan untuk = (b0) = (Yb-b1 Xb) b1 Sxy / Sxxβ=(XTX)1XTY

b1 = 1/61 = 0,0163 dan b0 = 0,5- 0,0163 (6) = 0,402

Dari atas Sb1 = Se (0,008) dan Sb0 = Se (0,395) di mana Se adalah estimasi standar deviasi untuk istilah kesalahan. Se = √2.3085.(XTX)1

Maaf bahwa persamaan tidak membawa subscript dan superscripting ketika saya memotong dan menempelkannya. Tabel tidak bereproduksi dengan baik karena ruang diabaikan. String pertama dari 3 angka sesuai dengan nilai pertama XY dan XY dan sama untuk string followinf dari tiga. Setelah Jumlah, jumlah untuk XY dan XY masing-masing dan kemudian jumlah kotak untuk XY dan XY masing-masing. Matriks 2x2 juga kacau. Nilai setelah tanda kurung harus dalam tanda kurung di bawah angka di sebelah kiri.

Michael R. Chernick
sumber
2
Tidak dimaksudkan sebagai plug untuk buku saya tetapi saya pergi melalui perhitungan solusi kuadrat terkecil dalam regresi linier sederhana (Y = aX + b) dan menghitung kesalahan standar untuk a dan b, pp.101-103, The Essentials of Biostatistics untuk Dokter, Perawat, dan Dokter, Wiley 2011. deskripsi yang lebih terperinci dapat ditemukan dalam Draper dan Smith Applied Regression Analysis Edisi 3, Wiley New York 1998 halaman 126-127. Dalam jawaban saya berikut ini saya akan mengambil contoh dari Draper dan Smith.
Michael R. Chernick
8
Ketika saya mulai berinteraksi dengan situs ini, Michael, saya memiliki perasaan yang serupa. Dengan pengalaman, mereka telah berubah. Bermanfaat mengetahui beberapa dan begitu Anda melakukannya, hampir (hampir) cepat untuk mengetik seperti halnya mengetikkan apa pun dalam bahasa Inggris. Saya juga belajar, dengan mempelajari posting teladan (seperti banyak balasan oleh @chl, kardinal, dan pengguna reputasi tinggi lainnya per posting), bahwa memberikan referensi, ilustrasi yang jelas , dan persamaan yang dipikirkan dengan baik biasanya sangat dihargai dan baik diterima. Kualitas tinggi adalah satu hal yang membedakan situs ini dari kebanyakan orang lain. TEX
whuber
2
Itu semua Bill yang bagus dan itu bagus karena begitu banyak orang berdedikasi untuk memberikan posting berkualitas tinggi itu. Saya dapat menggunakan Lateks untuk keperluan lain, seperti menerbitkan makalah. Tapi saya tidak punya waktu untuk melakukan semua upaya yang orang harapkan dari saya di situs ini. saya tidak akan menginvestasikan waktu hanya untuk menyediakan layanan di situs ini.
Michael R. Chernick
4
Saya pikir pemutusannya ada di sini: "Ini hanyalah satu dari banyak hal tentang situs ini yang mengharuskan mereka memposting waktu dan tenaga ekstra " - @whuber dan saya sama-sama mengatakan bahwa, pada kenyataannya, tidak membutuhkan waktu tambahan jika Anda tahu cara melakukannya. Kami tidak mempelajari sehingga kami dapat memposting di situs ini - kami (setidaknya saya) belajar karena ini merupakan keterampilan penting yang harus dimiliki sebagai ahli statistik dan membuat posting lebih mudah dibaca di situs ini. TEXTEX
Makro
3
Seperti banyak orang di sini, ya, saya bekerja sebagai ahli statistik, tetapi saya juga menemukan hal itu menyenangkan - situs ini adalah rekreasi bagi saya dan ini adalah bonus bagus yang bermanfaat bagi orang lain. Jika Anda menemukan menandai persamaan Anda dengan sebagai pekerjaan dan tidak berpikir itu layak dipelajari, maka jadilah itu, tetapi ketahuilah bahwa sebagian konten Anda akan diabaikan. TEX
Makro