Bagaimana matriks kesalahan var / cov dihitung dengan paket analisis statistik dalam praktik?
Ide ini jelas bagi saya dalam teori. Tetapi tidak dalam praktik. Maksud saya, jika saya memiliki vektor variabel acak , saya mengerti bahwa matriks varians / kovarian akan diberikan produk eksternal dari deviance-from-the -satu vektor: .Σ = E [ ( X - E ( X ) ) ( X - E ( X ) ) ⊤ ]
Tetapi ketika saya memiliki sampel, kesalahan pengamatan saya bukan variabel acak. Atau lebih baik, tetapi hanya jika saya mengambil sejumlah sampel identik dari populasi yang sama. Kalau tidak, mereka diberikan. Jadi, sekali lagi pertanyaan saya adalah: bagaimana sebuah paket statistik dapat menghasilkan matriks var / cov mulai dari daftar pengamatan (yaitu sampel) yang disediakan oleh peneliti?
sumber
Jawaban:
Matriks kovarians untuk model tipe biasanya dihitung sebagai ( X t X ) - 1 σ 2y= Xβ+ ϵ manaσ2adalah jumlah sisa kotak,σ2=Σi(yi-Xi β )2dandadalah derajat kebebasan (biasanya jumlah pengamatan dikurangi jumlah parameter).
Untuk kesalahan standar yang kuat dan atau berkelompok, produk sedikit dimodifikasi. Mungkin juga ada cara lain untuk menghitung matriks kovarians, misalnya seperti yang disarankan oleh ekspektasi produk luar.XtX
sumber
Ini termasuk dalam Regresi Praktis dan Anova menggunakan R oleh Julian J. Faraway, halaman 21 .
Contoh perhitungan di R, berdasarkan model linear mil per galon kemunduran pada beberapa spesifikasi model mobil termasuk dalam
mtcars
basis data:ols = lm(mpg ~ disp + drat + wt, mtcars)
. Ini adalah perhitungan manual dan output darilm()
fungsi:diperkirakan seperti pada halaman 8 dokumen online ini sebagai
sumber
sumber