Katakanlah kami tertarik pada bagaimana nilai ujian siswa dipengaruhi oleh jumlah jam belajar siswa tersebut. Untuk mengeksplorasi hubungan ini, kita dapat menjalankan regresi linier berikut:
Tetapi jika kita mengambil sampel murid dari beberapa sekolah yang berbeda, kita mungkin berharap murid di sekolah yang sama lebih mirip satu sama lain daripada murid dari sekolah yang berbeda. Untuk mengatasi masalah ketergantungan ini, saran dalam banyak buku pelajaran / di web, adalah menjalankan efek campuran dan masuk sekolah sebagai efek acak. Jadi modelnya akan menjadi: Tapi mengapa ini menyelesaikan masalah ketergantungan yang ada dalam regresi linier?
Harap tanggapi seolah Anda berbicara dengan anak berusia 12 tahun
Jawaban:
Termasuk istilah acak dalam model adalah cara untuk menginduksi beberapa struktur kovarians antara nilai. Faktor acak untuk sekolah menginduksi kovarian tidak nol antara siswa yang berbeda dari sekolah yang sama, sedangkan itu adalah ketika sekolah berbeda.0
Mari kita tulis model Anda sebagai mana s mengindeks sekolah dan saya mengindeks siswa (di setiap sekolah). Istilah sekolah s adalah variabel-variabel acak independen ditarik dalam N ( 0 , τ ) . The e s , i adalah variabel independen acak ditarik dalam N ( 0 , σ
Vektor ini memiliki nilai yang diharapkan yang ditentukan oleh jumlah jam kerja.
Kovarians antara dan Y s ′ , i ′ adalah 0 ketika s ≠ s ′ , yang berarti bahwa keberangkatan nilai dari nilai yang diharapkan adalah independen ketika siswa tidak berada di sekolah yang sama.Ys,i Ys′,i′ 0 s≠s′
Kovarians antara dan Y s , i ′ adalah τ ketika i ≠ i ′ , dan varian Y s , i adalah τ + σ 2 : nilai siswa dari sekolah yang sama akan memiliki korelasi keberangkatan dari nilai yang mereka harapkan .Ys,i Ys,i′ τ i≠i′ Ys,i τ+σ2
Contoh dan data simulasi
Berikut ini adalah simulasi R pendek untuk lima puluh siswa dari lima sekolah (di sini saya ambil ); nama-nama variabel tersebut mendokumentasikan diri:σ2=τ=1
Matriks varians untuk contoh ini
sumber