Kesalahan yang didistribusikan secara normal dan teorema limit pusat

9

Dalam Econometrics Pengantar Wooldridge ada kutipan:

Argumen yang membenarkan distribusi normal untuk kesalahan biasanya berjalan seperti ini: karena adalah jumlah dari banyak faktor yang tidak teramati yang mempengaruhi , kita dapat menggunakan teorema batas pusat untuk menyimpulkan bahwa memiliki perkiraan distribusi normal.uyu

Kutipan ini berkaitan dengan salah satu asumsi model linier, yaitu:

uN(μ,σ2)

di mana u adalah istilah kesalahan dalam model populasi.

Sekarang, sejauh yang saya tahu, Central Limit Theorem menyatakan bahwa distribusi

Zi=(Yi¯μ)/(σ/n)

(di mana Yi¯ adalah rata-rata sampel acak yang diambil dari populasi mana pun dengan mean μ dan varians σ2 )

mendekati variabel normal standar sebagai n .

Pertanyaan:

Bantu saya memahami bagaimana normalitas asimptotik Zi menyiratkan uN(μ,σ2)

angsa
sumber

Jawaban:

13

Ini mungkin lebih dihargai dengan mengungkapkan hasil CLT dalam hal jumlah variabel acak iid. Kita punya

nX¯μσN(0,1)asymptotically

Lipat gandakan hasil bagi dengan dan gunakan fakta bahwa untuk mendapatkanσnVar(cX)=c2Var(X)

X¯μN(0,σ2n)

Sekarang tambahkan ke LHS dan gunakan fakta bahwa untuk mendapatkanμE[aX+μ]=aE[X]+μ

X¯=1ni=1nXiN(μ,σ2n)

Terakhir, kalikan dengan dan gunakan dua hasil di atas untuk melihat itun

i=1nXiN(nμ,nσ2)

Dan apa hubungannya ini dengan pernyataan Wooldridge? Nah, jika kesalahan adalah jumlah dari banyak variabel acak iid maka itu akan terdistribusi secara normal, seperti yang baru saja terlihat. Tetapi ada masalah di sini, yaitu bahwa faktor-faktor yang tidak teramati tidak akan terdistribusi secara identik dan mereka bahkan mungkin tidak independen!

Namun demikian, CLT telah berhasil diperluas ke variabel acak independen yang tidak terdistribusi dan bahkan kasus ketergantungan ringan, dalam beberapa kondisi keteraturan tambahan. Ini pada dasarnya adalah kondisi yang menjamin bahwa tidak ada istilah dalam jumlah memberikan pengaruh yang tidak proporsional pada distribusi asimptotik, lihat juga halaman wikipedia di CLT . Anda tentu tidak perlu tahu hasil ini; Tujuan Wooldridge hanyalah untuk memberikan intuisi.

Semoga ini membantu.

JohnK
sumber
Saya akan menambahkan (karena penulis mempelajari ekonometrik) bahwa dalam bidang studinya banyak variabel acak (setidaknya yang digunakan untuk pemodelan) tidak menentukan momen pertama, seperti distribusi Cauchy. Jadi CLT bukan yang bisa Anda andalkan di bidang ini.
Demidov Jerman