Saya merujuk pada posting ini yang tampaknya mempertanyakan pentingnya distribusi normal residu, dengan alasan bahwa ini bersama dengan heteroskedastisitas berpotensi dapat dihindari dengan menggunakan kesalahan standar yang kuat.
Saya telah mempertimbangkan berbagai transformasi - root, log dll - dan semuanya terbukti tidak berguna dalam menyelesaikan masalah sepenuhnya.
Ini adalah plot QQ dari residu saya:
Data
- Variabel dependen: sudah dengan transformasi logaritmik (memperbaiki masalah outlier dan masalah dengan kemiringan dalam data ini)
- Variabel independen: usia perusahaan, dan sejumlah variabel biner (indikator) (Kemudian saya memiliki beberapa hitungan, untuk regresi terpisah sebagai variabel independen)
The iqr
perintah (Hamilton) di Stata tidak menentukan setiap outlier parah yang mengesampingkan normalitas, tetapi grafik di bawah ini menunjukkan sebaliknya dan begitu juga dengan uji Shapiro-Wilk.
normal-distribution
stata
least-squares
residuals
assumptions
Cesare Camestre
sumber
sumber
qenv
paket.Jawaban:
Salah satu cara Anda dapat menambahkan "rasa seperti tes" ke grafik Anda adalah dengan menambahkan batas kepercayaan di sekitar mereka. Di Stata saya akan melakukan ini seperti ini:
sumber
qenv
(olehssc install qenv
) pertama.sd()
. Adalah normal (tidak adaqenv
permainan kata-kata yang dimaksudkan) bahwa denganoverall
opsi ini membutuhkan waktu sangat lama.qenvnormal
tidak menjelaskan bahwa Anda perlu menginstalqplot
. Anda diharapkan membaca bantuan. Lebih penting lagi, saya kira Anda menggunakan versi yang sangat lamaqplot
. Instal dari paket gr42_6 dari stata-journal.com/software/sj12-1Satu hal yang perlu diingat ketika memeriksa plot qq ini adalah bahwa ekor akan cenderung menyimpang dari garis bahkan jika distribusi yang mendasarinya benar-benar normal dan tidak peduli seberapa besar N. Ini tersirat dalam jawaban Maarten . Ini karena ketika N semakin besar dan semakin besar ekornya akan semakin jauh dan semakin jauh dan semakin jarang. Karena itu akan selalu ada sangat sedikit data di bagian ekor dan mereka akan selalu jauh lebih bervariasi. Jika sebagian besar garis Anda berada di tempat yang diharapkan dan hanya ekor yang menyimpang maka Anda biasanya dapat mengabaikannya.
Salah satu cara yang saya gunakan untuk membantu siswa mempelajari cara menilai plot qq mereka untuk normalitas adalah menghasilkan sampel acak dari distribusi yang diketahui normal dan memeriksa sampel tersebut. Ada latihan di mana mereka menghasilkan sampel dengan berbagai ukuran untuk melihat apa yang terjadi ketika N berubah dan juga yang mengambil sampel distribusi nyata dan membandingkannya dengan sampel acak dengan ukuran yang sama. The TeachingDemos paket R memiliki uji normalitas yang menggunakan jenis yang sama teknik.
sumber
qenv
Anda akan melihat bahwa teknik simulasi ini adalah inti dari bagaimana band-band kepercayaan diri dihitung.